Новости

Не так давно я писал про американскую программу «Palantir»

Она решает комплексные задачи по объединению различных полицейских баз данных, их анализу и прогностике появления тех или иных криминальных событий в конкретных районах и у конкретных людей.


И вот 5 дней назад Медуза порадовала великолепным обзором подобных программ в РФ. А у нас все не менее круто. Разработками таких систем у нас занимается целый Научный центр при АП РФ.

Это системы:


- «ПСКОВ» - Поисковая система категории особой важности, способная извлекать даже данные из анонимной сети Tor, 
- «Шерлок», система способная деанонимизировать практически любого человека всего по нескольким параметрам его персональных данных, 
- Посейдон – система мониторинга протестной активности, 
- Медиамонитор, анализирующий социальные сети по весьма специфическим запросам.

Кому интересна эта тема, рекомендую почитать источник в Медузе, это займет у вас минут 30. Демонстрацию системы «Шерлок» я лично видел на одной приватной встрече руководителей служб безопасности нескольких крупнейших компаний РФ зимой прошлого года. И она меня сильно впечатлила: поэтому то, что написала Медуза – правда.

Интересно, что вместе с вот этими инициативами все складывается в весьма масштабную систему:


1) Осенью этого года Московское правительство в проведет конкурс на подключение 105 тыс. камер наблюдения к системе распознавания лиц. Если проект будет реализован, в городе появится одна из крупнейших в мире система слежения. По данным издания, в конкурсе могут принять участие три компании — «Центр речевых технологий» и VisionLabs, доли в которых принадлежат Сбербанку, и NTechLab, совладельцем которой является Ростех. Подробнее здесь.

2) Никаких обезличенных данных на самом деле не существует и определить и найти человека даже по малой части его данных – довольно простая штука
Вот, к примеру, в опубликованной журналом Nature Communications статье утверждается, что знания персональных данных совсем не обязательно, чтобы понять, о ком именно в базе данных идет речь. Собрав всего три показателя, например, почтовый индекс, дату рождения и пол, можно сузить поиск до очень небольшого круга лиц. А при наличии 15 показателей, собранных из баз данных с социально-демографическими характеристиками людей, опросов и медицинских баз, можно точно определить конкретного человека.

Хотя это и так очевидно всем, кто работает в интернете 😀 
Тем временем у нас никаких ученых, исследователей или общественных активистов на высокие заседания, где вершится судьба данных на десятилетия вперед, никто не зовет. Тихо, спокойно и без лишнего внимания Ассоциация больших данных, в которую входят Сбербанк, Газпромбанк, «Яндекс», Mail.Ru Group, «Ростелеком», «Мегафон», сама решает, как им с ними поступить. А именно: разрешить использовать данные без согласия в целях, которые им покажутся важными. Дескать, получить согласие десятков миллионов клиентов, абонентов и пользователей интернет-ресурсов просто невозможно. Да и использоваться будут не персональные, а «обезличенные данные».

3) Настойчивые предложения депутатов ввести идентификацию e-mail всех пользователей. Это уже, конечно, зашквар. Идея, - чтобы государство гарантированно знало, что данным почтовый ящик принадлежит именно вам и имело к нему щелочку для подсматривания и чтения вашей переписки. 4) Налоговиками создается база со всеми данными граждан — от ФИО до родственных связей. Одна из целей — улучшить собираемость налогов. В общем, в этой теме мы если не впереди планеты всей, то уж точно не отстаем. Вот только нужно определиться: это хорошо или плохо. Или, точнее для кого это хорошо, а для кого - плохо.

Статьи в: Ведомости   Forbes  РБК  Psychologies
2019-08-13 17:47