Не так давно я писал про американскую программу «Palantir»
Она решает комплексные задачи по объединению различных полицейских баз данных, их анализу и прогностике появления тех или иных криминальных событий в конкретных районах и у конкретных людей.
И вот 5 дней назад Медуза порадовала великолепным обзором подобных программ в РФ. А у нас все не менее круто. Разработками таких систем у нас занимается целый Научный центр при АП РФ.
Это системы:
- «ПСКОВ» - Поисковая система категории особой важности, способная извлекать даже данные из анонимной сети Tor,
- «Шерлок», система способная деанонимизировать практически любого человека всего по нескольким параметрам его персональных данных,
- Посейдон – система мониторинга протестной активности,
- Медиамонитор, анализирующий социальные сети по весьма специфическим запросам.
Кому интересна эта тема, рекомендую почитать источник в Медузе, это займет у вас минут 30. Демонстрацию системы «Шерлок» я лично видел на одной приватной встрече руководителей служб безопасности нескольких крупнейших компаний РФ зимой прошлого года. И она меня сильно впечатлила: поэтому то, что написала Медуза – правда.
Интересно, что вместе с вот этими инициативами все складывается в весьма масштабную систему:
1) Осенью этого года Московское правительство в проведет конкурс на подключение 105 тыс. камер наблюдения к системе распознавания лиц. Если проект будет реализован, в городе появится одна из крупнейших в мире система слежения. По данным издания, в конкурсе могут принять участие три компании — «Центр речевых технологий» и VisionLabs, доли в которых принадлежат Сбербанку, и NTechLab, совладельцем которой является Ростех. Подробнее здесь.
2) Никаких обезличенных данных на самом деле не существует и определить и найти человека даже по малой части его данных – довольно простая штука.
Вот, к примеру, в опубликованной журналом Nature Communications статье утверждается, что знания персональных данных совсем не обязательно, чтобы понять, о ком именно в базе данных идет речь. Собрав всего три показателя, например, почтовый индекс, дату рождения и пол, можно сузить поиск до очень небольшого круга лиц. А при наличии 15 показателей, собранных из баз данных с социально-демографическими характеристиками людей, опросов и медицинских баз, можно точно определить конкретного человека.
Хотя это и так очевидно всем, кто работает в интернете 😀
Тем временем у нас никаких ученых, исследователей или общественных активистов на высокие заседания, где вершится судьба данных на десятилетия вперед, никто не зовет. Тихо, спокойно и без лишнего внимания Ассоциация больших данных, в которую входят Сбербанк, Газпромбанк, «Яндекс», Mail.Ru Group, «Ростелеком», «Мегафон», сама решает, как им с ними поступить. А именно: разрешить использовать данные без согласия в целях, которые им покажутся важными. Дескать, получить согласие десятков миллионов клиентов, абонентов и пользователей интернет-ресурсов просто невозможно. Да и использоваться будут не персональные, а «обезличенные данные».
3) Настойчивые предложения депутатов ввести идентификацию e-mail всех пользователей. Это уже, конечно, зашквар. Идея, - чтобы государство гарантированно знало, что данным почтовый ящик принадлежит именно вам и имело к нему щелочку для подсматривания и чтения вашей переписки. 4) Налоговиками создается база со всеми данными граждан — от ФИО до родственных связей. Одна из целей — улучшить собираемость налогов. В общем, в этой теме мы если не впереди планеты всей, то уж точно не отстаем. Вот только нужно определиться: это хорошо или плохо. Или, точнее для кого это хорошо, а для кого - плохо.