Как победе Трампа помогли социальные сети, а точнее — личная информация множества пользователей, которую все мы оставляем в сети, и даже передаем сторонним компаниям. Так называемая Big data. Швейцарское издание Das Magazin опубликовало статью о компании Cambridge Analytica — она якобы могла с помощью точного маркетингового таргетирования повлиять на выбор американцев.
Расследование журнала и спорные выводы этой статьи разбирает директор автономной некоммерческой организации "Информационная культура" Иван Бегтин.
— Давайте для начала разберемся с этой публикацией швейцарского журнала и историей с американскими выборами. Могли ли какие-то люди с помощью тонких настроек фейсбука, я не знаю, или чего-то еще повлиять на выборы американцев, как вы считаете?
— Я думаю, что не в большей степени, чем крупные коммерческие компании, международные холдинги манипулируют мнением потенциальных своих клиентов для продажи им товаров. Я думаю, что здесь не в большей степени, а, может быть, даже в меньшей степени, поскольку, если я правильно понимаю структуру выборов в Соединенных Штатах, то за Трампа голосовало огромное количество людей, которые в принципе интернетом не пользуются. И ему удалась мобилизация именно…
— Они просто были отключены от этих самых технологий, да?
— Совершенно верно.
— Но давайте тогда поймем, что это такая за мифическая Big data, о которой в последние несколько месяцев стали говорить очень много. Вот предположим, если я хочу купить ботинки, это означает, что социальные сети будут мне предлагать ботинки разных фирм или выберут именно те, которые я наверняка куплю? Что сейчас может Big data и ее анализ?
— Давайте сначала разберемся с терминами, что Big data не имеет никакого отношения непосредственно к данным граждан. Данные граждан – это одна из форм большого объема данных.
— Вот это, собственно, называется Big data – большой объем данных?
— Нет, big data называется данные гигантского объема, просто который вы не можете посчитать у себя локально на компьютере. Это могут быть самые разные данные – от непосредственно расчета скорости и разных других параметров элементарных частиц в ускорителях до данных генома и, наконец, до данных социальных сетей. И не стоит, конечно, предполагать, что данных социальных сетей больше, чем от данных от исследований космоса или от сложных различных физических экспериментов. Скорее, Big data в том термине как используется – это Big social data, это данные социальных сетей.
Главное изменение за последние месяцы, может быть, за последние несколько лет – в том, что этих данных стало некоторая критическая масса, и на основе них можно делать некоторое довольно точное прогнозирование поведения людей в зависимости от некоторых внешних стимулов.
— Это такая социальная инженерия, да? Что мы оставляем вообще о себе в интернете, какие знания? Давайте для начала уточним хотя бы некоторые из них. Пульс, я не знаю, температуру тела, что?
— Ну вообще, если говорить начистоту, то, конечно, вы оставляете о себе все цифровые следы, которые только возможно. Даже то, как часто вы пользуетесь мобильным телефоном, то, каким образом вы к нему прикасаетесь, история вашего браузера, видео, которые вы просматриваете, лайки, которые вы ставите в социальных сетях – это все является…
— Вы понимаете, это выглядит фантастикой, вот взять и проанализировать это, чтобы сделать выводы о большом количестве людей или о каждом конкретном человеке. Это возможно или невозможно?
— Безусловно, это возможно. Послушайте, предположим, у нас человечество – несколько миллиардов людей всего лишь. Если мы говорим про человечество, подключенное к интернету, и при этом еще человечество, та часть, которая относится к определенным пулам, это гораздо меньшее количество людей, дай Бог, один млрд. Ну это максимум, который может интересовать и бизнес, и государство. Очень наивно предполагать, что это невозможно посчитать.
Вопрос лишь в том, насколько это необходимо делать применительно к каждому человеку, потому что вся паранойя, которая у нас сейчас есть из-за выборов в Соединенных Штатах, ну слушайте, Господь с вами…
— Паранойя заключается в том, что кто-то может посчитать с точностью до одного человека его возможный выбор, предложить ему, как пишет это швейцарское издание, именно такое рекламное сообщение, которое заставит его прийти и проголосовать помимо его воли в избирательной урне за того, за кого хочет этот манипулятор загадочный.
— Я думаю, что эта статья, которая была написана, собственно, в этом издании, она довольно-таки наивна и требует очень детального фактчекинга. Я видел, была статья на "Медузе", которая опровергала многие пункты статьи, которая была в этом швейцарском издании. Больше того, я считаю, что, конечно, полагаться только на утверждение непосредственно представителей компании, которая этим занималась, Cambridge Analytica, было бы очень-очень сильно преждевременно. Пока это больше похоже на их рекламу.
— Да, но на самом деле, я думаю, многие маркетологи крупных компаний мечтали бы о том, чтобы это оказалось реальностью, а другие, естественно, кричат о том, что Оруэлл явно существует уже прямо сейчас. И, собственно, например, Евгений Черешнев, человек, который работает в компании Касперского, публиковал даже целый большой пост, ставший очень популярным. Суть его сообщения, месседжа в том, что эти данные, которые оставляет человек в сети, они настолько уникальны, что их можно сравнивать с ДНК человека, и они должны принадлежать этому человеку. Вы считаете, что это справедливое утверждение?
— Я считаю, что ДНК человека, конечно, не принадлежит самому человеку только само по себе, начнем с этого, само физическое ДНК. Я приведу пример, что сейчас очень много юридических разбирательств находится. Предположим, есть ДНК вас, а у вас есть брат-близнец – кому принадлежит ваш ДНК, вам или ему? Если, предположим, вы расшифровываете свой ДНК, ваша сестра, ваш брат расшифровывает свой ДНК, и, тем самым, можно реконструировать ДНК ваших родителей, кому принадлежит ДНК ваших родителей? Применительно к ДНК я бы, конечно, очень сильно поспорил.
— То есть нет, не так же это происходит?
— Смотрите, все гораздо проще и сложнее. То есть, как и у многих других технологий, технология анализа данных и применительно их к поведению конкретного человека, безусловно, они уже давно применяются, я бы даже сказал, не один десяток лет. Применяются, в основном, теми компаниями, которые считаются лидерами интернета, и теми, кто зарабатывают активно, в основном, на интернет-рекламе.
— Спокойно ими пользуются. Надо ли их ограничивать? На ваш взгляд, надо ли этим компаниям запретить пользоваться этой информацией и как их ограничить?
— Я считаю, что, безусловно, ограничения необходимы. Должны ли эти ограничения быть национальными либо они должны быть, может быть, мировыми, на уровне международных организаций – вот в чем вопрос. Я считаю, что национальные ограничения неэффективны, потому что все эти компании существуют в глобальном рынке и гораздо больше влияют на нашу с вами жизнь, чем любое национальное государство.
— Спасибо за ваше мнение. Иван Бегтин, директор автономной некоммерческой организации "Информационная культура" в студии "Настоящего времени" в Москве.