Политика

Фото: википедия

Big Data и зеркало Интернета

Фото: википедия

Фото: википедия

У еврейского поэта  Самуила Залмановича Галкина есть маленький стишок «Стекло», который очень любил цитировать во время выступлений Соломон Михоэлс: «Вот перед тобою стекло, — оно прозрачно и светло, ты видишь сквозь него весь мир, всех людей — кто радуется, кто плачет. Но стоит тебе взять на грош серебра и посеребрить одну сторону стекла, — стекло превращается в зеркало, весь мир из этого стекла исчезает, и как бы ни было прозрачно это зеркало и светло, в нем отныне ты видишь только самого себя».

Это прозаический перевод самого Михоэлса. А вот перевод поэтический:

СТЕКЛО
Прозрачное стекло блестит в руке твоей,
Ты видишь сквозь него и землю, и людей,
Весь мир перед тобою отчетливо открыт —
Кто радостен, кто зол, кто весел, кто скорбит.
Но если из стекла любую из сторон
Покроешь хоть слегка грошовым серебром, —
Вмиг исчезает с глаз всё то, что в мир влекло,
И зеркалом простым становится стекло.
Пусть чисто зеркало, пусть гладь его ясна
И нет на нем нигде малейшего пятна,
Но, радуясь и злясь, ликуя и скорбя,
Ты сможешь видеть в нем лишь самого себя.
(перевод А.Безыменского)

 

Фото: pixebay

Фото: pixebay

Вот, нечто подобное тому, что описано в этом стихотворении — произошло с интернетом. И с поисковиками. И с социальными сетями.

Его посеребрили. И вместо открытой сети он превратился в закрытую.

Зеркальный круг

В прошлой статье «Передо мной явился Я», мы говорили о том, как мы все получаем разную информацию, поскольку поисковики, социальные сети, новостные ленты на полях почтовых ящиков, сервисы видеороликов — короче, все представляют вам разный контент, который фильтруется ими на основе ваших прошлых предпочтений. Они дают вам материалы в подкрепление точки зрения, которой вы и так придерживаетесь. Изначально перечеркивается взаимодействие различных точек зрения и закрепляются утвердившиеся суждения. В результате, появляются эхо-камеры, в которых, вместо взаимодействия и обмена мнениями единомышленники усиливают общие убеждения и заблуждения, создавая все более поляризованные «бункеры». То есть парадоксально получается, что в Интернете возможность получения новой и неожиданной для вас информации и аргументации не увеличивается, а уменьшается.

Это одно из последствий персонализации данных пользователя и технологии использования больших данных. Чем чаще мы лайкаем, шерим, кликаем — тем больше это нам показывают. Человек заходит уже в закрытую сеть. Он видит только своё отражение. Только себя. Когда нам прожужжали все уши с персонализацией, то не сказали ни слова об этой опасности. Нам не говорили, что настоящая опасность всезнания этих крупных компаний заключается в том, что они запирают нас наедине с нами собой и нашими убеждениями, с узким кругом единомышленников, а, значит, и с нашими предрассудками.
Но запирание в зеркальном круге имеет ещё один, может быть главный негативный момент. Все мы становимся более уязвимыми для различного рода манипуляций.

Что такое Big Data?

Термин «большие данные» (Big Data) был предложен по аналогии с расхожими в деловой англоязычной среде метафорами «большая нефть», «большая руда». Большие данные начали собирать ещё до того как появился Интернет. Начали это делать большие сети магазинов, которые вручали покупателям членские карточки (они же «карточки лояльности», карточки почетных покупателей», «бонусные карты»), которые давали право на бонусы и скидки. Понятно, что делали это магазины вовсе не только для того, чтобы побаловать вас скидками. С одной стороны, магазины приручали таким образом покупателей, приделывали к ним якорь. Не менее важным было и то, что магазин отслеживал поведение покупателя. Магазин хотел знать, что покупает покупатель с карточкой, чтобы предлагать ему то, что может его заинтересовать. Если ты покупаешь этот и этот товар, то тебе можно предложить и товар икс, который, судя по статистике, покупают вместе с ними. А если ты перешел с определенного набора покупок на другой, то значит твоя ситуация, исходя из статистики, изменилась, и тебе можно порекомендовать и другие смежные товары, которые тебе, судя по всему, подойдут. Карточки были похожи на интернетные «куки», хотя появились ещё до воцарения Интернета.

Фото: Derzsi Eleres Andor, википедия

Фото: Derzsi Eleres Andor, википедия

Развитие компьютеров, возможности анализа больших данных и обработки их при помощи машинного обучения (математической статистики, численных методов оптимизации, теории вероятностей, дискретного анализа, психографии, социометрии и извлечения знаний из данных) только усилило интерес к Big Data в том числе в тех же торговых сетях.

Лет пять назад произошел интересный скандальчик. Target — американская компания, управляющая сетью магазинов розничной торговли, работающих под марками Target и SuperTarget, стала использовать машинное обучение при взаимодействии с покупателями. Привлекли множество математиков. Запустив машинное обучение, они создали алгоритмы, которые сами решают, что предложить покупателю.

Анализировались данные, накопленные компанией, на основе их делались выводы и прогнозы: если мужчина перешел с этого бритвенного станка на этот (более дорогой), то, скорее всего он купит и этот парфюм (поскольку обычно это взаимосвязано). Может быть, у мужчины увеличились доходы, может, его повысили в должности, может, ему сделали замечание о внешнем виде, может, он влюбился и хочет кому-то понравиться — для компьютера это не важно. Машине известна только совокупность прецедентов — приводящая к пониманию алгоритмов предпочтений. На основе анализа больших данных известно, что переход с этого бритвенного станка на этот — может быть поводом предложить ему и этот парфюм.

Весной 2012 года разразился скандал, когда отец школьницы пожаловался, что его дочери присылают буклеты с предложениями для беременных. Добропорядочная семья, консервативные ценности, духовные скрепы… Да за кого вы нас принимаете?!  Как вы вообще такое могли подумать? Я только что вытащил из почтового ящика эти буклеты для беременных. Да вы просто хамите?! Вы издеваетесь? Отец написал письма в СМИ, пожаловался в организации защиты ребенка, пришел ругаться в магазин сети в сопровождении видеокамер, журналистов, представителей возмущенной общественности.

Когда сеть Target уже надавала по ушам разработчикам машинного обучения, запустила антикризисную программу, приготовилась извиняться, задабривать обиженных покупателей многочисленными подарками, явилась к ним в дом с представительной делегацией и выписанным чеком… выяснилось, что девочка действительно была беременна. «Я не знал», — смущенно сказало отец. Потом потупился и добавил: «Она сама этого не знала». Алгоритм отловил изменения в поведении покупательницы, характерные для беременных женщин, на основе смены марки лосьона, частоты поведения некоторых гигиенических товаров и пр.

Это была классическая история, которую любит рассказать на своих лекциях Андрей Себрант.

Big Data и манипуляция

В принципе, Big Data — возможность знать о вас больше, чем вы сами о себе знаете — это вещь, которая может быть прекрасно применима на благо человеку. Сайт знакомств, например, которому вы предоставите возможность сделать анализ своей френдленты, того, что вам нравится (анализ 70 лайков позволяет знать вас лучше, чем ваши реальные знакомые, 300 — чем ваши спутники жизни, 500 — знать о вас то, в чем вы и сами боитесь себе признаться), ваших поисковых запросов, сайтов на которые вы заходите, роликов, которые вы смотрите, ваших покупок, вашего мобильного телефона (который знает о вас кучу вещей: машете ли вы руками, где бываете, насколько задерживаетесь)… Такой сайт сможет, проанализировав десятки тысяч признаков, выбрать вам оптимальную пару, на основе анализа больших данных.

Фото: Давид Эйдельман

Фото: Давид Эйдельман

Семейный доктор, компьютер которого будет давать выводы на основе анализа больших данных, сможет лучше понять ваши возможные риски.

Какая-нибудь интернет-платформа может предложить наиболее подходящую по вашему характеру и способностям работу или посоветовать фильм, который вам наверняка понравится. Что в этом плохого?!

Опять-таки покупки… Вам приходят гораздо более релевантные рекламы. Фирма не тратит деньги, на показ ненужной рекламы, вас не беспокоят попусту. Но…

Проблема в том, что, благодаря Big Data, продают не только вам, но и вас. Например, продают политикам. О Big Data сейчас много говорят и спорят в связи с использованием технологий Больших данных и персонально таргетированной рекламы в интернете в предвыборной кампании Трампа. Британская компания Cambridge Analytica помогла Дональду Трампу, до этого работала  со сторонниками Brexit в Британии, а теперь заключила контракт с французским «Национальным фронтом».

Говорят, что неожиданные исходы голосований в разных странах – не провал социологии, а победа социологии нового типа. Во время праймериз в республиканской партии новая технология позволила повысить эффективность кампании соперника Трампа по республиканской номинации Тэда Круза, к началу гонки практически никому не известного кандидата. Поэтому на нее и обратил внимание Трамп.

Людям разного склада характера по-разному преподносили разные суждения кандидата. Например, когда речь шла о свободном распространении оружия, боязливым людям с высоким уровнем невротизма оружие представляли как источник безопасности, а богатым консерваторам-экстравертам показывали картинку утиной охоты.

Жителям квартала Маленький Гаити в Майями показывали информацию об отказе Хиллари Клинтон участвовать в ликвидации последствий землетрясения на Гаити, афроамериканцам – видео, где Клинтон сравнивает темнокожих мужчин с хищниками.

Швейцарское издание Das Magasin, недавно опубликовало расследование о деятельности Cambridge Analytica (на русском языке его можно прочитать здесь). Большинство последних статей, которые посвящены интернет-стратегиям Трампа, так или иначе отталкиваются от этого материала. Советую прочитать.

Но и политики — это не самое страшное…

«Важность истории Cambridge Analytica, о которой написало издание Das Magasin, на самом деле не в том, что компания помогла Трампу в предвыборной гонке. Это коммерческая фирма, у них есть технология, они хотят зарабатывать деньги, здесь все ясно. Важно то, что если раньше вы хотели составить чей-то психологический профиль, вы должны были попросить человека заполнить опросник, пройти тест – и испытуемый хорошо понимал, что вот сейчас, в этот самый момент, кто-то измеряет его психологические характеристики. А теперь можно делать то же самое, но человек не узнает, что его самые интимные особенности прямо сейчас кто-то оценивает и измеряет» — говорит один из героев публикации Das Magasin – Михал Косински, разработавший с коллегами по Кембриджу систему, которая на основе активности пользователя в социальной сети составляет подробный психологический профиль человека.

Фото: pixebay

Фото: pixebay

Анализ больших данных — позволит фирмам проводить дискриминацию, за которую их даже нельзя будет обвинить. Обходить трудовое законодательство своевольно и незаметно. Тысячи факторов, которые принимает во внимание обученный алгоритм, могут просто не приходить нам в голову. Руководство фирмы, применяя машинное обучение для принятия решений об увольнениях, само может не знать (или не хотеть знать), на основе каких принципов людей лишают работы.
Трудовое законодательство запрещает уволить сотрудницу из-за беременности. Оплата декретных отпусков стоит корпорациям очень дорого. Но вот машина вполне может высчитать, что такая сотрудница с вероятностью более 50% может забеременеть в ближайшие полгода и предложить её уволить до этого. Сбор и анализ информации позволяет компаниям узнавать о людях такие вещи, о которых те, возможно, и сами не догадываются. Ведь сегодня можно купить любые данные: от количества лайков под сентиментальными фотками и посещения сайтов (которые, согласно статистики, посещают женщины, подумывающие о рождении ребенка) до покупки семьей противозачаточных средств. Машина может решить, что вас не стоит повышать в должности, поскольку большинство ваших френдов не очень удачливые люди и живут не в очень престижных местах. По этой же причине банк может отказать вам в кредите…

Пользователь может соблюдать все предосторожности и не болтать в  социальных сетях лишнего, но какая-нибудь мелочь, которую можно получить при многофакторном анализе больших данных, позволит машине прийти к выводу, что данный сотрудник исповедует политические взгляды, которые несовместимы с занятием высокой должности…

«Можно без труда вообразить компанию, разрабатывающую алгоритмы, способные предугадывать состояние здоровья человека на основании его покупок или других действий, которые кажутся безобидными. И речь не только о беременности, но и о таких заболеваниях, как диабет, рак или расстройства психики» — говорила Джули Брилл, один из руководителей американской Федеральной торговой комиссии США (Federal Trade Commission), во время выступления в Принстонском университете.

Обсудить на Facebook
@relevantinfo
Читатели, которым понравилась эта статья, прочли также...
Закрыть X
Content, for shortcut key, press ALT + zFooter, for shortcut key, press ALT + x