Мир-фильтр. Как алгоритмы уплощают культуру
© 2024 by Kyle Chayka
© Е. Поникаров, перевод на русский язык, 2025
© А. Бондаренко, художественное оформление, макет, 2025
© ООО “Издательство Аст”, 2025
Издательство CORPUS ®
Художественное оформление и макет Андрея Бондаренко
Джесс
Возможно, вы не используете социальные сети, но они используют вас.
Эйлин Майлз
Суть многих вещей в Америке – “или так, или умри”.
Джордж Уильям Троу
Йозеф Фридрих Фон Ракниц. Предположительная схема механического турка. 1789
Введение
Добро пожаловать в Мир-фильтр
В 1769 году государственный служащий империи Габсбургов по имени Иоганн Вольфганг Риттер фон Кемпелен создал устройство, прозванное механическим турком. Этот подарок должен был произвести впечатление на императрицу Священной Римской империи Марию-Терезию Австрийскую. Почти что волшебная машина фон Кемпелена умела играть в шахматы и побеждать человека – всего лишь с помощью внутренних шестеренок и ремней. Как видно на исторических гравюрах, механический турок представлял собой большой деревянный ящик шириной около четырех футов, глубиной два с половиной фута и высотой три фута[1]; за его дверцами можно было разглядеть сложный внутренний механизм. Сверху располагался человекоподобный автомат: над шахматной доской наклонялась фигура размером с ребенка – халат, тюрбан, впечатляющие усы (этот ориенталистский архетип объединял в глазах европейцев чужака-человека и чужака-машину). Турок протягивал над доской левую руку, брал фигуры и передвигал их. Машина сигналила после сделанного хода, определяла, когда противник жульничает, а лицо автомата могло менять выражение. Механический турок фон Кемпелена настолько всех одурачил, что во время своих путешествий по миру сразился с Бенджамином Франклином в 1783 году и Наполеоном Бонапартом в 1809 году. Оба ему проиграли.
Однако на самом деле механический турок не умел играть в шахматы. Не было ни искусственного интеллекта, управляющего автоматоном, ни кучи шестеренок, механически определяющих следующий ход. Внутри корпуса сидел невысокий человек, хорошо игравший в шахматы. Благодаря системе магнитов он мог отслеживать расположение пешек, коней и королей на доске[2]. Используя систему рычагов и тросиков, игрок управлял рукой автомата: брал фигуры и передвигал их. Дым от свечки, которую спрятанному шахматисту приходилось использовать для освещения, уходил через скрытые отверстия в задней части машины[3]. Все внутренние механизмы не играли никакой роли, а лишь создавали видимость. Когда дверцы открывались и зрители заглядывали внутрь в рамках демонстрации ложной прозрачности, они не видели оператора: тот скрывался, используя передвижное сиденье – нечто вроде ложного дна в реквизите фокусника.
Механический турок создавал впечатляющую иллюзию машины, которая могла сама принимать решения и выглядела умнее человека, в то время как на самом деле автоматом управлял именно человек. Некоторые зрители подозревали обман. “Называть это автоматом – жульничество, и это заслуживает публичного осуждения”, – писал скептически настроенный британский автор Филипп Тикнесс в книге 1784 года, утверждая, что машиной управляли “невидимые сообщники”. Тикнесс продолжал: “Шахматист-автоматон – это человек в человеке; из чего бы ни состояла его внешняя форма, внутри он содержит живую душу”. Конечно, Тикнесс был прав, но тайна полностью раскрылась только в 1860 году, когда машина уже объехала Соединенные Штаты и попала в коллекцию Джона Кирсли Митчелла, личного врача Эдгара Аллана По[4]. Оригинальный автоматон погиб во время пожара, а сын Митчелла написал статью для журнала Chess Monthly. Однако то, что машина оказалась чистой иллюзией, только увеличило значимость механического турка.
За два века, прошедшие с момента его изобретения, это устройство стало распространенной метафорой для описания технологических манипуляций. Она олицетворяет человека, скрывающегося за фасадом, казалось бы, передовых технологий, а также способность таких устройств вводить нас в заблуждение относительно своей природы. (В 2005 году компания Amazon назвала “Механическим турком” свой сервис, в котором цифровые задачи, такие как расстановка тегов для фотографий или очистка данных, выполняются с помощью невидимого рынка аутсорсингового человеческого труда.) Механический турок подобен герою “Волшебника страны Оз”, прятавшемуся за занавесом, – всезнающая таинственная сущность, которая в конечном итоге оказывается чем-то гораздо более обыденным и понятным. Машина и трюк дополняют друг друга. Благодаря двойному обману турку удается “все время выигрывать” – как писал немецкий философ Вальтер Беньямин, размышляя об этом устройстве в эссе 1940 года.
В последнее время я довольно часто думаю о механическом турке, потому что он напоминает мне об одном технологическом призраке, преследующем нашу эпоху начала XXI века. Имя этому призраку – “алгоритм”. Алгоритм – это сокращение от “алгоритмических рекомендаций”, цифровых механизмов, которые поглощают кучу пользовательских данных, проталкивают их через набор уравнений и выплевывают результат, считающийся наиболее релевантным для заданных целей. Алгоритмы определяют сайты, которые мы находим с помощью Google; тексты, которые мы видим в ленте Фейсбука[5]; песни, которые бесконечным потоком проигрывает Spotify; людей, которых мы рассматриваем как потенциальных партнеров в приложениях для знакомств; фильмы, рекомендуемые на главной странице Netflix; персонализированную ленту видеороликов, которую выдает ТикТок; порядок постов в Твиттере[6] и Инстаграме; папки, по которым автоматически сортируется наша электронная почта; рекламу, которая преследует нас по всему интернету. Алгоритмические рекомендации в значительной степени обуславливают наше взаимодействие с цифровым пространством – учитывая наши предыдущие действия и выбирая те фрагменты контента, которые в наибольшей степени соответствуют нашим моделям поведения. Они призваны интерпретировать наше поведение, а затем показывать нам то, что мы хотим увидеть.
Сегодня мы постоянно сталкиваемся со всевозможными алгоритмами, каждый из которых пытается угадать, о чем мы думаем, что ищем и чего желаем – еще до того, как даже мы сами осознаем ответы на эти вопросы. Когда я пишу электронное письмо, мое приложение Gmail предугадывает слова и фразы, которые я пытаюсь набрать, и пишет их за меня, словно читая мои мысли. Сервис Spotify выводит на экран музыкантов и альбомы, которые, по его прогнозам, я, скорее всего, буду слушать, и в итоге я часто выбираю их просто по привычке. Когда я разблокирую свой телефон, там уже висят фотографии из прошлого, которые я, возможно, захочу посмотреть – названные “воспоминаниями”, словно они существуют в моем подсознании; рядом мне предлагают и приложения, которые я, возможно, захочу открыть, и друзей, которым я, возможно, захочу написать сообщение. Инстаграм подсовывает доску настроений из того, что его алгоритм считает моими интересами: фотографии еды, снимки зданий, повторяющиеся нарезки популярных телепередач. ТикТок предлагает мне необъяснимую лавину видеороликов о том, как люди меняют плитку у себя в ванной, и я необъяснимым образом продолжаю их смотреть, хотя мне это ни к чему. Но ведь не может же моя идентичность сводиться к культурному потреблению?
Раньше все эти мелкие решения принимали люди: редактор газеты решал, какие материалы поместить на первую полосу; фоторедактор журнала отбирал фотографии для публикации; ответственный за программу фильмов выбирал, какие картины показывать в кино; диджей независимой радиостанции составлял плейлисты из песен, соответствующих его собственному настроению и особой атмосфере того или иного дня или места. Хотя эти решения, конечно, зависели от различных социальных и экономических сил, человек, отвечающий за них, обеспечивал базовый уровень качества и даже безопасности; однако при ускоренной подаче в интернете этот уровень может отсутствовать.
Алгоритмические рекомендации – это новейшая итерация механического турка: серия человеческих решений, облеченных в форму технологических, автоматизированных и получивших нечеловеческие масштабы и скорость. Эта технология, разработанная и поддерживаемая инженерами монополистических компаний и работающая на тех данных, которые мы – пользователи – постоянно предоставляем, заходя каждый день, одновременно создана нами и нами же управляет, манипулируя нашим восприятием и вниманием. Алгоритм всегда побеждает.
Название этой книги – “Мир-фильтр” (Filterworld) – мой термин, который означает обширную, взаимосвязанную и в то же время разрозненную сеть алгоритмов, влияющих на нашу сегодняшнюю жизнь и оказывающих особенно сильное воздействие на культуру и способы ее распространения и потребления. Хотя Мир-фильтр также изменил политику, образование, межличностные отношения и многие другие аспекты жизни общества, я сосредоточился только на культуре. Визуальные искусства, музыка, кино, литература или хореография – алгоритмические рекомендации и наполняемые ими ленты опосредуют наше отношение к культуре, направляя внимание на то, что лучше всего вписывается в структуру цифровых платформ. Автоматические рекомендации – это фильтры, которые отделяют то, что привлекает внимание, от того, что игнорируется, и тонко искажают внешний вид этих вещей, подобно фильтру в Инстаграме, усиливающему одни свойства и ослабляющему другие. Культурные успехи Мира-фильтра очевидны. К ним относятся такие явления, как “кантрифицирующие”[7] действия ТикТока, который в 2018 году привел к мировой славе песню рэпера Lil Nas X “Old Town Road”; клишированные тенденции в дизайне, затопившие Инстаграм, такие как минималистичные интерьеры и однообразные логотипы со шрифтами без засечек, которые модные бренды взяли на вооружение в последние годы; вызывающий ярость поток бессмысленных споров в Твиттере.
Алгоритмические рекомендации диктуют жанры культуры: они поощряют определенные шаблоны продвижением в лентах, исходя из того, что сразу привлекает наибольшее внимание. В 2018 году писательница Лиз Пелли определила один из таких жанров – “стримбейт”[8]: “приглушенный, среднетемповый, меланхоличный поп”, характерный для Spotify. В 2019 году писательница Джиа Толентино аналогичным образом определила “лицо Инстаграма” – “отчетливо белое, но этнически неопределимое” сочетание черт, которое стало возможным благодаря пластической хирургии и обрело популярность на платформе: “Кошачьи глаза и длинные мультяшные ресницы; маленький, аккуратный нос и полные, пухлые губы”. Появился термин “голос ТикТока”; он обозначает скомканную монотонную протяжность многих закадровых голосов в видеороликах ТикТока. Каждая платформа вырабатывает свой собственный стилистический архетип, который определяется не только эстетическими предпочтениями, но и расовыми, гендерными и политическими убеждениями, а также фундаментальной бизнес-моделью корпорации, которой она принадлежит.
Процветающая в Мире-фильтре культура, как правило, доступна, интерактивна и совместна, она окружает вас. Ею можно делиться с широкой аудиторией, она сохраняет свое значение для разных групп, которые слегка корректируют ее в своих целях. (В Мире-фильтре все должно быть каким-то мемом – например, шуткой, которая поддается бесконечной переделке, или картинкой, оптимизированной для распространения по интернету.) Эта культура также является приятной или достаточно средней, чтобы ее можно было проигнорировать и ненавязчиво задвинуть на задний план, где она зачастую остается незамеченной, пока вы не начнете ее искать. Однако после того, как вы ее заметите, вы, как правило, обнаруживаете ее повсюду, как, например, было с внезапной популярностью зимой 2018 года “куртки Amazon” – пуховика, который рекомендовали участникам сервиса Amazon Prime на онлайн-платформе компании – еще одном алгоритмическом пространстве. В последующие годы эта оригинальная куртка Orolay вдохновила производство десятков реплик и копий, включая вариант от самой Amazon. Культура Мира-фильтра в конечном счете однородна и характеризуется всепроникающим чувством одинаковости, даже если ее артефакты не являются буквально одинаковыми. Она воспроизводит себя вплоть до скуки.
Я начал замечать эффекты Мира-фильтра в кофейнях – примерно в 2015 году. Когда в 2010-х годах я путешествовал по разным городам в качестве журналиста-фрилансера – Киото, Берлин, Пекин, Рейкьявик, Лос-Анджелес, – мне всегда попадалось кафе, которое походило на другие, виденные мною в других странах, и это вызывало ощущение дежавю. В этом типовом кафе, как я стал его называть, стены облицованы белой плиткой “под кирпич”; стоят широкие столы из переработанной древесины и стулья в стиле модерн середины века, имеющие хлипкие ножки; подвесные светильники снабжены эдисоновскими лампочками. “Инстаграмная” эстетика. И вне зависимости от города и времени суток в этом кафе неизменно сидят люди, похожие на меня: фрилансеры за ноутбуками, зачастую просматривающие социальные сети. Почему же интерьеры выглядят и функционируют одинаково в разных географических точках? Такая строгая одинаковость выходила за рамки обычных признаков глобализации. Мне захотелось найти ее первопричину.
Много путешествующий бизнес-консультант – миллениал из Берлина по имени Игорь Шварцман, который также заметил типовые кафе, описал мне этот феномен как международную “гармонизацию вкусов”. Благодаря алгоритмическим цифровым платформам – таким как Инстаграм, Yelp и Foursquare – все больше людей по всему миру учатся искать сходных продуктов и впечатлений в физической жизни. Через свои ленты они потребляют сходные виды цифрового контента, независимо от того, где живут, и в результате их предпочтения формируются в соответствии с этим образом. Ими манипулируют алгоритмы: приложения направляют их через физическое пространство в реальные места, которые обрели популярную в цифровом мире эстетику, завоевав внимание и рейтинги других пользователей. Более высокие рейтинги способствуют еще большему алгоритмическому продвижению и, следовательно, увеличению числа посетителей. Однако, несмотря на интернациональность этих эффектов, в их основе лежат западные платформы, которые базируются в основном в крохотном американском регионе – Кремниевой долине, а контролирует их горстка непостижимо богатых белых мужчин – абсолютная противоположность разнообразия.
Теоретик литературы индийского происхождения Гаятри Чакраворти Спивак писала в 2012 году: “Глобализация происходит только в капитале и данных. Все остальное – это антикризисные меры”. В эпоху Мира-фильтра цифровые платформы – Фейсбук, Инстаграм и ТикТок – стали накапливать и распространять по всему миру данные – в виде активности пользователей и их капитала, в виде серверных ферм и алгоритмических технологий, захватив миллиарды пользователей. Однородная культура – неизбежная реакция на ущерб от этого распространения, способ справиться с ним или приспособиться к нему. Долгое время я полагал, что эстетика типового кафе постепенно исчезнет, что это, возможно, не более чем преходящий тренд. Однако она только укрепилась. С расширением цифровых платформ распространилась и однородность, к которой они приводят.
Мир-фильтр и его гладкая одинаковость могут вызывать захватывающее, почти изнуряющее чувство тревоги. Однородность кажется неизбежной и отчуждающей, даже если она широко позитивно рекламируется. “Надзорный капитализм”, как назвала его исследовательница Шошана Зубофф, – это концепция, в рамках которой технологические компании монетизируют постоянное поглощение наших персональных данных, это усиление экономики внимания. И все же, несмотря на все эти данные, алгоритмы часто понимают нас неправильно, связывая не с теми людьми, рекомендуя не тот контент, поощряя в нас привычки, которые мы не желаем иметь. Сеть алгоритмов принимает за нас множество решений, а у нас практически нет возможности ответить ей или повлиять на ее работу. Этот дисбаланс порождает состояние пассивности: мы потребляем то, что рекомендуют нам ленты, не вникая в суть материала. Мы также подстраиваем свою деятельность в Сети под предлагаемые стимулы. Мы пишем твиты, публикуем посты в Фейсбуке и делаем фотографии для Инстаграма в том виде, который, как мы знаем, привлечет внимание и соберет лайки или клики, приносящие доход технологическим компаниям. Научные исследования показали, что эти лайки вызывают прилив дофамина в нашем мозгу, а, значит, погоня за ними и соблюдение предложенных нам правил вызывает привыкание.
Другая сторона нашего алгоритмического беспокойства – состояние оцепенения и невосприимчивости. Выброс дофамина становится несоразмерным, а шум и скорость ленты подавляют и перегружают. Наша естественная реакция – искать культуру, которая приветствует небытие, укрывает и успокаивает нас, а не ставит проблемы и не удивляет, как это должны делать яркие произведения искусства. Нас становится все труднее зацепить; истощается даже наша способность проявлять эмоции, интерес и любопытство.
Чтобы понять, как Мир-фильтр формирует наш опыт, нужно понять, как он появился. Доминирование алгоритмических лент – относительно недавнее явление. На заре существования таких социальных сетей, как Твиттер, Фейсбук, Инстаграм и Тамблер, ленты контента на их сайтах отличались более или менее хронологическим порядком. Вы сами выбирали, с кем дружить или на кого подписываться, и посты этих людей появлялись в порядке публикации. В 2010-х годах число пользователей этих платформ выросло до миллионов и миллиардов, и они стали общаться с большим количеством людей одновременно, поэтому полные хронологические ленты стали громоздкими и не всегда интересными. Вы могли пропустить популярный или интересный пост только потому, что не заходили на платформу в нужное время. Поэтому в лентах постепенно увеличивалась процентная доля рекомендуемых постов, расположенных не в хронологическом порядке. Источниками этих алгоритмически выделенных постов могут быть даже аккаунты, на которые вы не подписаны, а их темы могут быть вам безразличны; они встраиваются в вашу ленту только для того, чтобы при открытии приложения там что-нибудь было.
Мотивом для такой трансформации послужило не столько удобство использования, сколько выгода. Чем больше времени пользователи проводят в приложении, тем больше данных они производят, тем легче их отследить и тем эффективнее можно продать их внимание рекламодателям. С течением времени ленты становились все более алгоритмизированными – особенно в переломный момент середины 2010-х годов.
ТикТок, запущенный в США в 2018 году, в качестве основной инновации сделал свою основную ленту For You (“Для вас”) почти полностью алгоритмической. В этом приложении пользователи следили не столько за теми, на кого подписались, сколько за контентом, подобранным для них алгоритмом рекомендаций (отсюда и бомбардировка моей ленты видеороликами про укладку плитки в ванной). ТикТок стал самой быстрорастущей социальной сетью в истории, заполучив свыше 1,5 миллиарда пользователей менее чем за пять лет, и его конкуренты, пытаясь наверстать упущенное, последовали его примеру с алгоритмизацией. В 2020 году Инстаграм добавил функцию видеороликов Reels, основанную на рекомендациях, а Твиттер после покупки Илоном Маском ввел в 2022 году колонку For You (“Для вас”) с рекомендуемыми твитами. И этот алгоритмический бум не демонстрирует никаких признаков спада – по крайней мере для крупных корпораций, на долю которых приходится большая часть трафика в интернете.
Теперь живых блюстителей и хранителей культуры, редакторов и диджеев заменили алгоритмические аналоги. Хотя такая трансформация понизила многие культурные барьеры для входа (поскольку теперь каждый может обнародовать свою работу в интернете), она также привела к своего рода тирании данных в реальном времени. Единственной мерой оценки культуры стало внимание, а то, что получает внимание, диктуется уравнениями, разработанными инженерами Кремниевой долины. Результатом такого алгоритмического контроля является повсеместная уплощенность, которая проявляется во всех областях культуры. Под уплощением я подразумеваю придание однородности, а также упрощение: сильнее всего продвигаются наименее неоднозначные, наименее подрывные и, возможно, наименее значимые части культуры. Уплощенность – это наименьший общий знаменатель, усредненность, которая никогда не была отличительным качеством самых значимых культурных достижений человечества.
Метафора Мира-фильтра встретилась мне в романе японского писателя Ясуо Танаки “Слегка хрустальные”, вышедшем в 1980 году. Эта книга – не драматическое повествование, а скорее список модных марок, брендов, ресторанов и бутиков. Автор в мельчайших подробностях описывает потребительскую среду в Токио, окружающую молодую женщину по имени Юри, рассказывает о том, что героиня покупает, а также о различных устройствах, которыми она пользуется, – литературный эквивалент аккаунта популярного блогера в Инстаграме. Роман начинается с того, что Юри просыпается и включает стереосистему рядом с кроватью. Она нажимает на кнопку, чтобы радио переключилось на FEN – станцию, передающую американскую рок-музыку. В сноске книга философствует о технологии подобной кнопки: это “удобная функция, позволяющая заранее задать частоту нужной вам станции”, хотя при этом “немного утрачивается безумная радость от ручной настройки”.
Автор обращает внимание на разницу между нажатием кнопки для мгновенной настройки на станцию и покручиванием ручки влево-вправо, когда вы пробиваетесь сквозь помехи и в конце концов обнаруживаете идеальное аналоговое положение. Возможно, второй вариант менее точен и удобен, зато он несколько более волшебен и человечен. В нем нет предустановки, нет заранее определенного решения. Культура Мира-фильтра – это культура предварительных установок, устоявшихся шаблонов, которые повторяются снова и снова. Подобная технология ограничивает наше потребление определенными способами, выйти за рамки которых уже не получится. Когда столь многое зависит от способности культуры распространяться через цифровые каналы, уходит, как выражается Юри, “безумное веселье” – то есть исчезает определенная степень оригинальности, небывалости, творчества и неожиданности.
Цель этой книги – не просто составить схему Мира-фильтра и описать его влияние, но и деконструировать его. Сделав это, мы сможем определить пути выхода из него и развеять вездесущую атмосферу тревоги и апатии, которую породили алгоритмические ленты. Мы можем избавиться от их влияния, только поняв их – открыв ящик механического турка и обнаружив внутри оператора.
Глава 1
Взлет алгоритмических рекомендаций
Алгоритм как термин просто описывает некое уравнение: любую формулу или набор правил, которые выдают желаемый результат. Самые ранние примеры восходят еще к древнему Вавилону, располагавшемуся на территории современного Ирака. На клинописных табличках, датируемых 1800–1600 годами до н. э., записаны алгоритмы для таких целей, как вычисление длины и ширины резервуара, если известны его глубина и объем вынутого грунта. По словам математика Дональда Кнута, вавилоняне “представляли каждую формулу в виде пошагового списка правил, то есть в виде алгоритма вычислений по этой формуле”. У них была специальная система записи вычислений, использующая, как пишет Кнут, “не символический язык, а представление формул на «машинном языке»”. Письменное объяснение каждого вавилонского алгоритма заканчивалось одной и той же фразой: “Таков способ”. Эта фраза подчеркивает неотъемлемое свойство алгоритмов: их можно повторять, они одинаково применимы и эффективны каждый раз, когда возникает определенная ситуация. Современный последователь Кремниевой долины назвал бы их адаптируемыми.
Алгоритмы занимают важное место в истории математики. Около 300 года до н. э. греческий философ Евклид описал в своем труде “Начала” так называемый алгоритм Евклида[9] – способ нахождения наибольшего общего делителя двух чисел. И его, и “решето Эратосфена” – алгоритм III века до н. э., который находит все простые числа, не превосходящие определенного числа, – используют до сих пор, особенно в области криптографии. Однако само слово “алгоритм” происходит от имени определенного человека – или, по крайней мере, от места его рождения.
Персидский ученый Мухаммад ибн Муса аль-Хорезми родился около 780 года в Хорезме – государстве, располагавшемся на территории современных Туркменистана и Узбекистана. О его жизни мало что известно. Он добрался до Багдада, который стал интеллектуальным центром региона после того, как мусульманский халифат Аббасидов завоевал Персию в VII веке. Там ученый занимался астрологией, географией и математикой в Доме мудрости, известном также как Большая библиотека Багдада. Подобно своей предшественнице – египетской Александрийской библиотеке – Дом мудрости являлся междисциплинарным научным центром, где ценили исследования и переводили на арабский язык тексты, написанные на латыни, санскрите, греческом и персидском языках. Около 820 года аль-Хорезми завершил работу “Книга об индийском счете”, которая в конечном итоге привела к распространению в Европе современной системы записи чисел. Он также сочинил трактат о методах решения уравнений “Китаб аль-джебр ва-ль-мукабала” (“Краткая книга о восполнении и противопоставлении”). От слова “аль-джебр” из названия (которое означает “восстановление, восполнение”, то есть сокращение одинаковых членов в обеих частях уравнения) произошло слово “алгебра”. В труде аль-Хорезми описывались методы решения квадратных уравнений и вычисления площади и объема, указывались приближенные значения числа π.
В середине XII века в Испании пересекались мусульманская, иудейская и христианская культуры – иногда мирно, иногда не очень, и между цивилизациями шел обмен идеями. Живший тогда в испанском городе Сеговия английский востоковед Роберт Честерский в 1145 году перевел “Книгу о восполнении и противопоставлении” на латынь. “Аль-джебр” превратилось в algeber, а “аль-Хорезми” – в Algoritmi. В то время слово algorismus относилось ко всем математическим операциям с использованием индийско-арабских цифр, а тех, кто занимался подобным искусством, называли алгористами. (Этим термином именуют себя визуальные художники, с 1960-х годов использующие алгоритмические процессы, однако он кажется подходящим для всех, кто работает над современной версией алгоритмов.) Такой длинный путь этимологии алгоритма показывает, что вычисления являются не только продуктом воспроизводимых научных законов, но и результатом человеческого искусства и труда.
Работа компьютеров основана на многократно выполняемых операциях. Затем с результатами, закодированными нулями и единицами, производятся новые операции, результат которых выдается пользователю. В 1822 году британский изобретатель Чарльз Бэббидж изложил свою концепцию “применения машин для вычисления астрономических и математических таблиц” – метод автоматизации вычисления с помощью системы пронумерованных шестерней и валиков, названной разностной машиной. Это устройство так и не было построено целиком, однако его более поздние реализации выглядят как внутренности фортепиано, только вместо молоточков тянутся длинные ряды колес. Спроектированная Бэббиджем машина должна была иметь высоту восемь футов и весить четыре тонны. Затем изобретателю в голову пришла идея аналитической машины, которая могла (если бы ее удалось построить) получать команды, заданные с помощью перфокарт, и выполнять простые операции программирования (циклы и условные операторы). Она стала основой для гораздо более сложных современных вычислительных машин. Сын Бэббиджа Генри в 1888 году писал: “Это всего лишь вопрос карт и времени”.
Дочь лорда Байрона Ада Лавлейс сегодня считается первым программистом: она написала алгоритмы для машины в том виде, в каком ее спроектировал Бэббидж, включая процесс вычисления чисел Бернулли. Лавлейс также поняла, что повторяющиеся механические процессы, на которые способна машина, можно применять не только в математике. В 1843 году Лавлейс писала, что аналитическая машина “могла бы работать с другими вещами, кроме чисел, если найти объекты, взаимоотношения которых можно выразить с помощью абстрактной науки об операциях и которые также можно приспособить к рабочей нотации и механизму машины”. Иными словами, формально можно манипулировать всем, что удастся превратить в нечто похожее на данные – какой-то ряд чисел. Это может быть текст, музыка, искусство или даже игра – например, шахматы. Лавлейс представила себе одну из форм такой автоматизации: “Если предположить, например, что фундаментальные отношения звуков в науке гармонии и музыкальной композиции поддаются такому выражению и адаптации, то машина могла бы сочинять замысловатые научные музыкальные произведения любой степени сложности и объема”. Она предвосхитила нечто, подобное “генеративной музыке”; композитор Брайан Ино предложил этот термин в 1995 году для описания постоянно меняющихся синтезаторных композиций: программное обеспечение создает разные мелодии при каждом запуске программы. Лавлейс представляла, как новая технология может формировать и увековечивать культуру – как это происходит сегодня при алгоритмическом наполнении лент.
Лавлейс одной из первых обнаружила, что манипулирование такими механическими командами может оказаться формой самовыражения. В 1990-х и 2000-х годах компьютерное программирование заняло место рядом с математикой и естественными науками, превратившись в навык, необходимый для полноценного образования ребенка. Я познакомился с ним примерно в 2002 году в компьютерном классе своей школы: мы играли в обучающие видеоигры, напоминающие языки программирования. Но по-настоящему я учился с помощью громоздких графических калькуляторов TI-83, которые нам приходилось приобретать для уроков математики. Эти калькуляторы можно было программировать на языке под названием TI-BASIC, включавшем простые операторы ветвления и функции. Сначала я составлял скромные программы для формул, которые использовались в моих тестах, но когда лучше разобрался в языке, стал создавать свои собственные версии игр “Крестики-нолики” и “Четыре в ряд”. Машина стала партнером в моем творчестве; это казалось настоящим волшебством.
Спустя столетие после Лавлейс британский математик и информатик Алан Тьюринг во время Второй мировой войны работал на правительство – он помогал взломать код немецкой шифровальной машины “Энигма”. В 1946 году, когда война закончилась, Тьюринг написал для Национальной физической библиотеки доклад, в котором предложил идею проекта “автоматической вычислительной машины”. Это было первое описание искусственного интеллекта как реальной возможности, а не теоретической концепции. Тьюринг писал, что вычислительные и сортировочные машины, предназначенные для выполнения конкретных задач, уже существуют, однако его предложение выходит и за эти рамки: “Вместо того чтобы постоянно использовать человеческий труд для вывода материала из машины и ввода его обратно в нужный момент, обо всем будет заботиться сама машина”.
По мнению Тьюринга, подобное устройство могло бы выполнять любые вычисления в любом масштабе, не нуждаясь в перенастройке. У него имелся бы свой внутренний логический язык, который можно было бы приспосабливать для разных целей, чтобы решать произвольные задачи. “Как можно ожидать, чтобы машина выполняла все эти многочисленные вещи? – писал Тьюринг. – Ответ заключается в следующем: мы должны считать, что машина делает нечто довольно простое, а именно – выполняет команды, отданные ей в стандартной форме, которую она способна понять”. Она будет следовать алгоритмам. Он предвосхитил то, как современные алгоритмы машинного обучения развиваются с течением времени, внося коррективы без участия человека.
Такая система будет выполнять вычисления гораздо быстрее и на более высоком уровне сложности, превосходя возможности человека. Тьюринг писал: “Скорость машины больше не ограничивается скоростью человека-оператора”. Однако он не считал, что такие машины обеспечат утопическое счастье. То, что они будут работать автоматически, не означает, что они всегда будут правы. “Фактор человеческой ошибки устраняется, однако в какой-то степени его, возможно, заменят механические ошибки”, – продолжал Тьюринг. В своей работе он спрогнозировал многие известные сегодня компоненты персональных компьютеров: память с возможностью стирания, механизмы ввода, преобразование двоичного языка и даже контроль температуры во избежание перегревов. Однако для Тьюринга слово “компьютер” относилось не к машине, а к человеку, выполняющему вычисления, что еще раз подчеркивает этот органический элемент.
Еще в 1936 году Тьюринг придумал то, что сейчас называется “машиной Тьюринга”. Он подробно описал это устройство в эссе 1948 года под названием “Интеллектуальная машина”. Машина Тьюринга – это “бесконечная лента, разделенная на ячейки, в каждой из которых можно записать какой-то символ”. Лента проходит через управляющее устройство, которое проверяет одну ячейку за раз и выполняет операцию, которая определяется состоянием машины и наблюдаемым символом: записать в ячейку новый символ, перейти в новое состояние и переместиться к соседней ячейке вправо или влево. Машина Тьюринга может реализовать любой алгоритм в историческом смысле слова – алгоритм произвольной математической процедуры. Любая вычислительная система, которая способна делать все, что может машина Тьюринга, называется “полной по Тьюрингу” или “тьюринг-полной”. Например, все языки программирования являются полными по Тьюрингу, потому что могут смоделировать любой вид уравнений. (Даже программа для работы с электронными таблицами Excel в 2021 году стала полной по Тьюрингу.) Тьюринг пришел к верному выводу о том, что любая вычислительная машина сумеет выполнить работу любой другой, и даже аналитическая машина Чарльза Бэббиджа XIX века теоретически могла бы выполнять сложные задачи, обрабатываемые нашими ноутбуками, – если бы ей предоставили бесконечные ресурсы и время.
В жизни Тьюринга тоже происходило своеобразное столкновение между механическими правилами и человеческими действиями. В 1952 году математика обвинили в совершении грубой непристойности – в “выражении гомосексуальности” (юридический оборот, означающий секс с другим мужчиной) – в ходе путаного судебного разбирательства, которое он сам инициировал после ограбления собственного дома. Гомосексуальный секс между взрослыми по обоюдному согласию оставался незаконным в Англии вплоть до 1967 года – этот закон является своего рода алгоритмом, выносящим приговор на основе безжалостного набора правил. В итоге Тьюринга признали виновным. Ему предоставили выбор между тюремным заключением и химической кастрацией, и он предпочел второй вариант. В июне 1954 года домработница нашла 41-летнего Тьюринга мертвым. Причиной смерти стало отравление цианидом, а предполагаемым методом самоубийства являлось надкушенное яблоко на прикроватной тумбочке[10].
Когда мы говорим об “алгоритме”, часто возникает ощущение, что эта сила появилась совсем недавно, в эпоху социальных сетей. Однако на самом деле речь идет о технологии, имеющей богатую историю и наследие, которые медленно формировались на протяжении целых веков до появления интернета. Восстановление этой более общей картины может помочь нам лучше понять силу, которой обладают современные алгоритмы. И все же, каким бы сложным ни был алгоритм, по своей сути он остается неким уравнением: методом, позволяющим получить желаемый результат – будь то шумерская схема, позволяющая разделить некоторое количество зерна поровну между несколькими мужчинами, или лента Фейсбука, определяющая, какое сообщение показывается первым, когда вы заходите на сайт. Все алгоритмы – это двигатели автоматизации, и, как прогнозировала Ада Лавлейс, автоматизация теперь вошла во многие сферы нашей жизни, не ограничиваясь чистой математикой.
В 1971 году в одном из офисных зданий в центре города Сантьяго (Чили) появилась шестиугольная комната, спроектированная как своеобразное диспетчерское помещение для всей страны. На обшитых деревянными панелями стенах висели мониторы и экраны, на которые выводились различные показатели – например, поставки сырья и уровень занятости населения. В центре комнаты по кругу стояли семь белых стеклопластиковых кресел, напоминавших место капитана космического крейсера из научной фантастики. С правой стороны от каждого располагалась панель управления экранами; имелись также пепельница и держатель для стакана – возможно, для виски. Этот диспетчерский центр – часть масштабного проекта “Киберсин”[11] – был спроектирован при социалистическом президенте Чили Сальвадоре Альенде под руководством Стаффорда Бира – британского специалиста по исследованию операций, который у себя в стране применял методы “кибернетики” для управления бизнесом. Бир описывал кибернетику как “науку управления”. Она включает в себя анализ сложных систем, будь то корпорации или биология, и изучение их работы для моделирования или создания подобных интеллектуальных самокорректирующихся систем. (В США аналогичную практику анализа систем впервые применила корпорация RAND в 1950-х годах.) Предполагалось, что проект “Киберсин” станет идеальной моделью, помогающей чилийскому правительству принимать решения в режиме реального времени, пока они сидят в помещении, курят сигареты и пьют виски – очередная встреча холодного технологического и хаотичного человеческого. Из этого центра люди наблюдали за алгоритмами, которые управляли государством.
Физический дизайн проекта “Киберсин”, разработанный под руководством немецкого консультанта Ги Бонсипе, создавал образ утопии в духе модерна середины века. Провода, соединявшие мониторы на стенах и сиденья, были скрыты от глаз. Сами гладкие одинаковые кресла отличались искривленной плавностью и отсутствием видимых швов. Комната символически сводила управление страной к манипулированию данными – словно к победе в какой-то видеоигре. Проект “Киберсин” обещал заменить человеческое руководство технологическим надзором, а скромный ряд экранов предоставлял любую требуемую информацию. Можно было просто усесться в одно из кресел и наблюдать за всем, что происходит в стране.
Однако технология проекта “Киберсин” являлась лишь фасадом, своеобразным фантастическим дизайн-концептом – интерактивной иллюзией возможного. Компьютерные сети того времени не позволяли реализовать его потенциал. Вывод данных осуществлялся вручную, а не автоматически. Центр использовал единственный компьютер, получавший информацию от чилийских заводов с помощью телексных аппаратов через телефонные линии. И, наконец, хотя центр и закончили, его так и не запустили[12]. Одиннадцатого сентября 1973 года правительство Альенде было свергнуто при поддержке ЦРУ, и к власти пришел Аугусто Пиночет.
Фотографии проекта “Киберсин” по-прежнему обладают неоспоримой притягательностью. Они снова и снова мелькают на дизайнерских досках настроения, демонстрируя эстетику, которая даже спустя много десятилетий все еще выглядит футуристично. Возможно, эти изображения впечатляют по той причине, что мы сохраняем мечту обработки реальных исходных данных и переработки их в цифровые схемы, после оценивания которых определяется правильный путь действий. Проект “Киберсин” излучал ощущение непогрешимости, хотя изобретатели уровня Тьюринга понимали, что компьютеры не могут работать настолько идеально. Как утверждал пионер кибернетики Стаффорд Бир, мы стремимся использовать машины для автоматизации уже существующих структур и процессов, которые изначально являлись творениями человека. Указывая на этот парадокс, Бир писал в своей книге 1968 года “Наука управления”: “Мы закрепляем в стали, стекле и полупроводниках те самые ограничения руки, глаза и мозга, для преодоления которых и был изобретен компьютер”. Как и в случае с механическим турком, внутри машины остается человек.
Сегодня мы уже располагаем вариантами алгоритмического правительства и алгоритмической жизни: банки прибегают к машинам, чтобы определить, кто получит кредит; Spotify использует данные о ваших прошлых действиях, чтобы рекомендовать те песни, которые лучше всего подходят вашей душевной организации. Однако технология, которая все это обеспечивает, не похожа на проект “Киберсин”. У нее нет шестиугольных комнат и кресел с подлокотниками. Алгоритмы стали одновременно невидимыми и вездесущими, они содержатся в приложениях, которые мы носим с собой на телефонах, хотя их данные физически хранятся где-то далеко, на огромных серверных фермах с градирнями, расположенных в малозаметных местах на природе. Если в проекте “Киберсин” предполагалось, что мир, управляемый данными, может быть последовательным и понятным и его можно заключить в рамки помещения диспетчерского центра, то теперь мы знаем, что он абстрактный и диффузный, он везде и нигде одновременно. Нас побуждают забыть о наличии алгоритмов.
Новые технологии неизбежно порождают новые формы поведения, но это поведение редко совпадает с тем, которого ожидают изобретатели. Технология обладает собственным смыслом, который в конечном итоге выходит на первый план. Маршалл Маклюэн написал знаменитый афоризм “Средство коммуникации есть сообщение”[13] в своей книге 1964 года “Понимание медиа: внешние расширения человека”. Он имел в виду, что структура нового средства передачи информации – электрического света, телефона, телевидения – важнее содержания, которое через него передается. Сама способность телефона соединять людей превосходит любой конкретный разговор. Маклюэн писал: “Ибо «сообщением» любого средства коммуникации, или технологии, является то изменение масштаба, скорости или формы, которое привносится им в человеческие дела”. В нашем случае средством передачи является алгоритмическая лента; она масштабирует и ускоряет взаимосвязь людей по всему миру до невообразимой степени. Смысл ее функции заключается в том, что на каком-то уровне наши коллективные потребительские привычки, переведенные в данные, приводят к одинаковости.
Алгоритмы – это цифровые машины, которые, подобно конвейеру на фабрике, превращают серию входных данных в определенный результат на выходе. Отличие одного алгоритма от другого заключается не столько в структуре, сколько в компонентах, из которых они строятся. Все рекомендательные алгоритмы работают, собирая набор исходных данных. Общий термин для этого набора данных – “сигнал”, собранные входные данные, которые поступают в машину. Этот сигнал может включать в себя сведения о прошлых покупках пользователя на Amazon или о том, сколько других пользователей отдали предпочтение определенной песне на Spotify. Подобные сведения имеют не качественную, а количественную форму, поскольку их должна обрабатывать машина. Поэтому даже если эти данные относятся к такой субъективной теме, как музыкальные предпочтения, они выражаются цифрами: х пользователей поставили группе y среднюю оценку z, или х пользователей прослушали треки группы y z раз. Основным сигналом для многих рекомендаций в социальных сетях является проявление интереса, или вовлеченность, которая описывает, каким образом пользователи взаимодействуют с контентом. Это может выражаться в лайках, ретвитах или просмотрах – всевозможные кнопки, расположенные рядом с постом. Высокая вовлеченность означает, что количество лайков, просмотров или перепостов у данного сообщения выше, чем у других.
Этот сигнал проходит через преобразователь данных, который превращает его в пакеты, предназначенные для обработки различными алгоритмами. Данные о вовлеченности можно отделить от данных о рейтингах или от данных о тематике самого контента. Чтобы добавить информацию об отношениях пользователей друг к другу в рамках одной платформы, можно использовать социальный калькулятор – например, я часто просматриваю в Инстаграме посты моего друга Эндрю, и это заставляет систему рекомендаций с большей вероятностью ставить его посты на первое место в моей персональной ленте.
Далее идет конкретное уравнение индивидуального алгоритма. В современных платформах очень редко работает лишь один алгоритм – обычно их много. Мы имеем дело с целым набором различных уравнений, которые учитывают переменные и обрабатывают их несколькими способами. Одно уравнение рассчитывает результат, основываясь только на вовлеченности (например, находит контент с самой высокой средней вовлеченностью), в то время как другое отдает приоритет социальному контексту контента для конкретного пользователя. Эти алгоритмы также получают тот или иной показатель приоритета относительно друг друга. Комбинированная фильтрация – технология, в рамках которой используется несколько методов. Наконец, на выходе получается сама рекомендация – следующая песня в автоматическом плейлисте или упорядоченный список постов. Алгоритм определяет, например, что сообщение из жизни друга появится в вашей ленте Фейсбука выше политических новостей.
Один из руководителей сервиса Pandora, который каталогизирует и рекомендует музыку, однажды описал мне систему этой компании как целый “оркестр” алгоритмов с “дирижирующим” алгоритмом. Каждый алгоритм применяет собственные стратегии для выработки рекомендаций, а затем алгоритм-дирижер определяет, какие варианты выдать в тот или иной момент. (При этом единственный результат работы сервиса – следующая песня в плейлисте.) В разные моменты требуются разные алгоритмические методы рекомендаций.
Единого монолитного “алгоритма” не существует, поскольку каждая платформа работает по-своему, используя индивидуальные переменные и наборы уравнений. Важно помнить, что работа ленты Фейсбука – это коммерческое решение, аналогичное тому, как производитель продуктов питания решает, какие ингредиенты использовать. Алгоритмы также меняются со временем, совершенствуясь с помощью машинного обучения. Данные, которые они получают, используются для постепенного самосовершенствования, чем стимулируется еще большее вовлечение; машина адаптируется к пользователям, а пользователи – к машине. Различия между платформами стали более заметными и актуальными в середине 2010-х годов, когда социальные сети и стриминговые сервисы усилили алгоритмическую подачу информации и та стала основой пользовательского опыта.
Мы, пользователи, в принципе не понимаем, как обычно работают алгоритмические рекомендации. Их уравнения, переменные и весовые коэффициенты не являются общедоступной информацией, потому что технологические компании не заинтересованы в их обнародовании. Они являются коммерческой тайной и важны для бизнеса почти так же, как коды запуска ядерных ракет – для государства. Их редко раскрывают; редко встречаются даже намеки на них. Одна из причин заключается в том, что в условиях общедоступности алгоритма пользователи получат возможность обманывать систему, чтобы продвигать свой собственный контент. Еще одна причина – страх перед конкуренцией: другие цифровые платформы могут украсть “секретный ингредиент” и состряпать более качественный продукт. И все же эти инструменты, как и многие другие цифровые технологии, зародились в некоммерческой среде.
Алгоритмы рекомендаций как способ автоматической обработки и сортировки информации начали применяться в 1990-х годах. Одним из первых примеров стала система сортировки электронной почты – муторное занятие и по сей день. Уже в 1992 году инженеры научно-исследовательского центра компании Xerox в Пало-Альто (более известного как PARC) начали утопать в почте. Они пытались решить проблему “растущего использования электронной почты, в результате которого пользователей захлестывает колоссальный поток входящих документов”, как написали Дэвид Голдберг, Дэвид Николс, Брайан Оки и Дуглас Терри в статье 1992 года. (Они даже не подозревали, с каким объемом цифровой коммуникации мы столкнемся в XXI веке.) Их система фильтрации электронной почты под названием Tapestry использовала два вида алгоритмов, работавших совместно: “фильтрация на основе содержания” и “совместная фильтрация”. Первый, который уже применялся в нескольких системах электронной почты, оценивал текст писем – например, если вы хотели установить приоритет по слову “алгоритм”. Второй, более инновационный метод, основывался на действиях других пользователей. При определении приоритета конкретного письма учитывалось, кто его открыл и как на него отреагировал. В статье говорилось:
Люди помогают друг другу осуществлять фильтрацию, записывая свои реакции на прочитанные документы. Например, такая реакция может уведомлять, что документ показался особенно интересным (или особенно неинтересным). Подобные реакции, называемые в общем случае аннотациями, могут быть доступными фильтрам других людей.
В Tapestry использовались “фильтратор”, запускавший повторяющиеся запросы по набору документов, “ящичек”, собиравший материалы, которые могли заинтересовать пользователя, и “оценщик”, который устанавливал приоритеты и категоризировал документы. Концептуально это очень похоже на современные алгоритмические ленты: цель Tapestry заключалась в том, чтобы выводить на первый план контент, который с наибольшей вероятностью окажется важен для пользователя. Однако подобная система требовала гораздо больше предварительных действий со стороны пользователей: им приходилось писать запросы, по которым система определяла, что они желают увидеть, основываясь либо на контенте, либо на действиях других пользователей. Остальным пользователям в системе также приходилось выполнять весьма целенаправленные действия, помечая материал как важный или нерелевантный. Для подобной схемы требуется небольшая группа людей, которые уже знают друг друга и понимают, как их сообщество взаимодействует с электронной почтой – например, вы уже осведомлены, что Джефф отвечает только на особо важные письма, и поэтому вы хотите, чтобы ваш фильтр выводил наверх все письма, на которые отвечает Джефф. Tapestry лучше всего функционировала в весьма небольшой системе.
В 1995 году Упендра Шардананд и Пэтти Маес из MIT Media Lab (медиалаборатории Массачусетского технологического института) описали в своей статье “социальную фильтрацию информации” – “технику создания персонализированных рекомендаций из любой базы данных для пользователя на основе сходства профилей интересов”. Эта работа опиралась на идеи Tapestry и стала ответом на перегруженность онлайн-информацией: “Объем значительно больше, нежели человек может отфильтровать, чтобы найти то, что ему понравится”. Авторы пришли к выводу о необходимости автоматизированных фильтров: “Нам нужна технология, которая поможет продраться через всю информацию, чтобы найти то, что нам действительно нужно, и избавит нас от того, с чем мы не хотим заморачиваться”. (Естественно, эта проблема актуальна до сих пор.) Шардананд и Маес утверждали, что у фильтрации на основе содержания есть существенные недостатки. Она требует перевода материала в данные, понятные машине, например в текст; ей не хватает интуитивной прозорливости, поскольку она может фильтровать только по терминам, которые вводит пользователь; и она не измеряет внутреннее качество. Она не способна “отличить хорошо написанную статью от плохо написанной, если в этих двух работах используются одинаковые термины”. Невозможность оценить качество наводит на мысли об искусственном интеллекте: новые инструменты вроде ChatGPT, казалось бы, способны понимать и генерировать осмысленный язык, однако на самом деле они лишь повторяют схемы, присущие уже существующим данным, на которых они обучались. Качество субъективно; сами по себе данные – без человеческой оценки – не могут его определить.
Социальная фильтрация информации позволяет обойти эти проблемы, поскольку основана на действиях людей-пользователей, которые самостоятельно оценивают содержание, используя как количественные, так и качественные суждения. Это больше похоже на сарафанное радио, когда мы получаем советы, что послушать или посмотреть, от друзей, чьи предпочтения схожи с нашими собственными: “Объекты рекомендуются пользователю на основе величин, присвоенных другими людьми со сходным вкусом”, – говорилось в статье. Сходство вкусов одного пользователя с другим определялось с помощью статистической корреляции. Чтобы давать музыкальные рекомендации, исследователи разработали систему под названием Ringo, использующую электронную почту. Пользователю предлагали первоначальную группу из 125 исполнителей, он выставлял оценки по шкале от 1 до 7, после чего строилась диаграмма его предпочтений. Затем программа сравнивала эту диаграмму с диаграммами других пользователей и подбирала музыку, которая человеку предположительно понравится (или совсем не понравится – такой вариант тоже был). Рекомендации Ringo также сопровождались указателем уровня уверенности, который выдавал вероятность того, что предложение окажется удачным, и позволял пользователю дополнительно подумать над предложенным алгоритмическим выбором. К сентябрю 1994 года у Ringo были двадцать одна сотня пользователей и пятьсот электронных писем в день с оценками музыки.
Ringo тестировала различные алгоритмы для принятия решений на основе музыкальных рейтингов. Первый алгоритм измерял несходство между вкусами пользователей и основывал рекомендации на максимальном сходстве. Второй измерял сходство, а затем использовал для принятия решений положительные и отрицательные корреляции с другими пользователями. Третий определял корреляцию между различными исполнителями и рекомендовал музыкантов, которые сильно коррелировали с теми, что уже нравились данному человеку. Четвертый алгоритм (по мнению исследователей, самый эффективный) подбирал пользователей на основе того, положительно или отрицательно они оценивали одни и те же вещи – иными словами, на основе совпадения вкусов. Сходство оказалось наилучшей переменной. Чем больше пользователей включалось в систему и чем больше сведений они предоставляли, тем лучше работала Ringo – некоторые пользователи даже назвали систему “пугающе точной”. Инновация Ringo заключалась в том, что она подтверждала: наилучшим источником точных рекомендаций или лучших индикаторов релевантности, скорее всего, являются другие люди, а не анализ самого содержания. Концепция отражала повышение важности человеческого вкуса.
Первые алгоритмы интернета разработали для того, чтобы просеивать огромное количество материала в поисках вещей, важных для пользователя, и затем представлять их в связном виде. Целью были рекомендации: рекомендовать ту или иную информацию, песню, картинку или новость в социальных сетях. Алгоритмическую подачу информации иногда более формально и буквально называют “рекомендательными системами” за простой акт выбора того или иного контента.
Первым полностью общедоступным интернет-алгоритмом, с которым сталкивался практически каждый пользователь интернета, стал алгоритм поиска Google. В 1996 году, учась в Стэнфордском университете, соучредители Google Сергей Брин и Ларри Пейдж начали работу над тем, что впоследствии превратилось в PageRank – систему ранжирования страниц интернета (который на тот момент насчитывал около ста миллионов документов); она просматривала веб-страницы и определяла, какие из них окажутся полезнее или информативнее. Алгоритм PageRank подсчитывал, сколько раз на данный сайт ссылались другие, подобно тому, как авторы научных работ ссылаются на результаты предыдущих серьезных исследований. Чем больше ссылок, тем более важной считалась страница. Показатель цитирования “согласуется с субъективным представлением людей о важности”, – писали Брин и Пейдж в 1998 году в работе “Анатомия системы крупномасштабного гипертекстового интернет-поиска”. Алгоритм PageRank объединил форму совместной фильтрации с фильтрацией на основе содержания. Связывая различные страницы, люди-пользователи формировали субъективную карту рекомендаций, которую учитывал алгоритм. Он также измерял такие факторы, как количество ссылок на странице, относительное качество этих ссылок и даже размер текста – чем он длиннее, тем более релевантным может оказаться текст для конкретного поискового запроса. Страницы с высоким значением PageRank с большей вероятностью появлялись в верхней части списка результатов, которые выдавала поисковая система Google.
Прогноз Пейджа и Брина относительно того, что их система останется функциональной и масштабируемой по мере развития интернета, оказался верным. Спустя десятилетия PageRank стал почти тиранической системой, которая управляет тем, как и когда видны сайты. Для любого бизнеса или ресурса жизненно важно приспособиться к алгоритму ранжирования и попасть на первую страницу результатов поиска Google. В начале 2000-х годов мне приходилось просматривать множество выдаваемых страниц, чтобы найти то, что мне требовалось. В последнее время я почти никогда не добираюсь даже до второй страницы – в частности, благодаря тому, что поисковая система Google теперь еще и сама показывает текст, который сочла релевантным: она берет его с сайта и демонстрирует пользователю в верхней части страницы – выше фактических результатов поиска. Таким образом, пользователь, спросивший: “Можно ли кормить собаку морковью?” (я без устали искал ответ на этот вопрос, когда у меня впервые появился щенок), сразу получает ответ, и у него отпадает необходимость заходить на другой сайт, что еще сильнее укрепляет авторитет Google. “Знание – сила”, – писал Фрэнсис Бэкон в XVI веке, однако в эпоху интернета, возможно, еще больше преимуществ дает сортировка знаний. Информацию сегодня найти легко; гораздо сложнее разобраться в ней и понять, какие сведения полезны.
Пейдж и Брин хотели, чтобы их система была относительно нейтральной и оценивала каждый сайт исключительно с точки зрения его релевантности. Задача алгоритма заключалась в предоставлении пользователю наилучшей информации. Ориентирование поиска на определенный сайт или бизнес испортило бы результаты. “Мы полагаем, что поисковые системы, финансируемые за счет рекламы, будут по своей сути отдавать предпочтение рекламодателям и не учитывать нужды потребителей”, – писали предприниматели в 1998 году. И тем не менее в 2000 году они запустили Google AdWords – пилотный продукт компании для рекламодателей (сейчас он называется Google Ads). Забавно читать их критику сегодня, когда именно реклама обеспечивает подавляющую часть доходов компании – более 80 % в 2020 году. Поскольку алгоритм PageRank привел в поисковую систему Google миллиарды людей, компания также получила возможность отслеживать, что ищут пользователи, и таким образом продавать рекламодателям позиции в выдаче при определенных поисковых запросах. Как и результаты поиска, рекламные объявления, показываемые пользователю, тоже определяются алгоритмом. И эта реклама, построенная на поисковом алгоритме, сделала Google настоящим левиафаном.
К началу 2000-х годов наш цифровой опыт уже определялся алгоритмической фильтрацией. Сайт Amazon еще в 1998 году начал использовать совместную фильтрацию при рекомендациях товаров клиентам. Однако система компании не пыталась обнаруживать сходные профили пользователей, чтобы приблизительно оценивать вкусы, как это делала Ringo; она определяла товары, которые часто покупают вместе, – например, погремушка и детская бутылочка. Статья 2017 года, созданная одним из сотрудников Amazon, описывает подобные предложения на сайте:
На главной странице выделялись рекомендации, основанные на ваших прошлых покупках и просмотренных товарах… Корзина рекомендовала добавить другие товары – возможно, спонтанные покупки, которые делаются в последнюю минуту, а возможно, дополнения к тому, что вы уже рассматривали. По окончании заказа появлялись дополнительные рекомендации, предлагающие заказать товары позже.
Такие алгоритмические рекомендации напоминают полки, расположенные непосредственно перед кассой в супермаркетах, – последний стимул купить товары, которые могут вам пригодиться. Но в данном случае рекомендации подбирались индивидуально для каждого пользователя сайта, и в результате, как утверждала статья, получался “магазин для каждого покупателя”. Amazon обнаружила, что персонализированные рекомендации товаров гораздо эффективнее с точки зрения количества кликов и продаж, чем неперсонализированные методы маркетинга – например, реклама на баннерах и списки наиболее популярных товаров, которые нельзя нацелить столь же точно. Алгоритм рекомендаций продвигал бизнес и оказался удобен для покупателя, который получил возможность находить вещи, о необходимости которых даже не подозревал. (Прямо сейчас главная страница Amazon рекомендует мне мойку с аккумуляторным питанием и японскую сковороду для омлета.)
Первые подобные алгоритмы сортировали отдельные электронные письма, музыкантов (в отличие от конкретных песен), веб-страницы и коммерческие товары. По мере развития цифровых платформ рекомендательные системы переместились в более сложные области культуры и стали оперировать гораздо большими скоростями и объемами, обрабатывая миллионы твитов, фильмов, загруженных пользователями видеороликов и даже потенциальных партнеров на свиданиях. Фильтрация стала стандартным способом работы в интернете.
Эта история напоминает также о том, что рекомендательные системы – это не всезнающие сущности, а инструменты, созданные группами технических специалистов. Они могут ошибаться. Ник Сивер – социолог и профессор Университета Тафтса, изучающий рекомендательные системы. Его исследования посвящены человеческой стороне алгоритмов – тому, что думают об алгоритмических рекомендациях создающие их инженеры. В наших беседах Сивер всегда старался прояснить двусмысленную суть алгоритма, отделяя индивидуальное уравнение от корпоративных мотивов, лежащих в основе его разработки, и конечного воздействия на пользователя. “Алгоритм – это метонимическое обозначение для компаний в целом, – говорил он мне. – Алгоритма Фейсбука не существует; существует Фейсбук. Алгоритм – это способ рассказать о решениях Фейсбука”.
Речь здесь не о технологии – нельзя обвинять сам алгоритм в плохих рекомендациях, как нельзя обвинять мост в его инженерных недостатках. Чтобы огромные хранилища контента на цифровых платформах стали доступными, необходима определенная степень упорядочивания. Негативные аспекты Мира-фильтра, возможно, возникли потому, что технология применяется слишком широко, учитывая скорее интересы рекламодателей, нежели опыт пользователей. Рекомендации в том виде, в котором они сейчас существуют, больше не работают для нас; они вызывают у нас все большее отчуждение.
Мои первые значимые воспоминания о социальных сетях связаны с Фейсбуком, в котором я зарегистрировался после того, как поступил в колледж при Университете Тафтса. Дело было летом 2006 года, и в то время потенциальным пользователям требовался официальный адрес электронной почты в домене. edu, чтобы получить доступ к части платформы, которая относилась к колледжам. Тот первый вариант Фейсбука почти неузнаваем по сравнению с сегодняшней структурой. Аудитория строго ограничивалась; я использовал сеть в основном как средство связи с другими студентами университета. Если сегодня Фейсбук можно сравнить с лихорадочной трассой с выездами и заездами через каждые несколько секунд, то в нулевые годы он больше напоминал школьную комнату отдыха, где одновременно могли общаться лишь несколько человек. Вы создавали профиль, обновляли свой статус в нем, вступали в группы по общим интересам – но не более того.
Фейсбук стал едва ли не первым способом социального общения в интернете. Его предшественниками были Friendster и MySpace. Сервисы обмена сообщениями – Instant Messenger компании AOL и gChat компании Google – обеспечивали увлекательные способы общения с друзьями в режиме реального времени. К 2006 году я уже провел сотни часов на более старых форумах, где обсуждались видеоигры и музыка. Однако именно Фейсбук Цукерберга первым грамотно и последовательно связал онлайн-идентичность с офлайновым миром. Платформа поощряла пользователей использовать свои настоящие имена, а не таинственные псевдонимы, и влияла на реальные планы в маленьком мире колледжа: организацию вечеринок, планирование учебной деятельности и завязывание отношений. Тем самым она проложила путь к распространению социальной жизни в интернете для миллионов, а затем и миллиардов пользователей.
В сентябре 2006 года, вскоре после моего появления в Фейсбуке, там появилось одно из крупнейших нововведений – функция, которая определила его будущее в качестве онлайн-гипермаркета, торгующего всем подряд. Главным атрибутом платформы стала лента новостей, бегущий список обновлений, постов и оповещений. Ею нельзя было пренебречь – как только что построенным шоссе, прорезавшим тихую деревню. “Теперь всякий раз, когда вы входите в систему, вы получаете последние новости, связанные с активностью ваших друзей и социальных групп”, – сообщалось в официальном обновлении Фейсбука.
Патент на ленту новостей, поданный в том же году, но полученный только в 2012-м, описывал ее назначение: “Система и метод предоставляют динамически выбранный медиаконтент человеку, использующему электронное устройство в среде социальной сети”. Иными словами, лента новостей представляла собой поток информации, продиктованный алгоритмом, который определял, что именно показывать пользователю. В другом патенте была заявлена возможность “генерировать динамический контент, основанный на взаимоотношениях и персонализированный для участников социальной сети на веб-основе”. Сначала эта лента новостей представляла собой просто поток уведомлений об изменении статуса отношений и новых фотографий в профиле. Это не вызывало особых подозрений.
Более полное описание патентной заявки на ленту новостей говорит о системе совместной фильтрации, действующей в гораздо больших масштабах, нежели системы электронной почты 1990-х годов. Его стоит процитировать полностью, потому что оно предсказывает, во что превратится в следующем десятилетии большая часть онлайн-жизни (от социальных сетей до потоковой передачи данных и электронной торговли): множество автоматизированных лент, диктуемых в большей степени корпорациями, а не пользователями, которые постепенно формируют более пассивные отношения между пользователями и подачей контента.
Элементы медиаконтента выбираются для пользователя на основе его отношений с одним или несколькими другими пользователями. Эти отношения пользователя с другими пользователями отражаются в выбранном медиаконтенте и его формате. Элементам медиаконтента присваивается некоторый порядок (например, на основе их предполагаемой важности для пользователя), и именно в этом порядке их представляют пользователю. Пользователь может изменить порядок элементов медиаконтента. Взаимодействие пользователя с медиаконтентом, доступным в среде социальной сети, отслеживается, и это взаимодействие используется для выбора дополнительных элементов медиаконтента для пользователя.
Этот фрагмент содержит все элементы алгоритмической ленты – системы, которая прогнозирует относительную важность информации для конкретного пользователя, определяемую на основе наблюдения за контентом, который он просматривал в прошлом; затем система продвигает в начало списка тот контент, который, на ее взгляд, с максимальной вероятностью будет столь же интересен. Цель – отфильтровать контент, чтобы выбрать наиболее вовлекающий. Это побуждает пользователя потреблять больше информации и подписываться на большее количество аккаунтов в целом. Социальные сети обрели жизнеспособность, поскольку пользователи могли чаще пользоваться ими и дольше оставаться на сайтах. Если наши друзья не активны в Фейсбуке (у меня, например, как раз такой случай), то и мы, скорее всего, снизим свою активность.
Сначала ленту новостей упорядочивали исключительно в хронологическом порядке, и на первом месте находились самые свежие обновления; однако постепенно она стала подчиняться более алгоритмической логике. По мере развития Фейсбука и увеличения активности пользователей, которые добавляли все больше связей, переходя от личных отношений к публикациям и брендам, объем отдельных обновлений увеличивался. Со временем обычные заметки от друзей дополнились сообщениями от групп, ссылками на новости и объявлениями о распродажах. Обычные пользователи уже не могли рассчитывать, что им удастся следить за хронологической лентой при таком объеме и разнообразии сообщений, но даже если бы попытались, то их либо завалило бы информацией, либо они пропустили бы важное сообщение – что могло вызвать недовольство платформой. В конце концов масштаб и скорость потребления в Фейсбуке привели к тому, что агрессивная алгоритмическая фильтрация стала необходимой.
В 2009 году в Фейсбуке появилась кнопка Like в виде поднятого большого пальца; она стала показывать, насколько пользователю интересен тот или иной контент. Порядок в ленте определяла вовлеченность пользователей, измеряемая лайками, комментариями и предыдущими взаимодействиями аккаунтов между собой. Эта алгоритмическая система получила название EdgeRank, и Фейсбук определил ее основные параметры: совместимость, вес действий и время. Под действием понималось любая деятельность людей в Фейсбуке, которая затем отправляется в ленту новостей в виде фиксируемого обновления. Совместимость отражала степень связи пользователя с автором поста и силу этой связи (например, постоянное комментирование постов друзей). Комментарий оценивался выше, чем лайк, а недавние взаимодействия – выше, чем старые. Показатель веса оценивал различные категории взаимодействий: обновление у друга, разместившего новую фотографию, могло иметь больший вес для алгоритма, нежели размещение ссылки на новость или вступление в новую группу. Время отражало возраст действий: при прочих равных условиях недавние действия с большей вероятностью оказывались в верхней части ленты новостей, нежели старые. Показатель EdgeRank не оставался вечным, как результат баскетбольного матча в турнире; он постоянно менялся. И эти три категории – не просто отдельные, нейтральные единицы данных; это совокупность данных, упакованных и интерпретированных Фейсбуком особым образом.
Отследить эволюцию алгоритмической ленты Фейсбука сложно, поскольку она постоянно обновляется, а компания раскрывает подробности лишь время от времени. Все, что мы знаем о ней помимо официальных заявлений, сводится к журналистским расследованиям и опыту пользователей, которые ощущают эффекты обновленных алгоритмов задолго до того, как те становятся достоянием общественности. Когда меняется механизм подачи информации, знакомые веб-сайты могут начать восприниматься иначе. Например, вы обнаруживаете, что реже видите в Фейсбуке сообщения своих друзей и чаще – посты групп или компаний или что Инстаграм никогда не показывает в вашей ленте посты определенного друга, и вам приходится искать их с помощью поиска.