4 алгоритма машинного обучения, которые формируют вашу жизнь

Программное обеспечение становится умным. Это медленный, неравномерный процесс, но, кажется, его также невозможно остановить. Один за другим, сложные проблемы машинного обучения

приближаются к новым мощным теоретическим инструментам, позволяющим нам создавать программное обеспечение, которое может делать действительно впечатляющие вещи.

Некоторые приложения, такие как автомобили с автоматическим управлением, отключены на несколько лет. Однако вы можете не осознавать, что машинное обучение уже окружает вас, и оно может оказать удивительное влияние на вашу жизнь. Не веришь мне? Вы можете быть удивлены.

Давайте начнем с очевидного примера.

Содержание Рекомендации

Когда вы просматриваете Spotify или Netflix или Amazon Kindle Store, алгоритмы машинного обучения следят за вами. Это их работа — им нужна информация, чтобы дать вам рекомендации, технология машинного обучения, настолько распространенная, что вы, возможно, никогда не задумывались об этом.

Это везде — по всей вероятности, большинство носителей, которые вы использовали в течение последних нескольких лет, были отобраны для вас с помощью этих алгоритмов.

Если подумать, такая рекомендация кажется невозможной. Откуда компьютерная программа знает, что вам понравится The West Wing? Он смотрел это? Чувствует ли он человечность нюансов Мартина Шина, изображающих президента Бартлетта? Это получает шутки? У Джанела Молони есть какие-то смутные идеи?

Как оказалось, эти алгоритмы не выполняют ничего подобного. Вместо этого они ранжируют контент, основываясь исключительно на использовании. Эти алгоритмы игнорируют сущность контента и вместо этого сосредотачиваются на том, какие люди нравятся и что еще им нравится.

Посмотрев на то, что вам уже нравится, алгоритм может выяснить, на какие из выученных стереотипов вы больше всего похожи, и сделает очень точные предположения о ваших вкусах. Вам нравятся The Daily Show, Хижина в лесу и Карточный домик? Ну, очень большая доля людей в этой категории, таких как Западное Крыло. Скорее всего, вы тоже.

Интересно, что этот ранее универсальный подход начинает меняться, поскольку мы достигаем предела того, что вы можете понять из моделей использования. Существуют реальные ограничения на то, что вы можете сделать с этим алгоритмом. Просто для начала — Как вы оцениваете новый контент, у которого пока нет просмотров?

Существует также проблема уменьшения отдачи. Netflix хорош в рекомендациях

, но они не будут намного лучше, используя существующие методы. В 2009 году у Netflix был конкурс на миллион долларов, чтобы найти улучшенную версию алгоритма рекомендации, и победитель улучшил рекомендации только примерно на 10%. С тех пор улучшения были еще меньше. В какой-то момент единственный способ добиться большего — научить компьютеры понимать искусство.

Так вот, что делают технологические компании.

В прошлом году стажер Spotify по имени Сандер Дилеман применил мощную технологию машинного обучения под названием «глубокое обучение».

В свою базу данных, что позволяет программе учиться анализировать музыку. Нейронная сеть автоматически — используя только необработанные аудиоданные — стала распознавать характерные паттерны в музыке.

Один нейрон низкого уровня сработал только в ответ на пение вибрато. Глубже в сети был нейрон, который научился распознавать христианский рок. Другой уволен за чиптюны и восьмибитную музыку

, Еще один уволен только за Армина Ван Бурена. Многие другие были безымянными, но все же выражали какое-то значимое свойство музыки.

Вот карта, созданная Дилеманом для каждого художника в Spotify, сгруппированная по их сходству друг с другом.

(Серьезно, пост в блоге об этом увлекателен — читайте его).

Все эти функции вместе дают гораздо более богатые основания для рекомендаций, потому что система может рекомендовать песни не только тем, кто их любит, но и их реальными абстрактными свойствами. Spotify пока не разглашает это потребителям, но это только вопрос времени. Прямо сейчас, получая максимум от Spotify

требует некоторых специальных приемов и ноу-хау. В будущем это может произойти автоматически.

Можно ли сделать то же самое для, скажем, фильмов?

Это не может быть и речи. У Google уже есть алгоритм, который может понять фотографию достаточно хорошо, чтобы описать ее на английском языке с достаточной степенью точности. Исследователь Google Джеффри Хинтон, известный как «Отец нейронных сетей», сказал в своем Reddit AMA, что он будет разочарован, если у нас не будет алгоритма, который мог бы описывать события фильма в течение пяти лет. Такого рода аналитические способности могли бы стать источником дополнительной информации, которую Netflix мог бы использовать для составления более разумных рекомендаций для фильмов.

Высокочастотная торговля

Другая область, о которой мы не часто думаем, — это алгоритмическая торговля. В 2012 году половина всех биржевых торгов

были сделаны компьютерными программами. Зачем? Потому что люди медленные. События на рынке могут происходить в течение миллисекунд. Люди не могут даже интерпретировать информацию так быстро, а тем более воздействовать на них.

Торговля на высоких частотах дает финансовые решения в руки компьютерных алгоритмов, которые могут предсказывать поведение акций и соответственно покупать и продавать. В то время как им не хватает суждения торговцев людьми, их скорость дает им доступ к возможностям, которые слишком быстры для людей.

Алгоритмический трейдинг влияет на вашу финансовую жизнь различными способами. Ваши инвестиции

существуют на рынке, который практически кипит алгоритмами. Они меняют динамику рынков, как хорошими, так и плохими. Они предлагают больше ликвидности и буфер против волатильности, но они также представляют определенные риски.

Алгоритмическая торговля ввела совершенно новые виды финансовых преступлений. В 2010 году один трейдер, использующий легион автоматизированных алгоритмов в попытке незаконно манипулировать рынком, случайно вызвал обвал рынка на триллион долларов — фондовый рынок упал примерно на 9% за считанные минуты.

По иронии судьбы, крах был усугублен законными торговыми алгоритмами, сбрасывающими позиции в ответ на падение. Поскольку многие из них в то время использовали похожие алгоритмы, они питались друг другом, создавая отрицательную обратную связь. Хотя рынок быстро восстановился, удивительные колебания показывают, насколько сильно мы контролируем финансовый мир с помощью этих алгоритмов.

Реклама это сложно. Потребители непостоянны и должны быть подкуплены, польщены и иным образом манипулированы при покупке продукта. Существует предел того, насколько эффективно вы можете манипулировать людьми, когда вам приходится общаться с ними в массовом порядке. Люди разные, и одни и те же продукты и сообщения не понравятся им всем.

Излишне говорить, что существование Интернета и компьютеров коренным образом изменило игру для рекламодателей. Теперь рекламодатели могут точно указать сообщение конкретному человеку, точно выяснив, чего он хочет и что ему нужно. Для этого они используют алгоритмы машинного обучения, которые могут учитывать чьи-то привычки просмотра и покупки.

и сделайте выводы о том, что они могут купить в будущем.

Мощь этих алгоритмов продемонстрировала ошеломляющий эффект в печально известном деле, рассказанном статистиком Target Эндрю Поулом, в котором Target manager столкнулся с разгневанным отцом, жалуясь на то, что его дочери-подростку отправляли буклеты купонов, предназначенных для беременных женщин. , Менеджер извинился, а отец ушел. Когда менеджер позвонил, чтобы продолжить, он с удивлением услышал, как отец извинился, обнаружив, что программное обеспечение Target для машинного обучения было правильным: его дочь была беременна.

По словам Поля, это был один из инцидентов, из-за которого Target начала скрывать эффективность своих алгоритмов машинного обучения. По словам Пула,

«Мы очень консервативны в отношении соблюдения всех законов о конфиденциальности. Но даже если вы следуете закону, вы можете делать то, что вызывает у людей тошноту. […] Затем мы начали смешивать все эти рекламные объявления о вещах, которые, как мы знали, беременные женщины никогда не купят, поэтому рекламные объявления выглядели случайными. […] И мы узнали, что, пока беременная женщина думает, что за ней не шпионят, она будет использовать купоны. Она просто предполагает, что все остальные в ее квартале получили одну и ту же почтовую программу для подгузников и детских кроваток. Пока мы не напугали ее, это работает.

Другими словами, алгоритмы таргетинга настолько мощны, что Target вынужден активно скрывать свою точность, чтобы не пугать клиентов. Эти алгоритмы могут оказать сильное влияние на то, что мы покупаем, и (при правильном использовании) они полностью невидимы.

Веб-рейтинг

Мы все время слышим о вещах, которые «находятся в тренде», «взрываются» или «становятся вирусными»

Обычно люди думают об этом как о органическом процессе. На первый взгляд они могут упускать из виду, что почти вся эта деятельность происходит на нескольких веб-сайтах.

: Google, Reddit, Twitter, Tumblr и Facebook. Большинство этих веб-сайтов используют варианты алгоритма машинного обучения для определения того, что вы делаете и чего не видите, и эти алгоритмы оказывают сильное влияние на то, какие истории становятся вирусными, а какие нет.

Для большинства этих сайтов алгоритмы, которые они используют для ранжирования контента, являются собственностью — коммерческой тайной.

В случае с Reddit алгоритм, используемый для контроля того, какие посты попадают на первую страницу, является чудовищно сложным, что является крайне неудачной попыткой усложнить игру. То же самое касается Twitter и Google. Все это немного тревожно, потому что этот материал может иметь большое значение.

По словам психолога Роджера Эпштейна, алгоритм Google PageRank может в одиночку определить исход более четверти президентских выборов в мире. Это большая сила в руках программного обеспечения.

Учитесь Любить Алгоритмы

Урок, который можно извлечь из всего этого, не паника. Некоторое время мы передавали мощность роботам — и, за некоторыми исключениями, мир, кажется, все еще идет довольно хорошо. У нас пока мало причин запасаться консервами и дробовиками.

Однако стоит знать, в какой степени эти алгоритмы влияют на вашу жизнь. Чьи интересы они представляют? Ваш выбор так же свободен, как они чувствуют?

Как вы думаете? Это программное обеспечение жуткое? Интересно? Дайте нам знать об этом в комментариях!

Авторы изображения: поза Марионеток через Shutterstock, рука робота через Shutterstock