ИИ побеждают: 5 раз, когда компьютеры бьют людей

Искусственный интеллект является границей информатики. Наука достаточно продвинулась, чтобы ИИ побеждал нас в нашей собственной игре — или, скажем так, в играх. Некоторые люди могут бояться подъема Скайнет

с каждым развитием ИИ, но мы немного более оптимистичны.

AlphaGo — это новейший ИИ, побеждающий человека в настольной игре, но он исходит из длинной родословной. Хотя эти пять машин начинались как специализированные программы, некоторые нашли вторую жизнь, которая выходит за рамки их первоначальных призваний.

В этой статье мы рассмотрим каждый раз, когда блестящий человек проигрывал компьютеру, и рассмотрим, что дало каждому из этих компьютеров его решающее преимущество.

1. Deep Blue, мастер по шахматам

IBM Deep Blue и Гарри Каспаров провели одну из первых громких битв между человеком и машиной. Каспаров, конечно, проиграл, но у них была немного сложная история.

После того, как Каспаров впервые победил младшего брата Deep Blue, Deep Thought, в 1989 году, IBM вернулась со своим новым и улучшенным Deep Blue в 1996 году. Каспаров проиграл вступительную игру, сыграл вничью, но затем выиграл три игры подряд, чтобы принять матч.

Лишь во втором матче-реванше в 1997 году Deep Blue обошел Каспарова, выиграв матч из шести игр за одну игру.

шахматы

Каспаров сказал, что он видел интеллект в игре Deep Blue и обвинил IBM во вмешательстве. «Интеллект» на самом деле был ошибкой, из-за которой Deep Blue действовал не по характеру. По сути, ИИ был довольно примитивным, грубо пробираясь сквозь возможные шаги и результаты …

… и если он не мог найти оптимальный выбор, он выбирал наугад.

Для каждого из своих шагов Deep Blue смоделировал все возможные ходы и ответы Каспарова. Он смог смоделировать до двадцати ходов вперед, оценивая миллионы возможных позиций в секунду. Для этого моделирования требовалось оборудование, способное к мощной параллельной обработке.

Параллельная обработка разбивает задачи на более мелкие вычислительные задачи и выполняет их одновременно. Полученные данные затем компилируются обратно для результата.

DeepBlueHardware

Между двумя матчами Deep Blue был предоставлен значительный апгрейд оборудования. Победившим оборудованием стала система с 30 узлами, работающая на платформе IBM Power PC. У каждого узла были вторичные процессоры, посвященные шахматным инструкциям.

,

Все вместе, Deep Blue имел 256 процессоров, работающих параллельно.

Есть потомки этого оборудования, работающие в центрах обработки данных, но истинное наследие Deep Blue — это Ватсон, чемпион Jeopardy. В конечном итоге IBM заставила Deep Blue заняться финансовым моделированием, добычей данных и поиском лекарств — во всех областях, где требуется крупномасштабное моделирование.

2. Polaris, чемпион по покеру

Университет Альберты создал Polaris, первого ИИ, победившего профессионалов покера на турнире. Исследователи выбрали вариант Техасского Холдема для своего ИИ, поскольку он меньше всего полагается на удачу.

Polaris дважды сражался с игроками в покер. Первый был в 2007 году против двух игроков. Руки были предварительно сданы — у Polaris был один набор карт при игре лицом к лицу с одним игроком и обратная рука при игре с другим игроком (для контроля на удачу).

Позже Polaris был переоборудован для турнира 2008 года против шести игроков. Это был также заранее подготовленный набор игр. Полярис получил ничью в первой игре и проиграл вторую, но в итоге выиграл турнир, уступив сзади и выиграв две игры подряд.

PolarisTeam

В отличие от шахмат, покер нельзя форсировать с помощью моделирования, потому что ИИ имеет ограниченную картину игры — он не имеет представления о руках своих противников.

Карточные сделки практически бесконечно уникальны, что делает моделирование еще менее эффективным. Одни и те же карты могут быть хорошей или бесполезной рукой, только в зависимости от других карт. Блеф представляет собой еще одну проблему для ИИ, поскольку одни только ставки не являются хорошим показателем силы рук.

Polaris — это комбинация нескольких программ, которые называются агентами. У каждой из этих программ была своя собственная стратегия, и был еще один агент, который мог бы выбрать, какая из них лучше всего подходит для любой раздачи.

Стратегии, используемые для разрушения игры в покер, разнообразны и требуют теории игр. Основная идея состоит в том, чтобы выяснить, какая лучшая стратегия каждого игрока будет основана на всех доступных данных, и Polaris добился этого с помощью техники, называемой bucketing.

покер

Bucketing используется для классификации карточных рук по силе. Это позволило Polaris сократить количество точек данных, необходимых для отслеживания игры. Затем он использовал вероятность всех других возможных ведер, выводя их из видимых карт.

У Polaris было уникальное аппаратное обеспечение: кластер из 8 компьютеров, каждый из которых имел 4 ЦП и 8 ГБ ОЗУ. Эти машины запускали симуляции, необходимые для создания групп и стратегий для каждого агента.

С тех пор Polaris превратилась в другую программу под названием Cepheus, став настолько продвинутой, что исследователи теперь объявили Техасский Холдем «слабо решенным».

Игры «решаются», когда алгоритмы могут определять исход игры с любой позиции. Игра «слабо решена», когда алгоритм не может объяснить несовершенную игру. Вы можете попытать счастья против Цефея здесь.

3. Уотсон, Гений Опасности

До этого момента победы ИИ были малозаметными играми, поэтому победа Уотсона является таким важным событием для обычных людей: Уотсон принес битву ИИ прямо в жилые комнаты Америки.

Jeopardy — это любимое игровое шоу, известное своими сложными викторинами, и оно имеет уникальную причуду: подсказки — это ответы, и участники должны задавать вопросы. Настоящим испытанием для Ватсона, в котором приняли участие известные чемпионы Jeopardy Брэд Раттер и Кен Дженнингс

Раттер был абсолютным чемпионом, и у Кена Дженнингса была самая длинная победная серия. Третья сторона выбрала случайный набор вопросов из более старых эпизодов, чтобы гарантировать, что вопросы не были написаны, чтобы помочь или использовать Уотсона.

Уотсон выиграл три игры подряд — одну тренировку и две телевизионные — но были некоторые странные причуды на некоторые ответы Уотсона. Например, сразу после того, как Дженнингс ответил на вопрос неправильно, Уотсон ответил тем же неправильным ответом.

Тем не менее, то, что сделало Ватсона уникальным, это его способность использовать естественный язык. IBM назвала это Deep QA, что означало «ответ на вопрос». Ключевым достижением стало то, что Уотсон мог искать ответы по контексту, а не только по релевантности ключевых слов.

Программное обеспечение представляет собой комбинацию распределенных систем. Hadoop и Apache UIMA работают вместе для индексации данных и позволяют различным узлам Watson работать вместе.

Уотсон

Как Deep Blue, Watson был построен на платформе IBM Power PC. Уотсон был 90-ядерным кластером с 16 ТБ оперативной памяти. Для игр Jeopardy все соответствующие данные были загружены и сохранены в оперативной памяти.

Какие релевантные данные? Ну, Уотсон имел доступ к полному тексту Википедии. Он имел множество словарей, тезаурусов, энциклопедий и других справочных материалов. У Уотсона не было доступа к Интернету во время игры, но все локальные данные составляли около 4 ТБ.

Совсем недавно Уотсон использовался для анализа и предложения вариантов лечения больных раком. Последнее предприятие Watson помогает создавать персонализированные обучающие приложения для детей. Есть даже попытки научить Ватсона готовить

!

4. Глубокий разум, самоучка

Google Deepmind может наконец дать ботаникам повод для беспокойства, потому что он побеждает людей в классических играх Atari

— ну, по крайней мере, некоторые игры. Человечество по-прежнему сохраняет свои преимущества в таких играх, как Asteroid и Gravitar.

Deepmind — это нейронная сеть AI. Нейронные сети — это ИИ, которые созданы, чтобы имитировать работу человеческого разума, создавая виртуальные «нейроны» с использованием компьютерной памяти.

Deepmind был в состоянии проанализировать каждый пиксель дисплея, принять решение о том, какое действие лучше предпринять, учитывая условия выигрыша, а затем ответить вводом контроллера.

AI изучал игры, используя вариант Q-Learning под названием Deep Learning. Это метод обучения, при котором ИИ сохраняет лучшее решение, принятое в определенной ситуации, а затем повторяет его, когда сталкивается с той же ситуацией.

Однако вариант Deepmind уникален, поскольку добавляет внешние источники памяти.

Аркада

Эта система хранения информации позволила Deepmind освоить шаблоны некоторых игр Atari и даже заставила ее самостоятельно находить оптимальную стратегию Breakout.

Почему Deepmind плохо работает в определенных играх? Из-за того, как судили о ситуациях. Оказывается, что Deepmind был способен анализировать только четыре кадра за раз, что ограничивало его способность перемещаться по лабиринтам или быстро реагировать.

Кроме того, Deepmind пришлось изучать каждую игру с нуля и не мог применять навыки из одной игры в другую.

5. Альфа Го, Невероятный

AlphaGo — еще один проект DeepMind, и он замечательный, потому что ему удалось победить двух профессиональных чемпионов по Го

— Фан Хуэй и Ли Седол — выиграв свои матчи 5: 0 и 4: 1 соответственно.

По словам игроков и комментаторов матчей, все они сказали, что ИИ играл консервативно, что неудивительно, потому что он был запрограммирован на то, чтобы отдавать предпочтение безопасным ходам, которые обеспечили бы победу над рискованными ходами, которые принесут больше очков.

Раньше считалось, что Го недосягаем для ИИ, но теперь Альфа-Го является первым ИИ, профессионально оцененным в игре.

В игре есть простая настройка: два игрока пытаются завоевать игровое поле с помощью белых и черных камней. Доска представляет собой сетку 19 x 19 с 361 пересечением, и расположение камней определяет территорию каждого игрока. Цель состоит в том, чтобы закончить с большим количеством территории, чем другие.

Количество потенциальных ходов и игровых состояний огромно, если не сказать больше. Да, гораздо больше, чем шахматы, если вам интересно.

Alpha Go использует ранее упомянутую систему глубокого обучения AI, что означает, что Alpha Go сохраняет память об играх, в которые она играла, и изучает их как опыт. Затем он просматривает их, выбирая вариант, который имеет наибольшее количество положительных потенциальных результатов.

Для запуска алгоритма, требующего больших вычислительных ресурсов, Alpha Go требуется много вычислительной мощности. Версия, в которой игрались матчи, работала на распределенном наборе серверов с общим количеством процессоров 1920 и 280 графических процессоров — огромная мощность, позволяющая 64 одновременных поисковых потока во время игры.

Как и Уотсон, DeepMind направляется в медицинскую школу. Deepmind объявил о партнерстве с Государственной службой здравоохранения Великобритании для анализа медицинских записей. Проект Streams поможет выявить пациентов, которым грозит повреждение почек.

Искусственный интеллект становится серьезным

Сейчас идет много исследований ИИ.

Google надеется, что AI сможет помочь их поисковому бизнесу. Проект под названием Rankbrain стремится использовать ИИ для повышения эффективности Page Rank. Microsoft и Facebook выпустили чат-ботов. Tesla является лидером в своем автоматическом режиме вождения, а Google отстает от своих автомобилей.

Futurebot

Может быть трудно увидеть связь между этими проектами и обучением ИИ побеждать в играх, но каждый из этих ИИ определенным образом сформировал машинное обучение.

По мере развития области это позволило ИИ работать с более сложными наборами данных. Те почти бесконечное число ходов в Го могут привести к почти бесконечному числу переменных на открытой дороге. Так что на самом деле, эти игры — это только начало — фаза практики, если хотите.

Действительно интересные вещи не за горами, и вполне возможно, что мы сможем испытать все это из первых рук.

Что тебя волнует в искусственном интеллекте? Считаете ли вы, что ИИ в конечном итоге не сможет победить? Дайте нам знать об этом в комментариях.

Изображение предоставлено: Дэвид Пейси через Flickr, Дебби Мизель через IBM, CPRG через Университет Альберты, «Игра среди друзей», Паф через Flickr, Мистер Себ через Flickr, Мэтт Браун через Flickr, Джигуан Ван через Flickr

Ссылка на основную публикацию
Adblock
detector