Содержание
Эта статья не была написана роботом — но следующая, которую вы прочитали, могла быть.
Роботы уже в наших рядах, и вы можете быть удивлены тем, что они могут сделать. Роботы сообщают о землетрясениях, спорте и пишут огромное количество статей в Википедии. Скорее всего, вы уже прочитали статьи, написанные полностью роботами, не осознавая этого.
У меня такие смешанные чувства по этому поводу. С одной стороны, я технический журналист, а ИИ потрясающий
, Я в восторге от крутого и футуристического
— Мне нравится идея, когда машины ставят людей на свои места и заменяют грязные мешки с мясом холодным, безжалостным, эффективным кремнием.
С другой стороны, я технический журналист. Я пишу слова за деньги. Я люблю свою работу. Никто другой не позволит мне разгуливать Википедию по четыре часа в день и называть это карьерой. Так что идея устаревания устрашает. Сейчас роботы не очень хороши в том, что я делаю. Эти алгоритмы могут действительно сделать лишь несколько вещей. Но они не останутся такими навсегда.
Поэтому, пожалуйста, оставайтесь там со мной, пока я пытаюсь закончить эту часть, прежде чем меня заменят скриптом bash.
Как выглядит враг
Прямо сейчас враг приходит в виде двух основных программных библиотек: составитель чужих речей, Automated Insights, и Рассказ Наука, технология, созданная (частично) Школой журналистики, СМИ и интегрированных маркетинговых коммуникаций Northwestern Medill.
Ирония школы журналистики, создающей технологию, которая заменит себя, не потеряна для меня.
Робот, к счастью, еще не выяснил, как работает ирония.
составитель чужих речей
Wordsmith принадлежит Automated Insights, компании, основанной генеральным директором Робби Алленом после того, как он покинул Cisco, чтобы работать над проектом, сочетающим его страсть к письму, науке и спортивному анализу. Этот проект стал известен как StatSheet и предназначался для того, чтобы превратить обширные данные и спортивные показатели в читаемые фрагменты контента с заранее запрограммированным повествованием. По словам Аллена,
«Традиционный подход к найму многих писателей не был привлекательным для меня […] Что удивительно в спортивных резюме, так это то, что 90 процентов того, что вы делаете, пишут о цифрах».
Этот алгоритмический подход выделяется в нескольких конкретных областях, таких как создание резюме игр в фэнтези-футбол для миллионов пользователей Yahoo или превращение баллов в игровое резюме в Associated Press (AP).
Алгоритм StatSheet работал настолько хорошо, что Робби Аллен начал искать другие вертикали с большим объемом данных, в которых можно было бы использовать программу. После изменения названия на Wordsmith Аллен начал настраивать программу для работы с ведущими отраслями, такими как финансы. Цель состояла в том, чтобы превратить электронные таблицы, отчеты о доходах и, конечно же, спортивные результаты, в читаемые фрагменты контента, которые не требуют помощи человека.
Рассказ Наука
Там, где Automated Insights смиренно подходит к тому, на что способна его программа — Wordsmith, Narrative Science определенно более амбициозна. Технический директор и соучредитель Кристиан Хаммонд предсказывает, что компьютеры будут отвечать за написание более 90 процентов всех новостей
в течение следующих 15 лет.
Высокомерие? Мания величия? Называйте это как хотите, но поскольку вы выбираете формулировку, важно отметить, что некоторые аналитики в этой отрасли предсказывают, что компьютер может получить Пулитцеровскую премию за журналистику в течение ближайших 20 лет.
Кристиан Хаммонд не согласен.
Он думает, что это произойдет в течение пяти.
«Через пять лет компьютерная программа получит Пулитцеровскую премию — и я буду проклят, если это не наша технология».
Как робот пишет контент?
Хантер С. Томпсон классно сочинял романы под влиянием почти смертоносных доз виски, кокаина и ЛСД, но, похоже, автору контента будущего, возможно, понадобится лишь немного места на полке и выход.
Прежде чем приступить к практическому применению, важно понять, что эти программы имеют ограничения. Обе вышеупомянутые компании и их алгоритмы в настоящее время способны создавать отчеты, основанные только на данных, в таких областях, как спорт и финансы. Если это количественная индустрия, движимая цифрами, робот, вероятно, справится с этим.
— но вы не будете видеть блоги мамы с алгоритмическим содержанием в ближайшем будущем.
Управляемый данными подход
Во-первых, алгоритм собирает данные из качественных источников. Затем он вписывает эти данные в общее понимание предмета. Например, большинство голов в хоккейной игре выигрывают, или более высокий заработок, чем в прошлом квартале, хороши. Оттуда он может превратить эти данные в контент, пригодный для потребления человеком.
Алгоритм опирается на команду мета-писателей, которые являются подготовленными журналистами, которые создают шаблоны для работы алгоритма. Эти шаблоны стандартизированы как по форме, так и по тонкому использованию языка в высокотехнологичных отраслях промышленности, и содержат как собственный словарь, так и отраслевой жаргон, что делает робота звучать более человечно.
После того, как робот проанализирует данные, он найдет способы вставить их в один из этих предварительно созданных шаблонов, чтобы создать описательную часть, которая намеревается соответствовать одному из нескольких предварительно определенных стилей (боковой репортер, финансовый аналитик и т. Д.).
Это не всегда правильно, но неудачи становятся редкостью. Оба упомянутых алгоритма имеют меры предосторожности, чтобы предупредить людей о возможных неточностях в данных перед составлением статьи. Например, увеличение прибыли на 1200% компанией Fortune 500 может быть красным флагом — то же самое для бейсбольного матча, который заканчивается ничьей.
Что дальше для роботов?
Оба алгоритма хороши в том, что они делают. На самом деле, есть десятки таких, как они, которые могут делать что угодно, хотя, насколько хорошо они на самом деле это делают, мы будем продолжать обсуждать.
Следующий логический шаг — настроить алгоритмы, чтобы заняться другими нишами; шаг, который уже находится в работах Narrative Science. После довольно успешного вторжения в финансы и спорт, Narrative Science теперь переходит к пищевой сфере, создавая короткие посты в виде списков, основанные на обзорах, написанных как людьми, так и профессиональными критиками.
Алгоритм был доработан, чтобы определить, как выбрать качественный ресторан. Такие вещи, как результаты опросов Zagat (и других), заметки об обслуживании, качестве продуктов питания и цитаты клиентов, составленные на основе Yelp, обзоров Google Places и других. Затем эти данные попадают в шаблонный процесс для создания коротких, легко усваиваемых записей в списке, таких как «10 лучших пиццерий в Сан-Диего» или «Лучшие суши в Дубае».
Оттуда небо — предел. Прямо сейчас речь идет о поиске новых ниш и поиске способов редактирования алгоритма для работы с новыми наборами данных. Кроме того, эти алгоритмы становятся более человечными, поскольку они лучше понимают данные, в которых они несут ответственность за анализ.