Познакомьтесь с роботом, который пытается устроиться на мою работу

Содержание

1 Как выглядит враг
- 1.1 составитель чужих речей
- 1.2 Рассказ Наука
2 Как робот пишет контент?
- 2.1 Управляемый данными подход
3 Что дальше для роботов?
4 Почему я пока не меняю карьеру
- 4.1 Ограничения алгоритмического письма
5 Будущее робо-журналистики: предостерегающая история

Эта статья не была написана роботом — но следующая, которую вы прочитали, могла быть.

Роботы уже в наших рядах, и вы можете быть удивлены тем, что они могут сделать. Роботы сообщают о землетрясениях, спорте и пишут огромное количество статей в Википедии. Скорее всего, вы уже прочитали статьи, написанные полностью роботами, не осознавая этого.

У меня такие смешанные чувства по этому поводу. С одной стороны, я технический журналист, а ИИ потрясающий

, Я в восторге от крутого и футуристического

— Мне нравится идея, когда машины ставят людей на свои места и заменяют грязные мешки с мясом холодным, безжалостным, эффективным кремнием.

С другой стороны, я технический журналист. Я пишу слова за деньги. Я люблю свою работу. Никто другой не позволит мне разгуливать Википедию по четыре часа в день и называть это карьерой. Так что идея устаревания устрашает. Сейчас роботы не очень хороши в том, что я делаю. Эти алгоритмы могут действительно сделать лишь несколько вещей. Но они не останутся такими навсегда.

Поэтому, пожалуйста, оставайтесь там со мной, пока я пытаюсь закончить эту часть, прежде чем меня заменят скриптом bash.

Как выглядит враг

Прямо сейчас враг приходит в виде двух основных программных библиотек: составитель чужих речей, Automated Insights, и Рассказ Наука, технология, созданная (частично) Школой журналистики, СМИ и интегрированных маркетинговых коммуникаций Northwestern Medill.

Ирония школы журналистики, создающей технологию, которая заменит себя, не потеряна для меня.

Робот, к счастью, еще не выяснил, как работает ирония.

составитель чужих речей

Wordsmith принадлежит Automated Insights, компании, основанной генеральным директором Робби Алленом после того, как он покинул Cisco, чтобы работать над проектом, сочетающим его страсть к письму, науке и спортивному анализу. Этот проект стал известен как StatSheet и предназначался для того, чтобы превратить обширные данные и спортивные показатели в читаемые фрагменты контента с заранее запрограммированным повествованием. По словам Аллена,

«Традиционный подход к найму многих писателей не был привлекательным для меня […] Что удивительно в спортивных резюме, так это то, что 90 процентов того, что вы делаете, пишут о цифрах».

Этот алгоритмический подход выделяется в нескольких конкретных областях, таких как создание резюме игр в фэнтези-футбол для миллионов пользователей Yahoo или превращение баллов в игровое резюме в Associated Press (AP).

Алгоритм StatSheet работал настолько хорошо, что Робби Аллен начал искать другие вертикали с большим объемом данных, в которых можно было бы использовать программу. После изменения названия на Wordsmith Аллен начал настраивать программу для работы с ведущими отраслями, такими как финансы. Цель состояла в том, чтобы превратить электронные таблицы, отчеты о доходах и, конечно же, спортивные результаты, в читаемые фрагменты контента, которые не требуют помощи человека.

Рассказ Наука

Там, где Automated Insights смиренно подходит к тому, на что способна его программа — Wordsmith, Narrative Science определенно более амбициозна. Технический директор и соучредитель Кристиан Хаммонд предсказывает, что компьютеры будут отвечать за написание более 90 процентов всех новостей

в течение следующих 15 лет.

Высокомерие? Мания величия? Называйте это как хотите, но поскольку вы выбираете формулировку, важно отметить, что некоторые аналитики в этой отрасли предсказывают, что компьютер может получить Пулитцеровскую премию за журналистику в течение ближайших 20 лет.

Кристиан Хаммонд не согласен.

Он думает, что это произойдет в течение пяти.

«Через пять лет компьютерная программа получит Пулитцеровскую премию — и я буду проклят, если это не наша технология».

Как робот пишет контент?

Хантер С. Томпсон классно сочинял романы под влиянием почти смертоносных доз виски, кокаина и ЛСД, но, похоже, автору контента будущего, возможно, понадобится лишь немного места на полке и выход.

Прежде чем приступить к практическому применению, важно понять, что эти программы имеют ограничения. Обе вышеупомянутые компании и их алгоритмы в настоящее время способны создавать отчеты, основанные только на данных, в таких областях, как спорт и финансы. Если это количественная индустрия, движимая цифрами, робот, вероятно, справится с этим.

— но вы не будете видеть блоги мамы с алгоритмическим содержанием в ближайшем будущем.

Управляемый данными подход

Во-первых, алгоритм собирает данные из качественных источников. Затем он вписывает эти данные в общее понимание предмета. Например, большинство голов в хоккейной игре выигрывают, или более высокий заработок, чем в прошлом квартале, хороши. Оттуда он может превратить эти данные в контент, пригодный для потребления человеком.

Алгоритм опирается на команду мета-писателей, которые являются подготовленными журналистами, которые создают шаблоны для работы алгоритма. Эти шаблоны стандартизированы как по форме, так и по тонкому использованию языка в высокотехнологичных отраслях промышленности, и содержат как собственный словарь, так и отраслевой жаргон, что делает робота звучать более человечно.

После того, как робот проанализирует данные, он найдет способы вставить их в один из этих предварительно созданных шаблонов, чтобы создать описательную часть, которая намеревается соответствовать одному из нескольких предварительно определенных стилей (боковой репортер, финансовый аналитик и т. Д.).

Это не всегда правильно, но неудачи становятся редкостью. Оба упомянутых алгоритма имеют меры предосторожности, чтобы предупредить людей о возможных неточностях в данных перед составлением статьи. Например, увеличение прибыли на 1200% компанией Fortune 500 может быть красным флагом — то же самое для бейсбольного матча, который заканчивается ничьей.

Что дальше для роботов?

Оба алгоритма хороши в том, что они делают. На самом деле, есть десятки таких, как они, которые могут делать что угодно, хотя, насколько хорошо они на самом деле это делают, мы будем продолжать обсуждать.

Следующий логический шаг — настроить алгоритмы, чтобы заняться другими нишами; шаг, который уже находится в работах Narrative Science. После довольно успешного вторжения в финансы и спорт, Narrative Science теперь переходит к пищевой сфере, создавая короткие посты в виде списков, основанные на обзорах, написанных как людьми, так и профессиональными критиками.

Алгоритм был доработан, чтобы определить, как выбрать качественный ресторан. Такие вещи, как результаты опросов Zagat (и других), заметки об обслуживании, качестве продуктов питания и цитаты клиентов, составленные на основе Yelp, обзоров Google Places и других. Затем эти данные попадают в шаблонный процесс для создания коротких, легко усваиваемых записей в списке, таких как «10 лучших пиццерий в Сан-Диего» или «Лучшие суши в Дубае».

Оттуда небо — предел. Прямо сейчас речь идет о поиске новых ниш и поиске способов редактирования алгоритма для работы с новыми наборами данных. Кроме того, эти алгоритмы становятся более человечными, поскольку они лучше понимают данные, в которых они несут ответственность за анализ.

Почему я пока не меняю карьеру

Ограничения алгоритмического письма

Эти роботы-журналисты превосходны

в областях, где данные рассказывают историю. Это проблема в большинстве ниш, поскольку во многих случаях данные — не единственная история. Даже в одной из областей, где эти алгоритмы производят адекватный контент — бейсбол, — история часто больше, чем сумма чисел из девяти иннинговых соревнований.

Хотя робот более чем способен рассказать нам, кто победил, а также определить и сообщить ключевые факты, они не способны распознать тонкие нюансы, которые действительно рассказывают историю. Плохой прыжок на летающем шаре, который привел к двойному результату, сингл-удар, который, как показал повтор, показался фолом — это все детали, на которые опирается репортер-битник, чтобы создать убедительную историю. Именно из-за этих нюансов любители спорта смотрят игры, но они в значительной степени качественные и выходят за рамки современного машинного обучения.

Как технический писатель, моя работа безопасна

(на данный момент), просто потому что — за пределами прославленной спецификации — робот не может действительно рассказать всю историю. Они не могут сказать вам, что пользовательский интерфейс чувствует себя неуклюже, или как некоторые устройства чувствуют, когда вы держите их. Они не могут сформировать мнение, используя неполные данные, и они, конечно, не могут проверить вещи лично.

Хорошие писатели преуспевают, делая то, что трудно автоматизировать. Мы думаем на ногах, адаптируемся к меняющейся информации и заполняем пробелы, используя источники, неполные данные и опыт, чтобы рассказать историю.

Короче говоря, мы можем мыслить не по принципу «по цифрам» вашего среднего алгоритма.

Будущее робо-журналистики: предостерегающая история

В журналистике есть идея, что после десятилетий опыта написания определенной темы репортер иногда настолько приучается, что становится своего рода человеком Ролодексом. Репортер Rolodex может просто изменить несколько подробностей вокруг и затем написать точно такую же историю, которую они написали тысячу раз, без следа мысли или понимания. Это предостерегающая история, которая звучит особенно верно сегодня.

Для производителей контента, которые полагаются на подход Rolodex; ваши дни сочтены.

Формульные подходы к написанию и записи, которые содержат кучу данных, будут первыми. Роботы в этом лучше, чем вы, и вам не понадобится много времени, чтобы автоматизировать этот вид бездумного пространства, заполненного космосом. Для остальных из нас ситуация сложнее. На каком-то уровне я хочу списать достижения наших новых повелителей роботов

как трюки на естественном языке. Тем не менее, футурист во мне не может поверить, что технология не улучшится.

Большинство хороших журналистов пока в безопасности, но мы не должны забывать, что эти алгоритмы все еще находятся в зачаточном состоянии. Это не совсем вне возможности предположить, что они станут лучше и более способны улавливать тонкие нюансы, которые делают писателей-людей, ну, в общем, людьми.

Тогда возникает вопрос качества. Качество не очень хорошее, но и неплохое. Вы должны спросить себя: насколько это кого-то волнует? В то время как многие из нас ценят хорошее письмо, остается открытым вопрос, готовы ли массы более чем довольствоваться «достаточно хорошим».

Я, например, скептически отношусь к тому, что роботы могут делать то, что я делаю, в ближайшее время. Я буду есть мои слова однажды? Это еще предстоит выяснить. Но скажи Скайнету, что я не пойду без боя.

Как вы думаете, роботы могут заменить человеческих журналистов в ближайшем будущем? Выключите звук в комментариях ниже. Я бы хотел узнать ваше мнение об этом надвигающемся столкновении человека и машины.

Авторы изображения: человеческая голова через Shutterstock, мистер Робот имеет немного оперативной памяти от Криса Ишервуда, автор контента от Ritesh Nayak, робот FREE HUGS от Ben Husmann с помощью Flickr, силуэт человеческой головы с двоичными кодами через Shutterstock