В отыскивании нужной информации в Сети мы время от времени кроме того не вспоминаем о том, что львиная часть контента на многих сайтах и в блогах генерируется машинально. Метод несложен: значительно чаще программа выдёргивает данные на одну тему из различных источников, по окончании чего пропускает её через синонимайзер, так заменяя уникальный текст на “собственный”. Конечно же, делается это в целях оптимизации посещаемости того либо иного ресурса, а такие сайты именуются “сплогами”, либо, в случае если расшифровать это обозначение, “спам-блогами”.
Пример работы синонимайзера. Любой абзац – одинаковый текст, переписанный машинально
на данный момент обращение отправится не о них, но начали мы с них вследствие того что, в сущности, как раз сплоги являются несложным примером неестественного нарратива – другими словами машинально генерируемого повествования. То, что получается в итоге, само собой разумеется, достаточно смешно, да и цели, каковые преследуют оптимизаторы, не очень благие – “серое” продвижение сайта, так что не будем продолжительно на этом задерживаться.
Но более продвинутые разработки, родственные генераторам контента в сплогах, способны на большое количество большее – к примеру, действенно заменять труд журналистов-новостников.
Narrative Science
Разработка, созданная стартапом Narrative Science, вправду разрешает осуществить мечту любого главреда: сделать так, дабы новости были написаны вовремя, как следует и фактически безвозмездно. Она разрешает генерировать осмысленные тексты на базе информации, имеющейся в сети. В отличие от автогенераторов, которыми пользуются обладатели сплогов, это ПО не просто выдирает по абзацу оттуда-отсюда и прогоняет их через синонимайзер, а проделывает работу, схожую с той, которую осуществляет настоящий новостник. Оно верно подбирает вспомогательные факты к новости и выстраивает повествование в верном порядке.
Принцип работы программы достаточно несложен. Для неё имеется множество шаблонов на все случаи судьбы. В статье New York Times приводится пример, где она пробует сделать обзор футбольного матча. ПО выделяет термины и определённые фразы, каковые смогут характеризовать этот матч. Затем, выяснив для себя главную тему новости (скажем, “такая-то команда победила у второй”), программа начинает “обвешивать” её дополнительными фактами, ищет, сколько матчей было в чемпионате, сколько было побеждено либо проиграно, и т.д.
В случае если метод приобретает сведения о том, что команда уже побеждала в этом сезоне, то строки, обрисовывающая это событие, будет гласить: “Это уже третья их победа в этом сезоне”. В случае если же до этого были одни проигрыши, то в тексте статьи смогут показаться строки: “по окончании череды поражений команда победила собственный первый матч в сезоне”. В общем, как программа обрабатывает факты, должно быть ясно.
Не следует думать, что всё это – только передовая разработка с вызывающим большие сомнения будущим. Уже в 2011 году её применяли в Fox семь дней для автоматических отчётов о спортивных событиях.
Всё это превосходно, но не закрадывается ли идея, что таковой подход к подаче информации в двадцать первом веке пара неправилен? Структурировать данные и подавая её в виде “стенки текста”, как живые новостники, так и программные, оказывают читателям медвежью услугу. Так как в данной простыне текста приходится разбираться как раз им. Не логичнее ли подавать новости как интерактивную инфографику, как уточнение к уже имеющимся фактам?
Но, не всегда такое представление данных есть оптимальным. Время от времени легче прочесть пособие, написанное людской языком, чем, скажем, разбираться в развесистых таблицах с кучей цифр.
Автоматические книги Фила Паркера
Книги Фила Паркера превосходно продаются в магазине Amazon. Наряду с этим он не написал фактически ни одной из них. Эти книги не художественные – все они посвящены статистике. Паркер, умелый экономист, применяет особые методы, каковые берут статистику и превращают их в простое и понятное человеку повествование.
Фил Паркер
Он утвержает, что ничего сложного в разработке таких методов нет. В первой половине 90-ых годов XX века он трудился над отчётами, в которых было необходимо очень многое проанализировать. Тогда Паркер понял, что работа экономиста в полной мере подчиняется определённым формулам.
Он уверен в том, что ему и его экспертам удалось создать совокупность, которая имитирует работу людской разума. Но, увы, данный метод годится лишь для таких литературных жанров, как статистика. Как говорит сам Паркер, время от времени издатели сами выдают писателям инструкцию, как писать такие книги. Так из-за чего бы просто не научить программу выполнять эти инструкции?
Методы, созданные за 2-3 года, разрешают генерировать хорошую книгу приблизительно за 30 мин.. Дальше книга, очевидно, проходит редактуру – и готово. Поразмыслите над данной цифрой: Паркер опубликовал 1 000 050 книг согласно данным статистики применяя только метод.
Кстати, возвращаясь к прошлой теме, посвящённой написанию новостей, Паркер подмечает, что и блогеров возможно нормально заменить автомобилями. “Блогеры просматривают, скажем, три различных статьи, страничку в “Википедии”… Их нормально возможно заменить компьютерными методами, поскольку они делают задачи, каковые возможно обрисовать формулами”, – говорит он. Однако тут же он обращается к интервьюеру и говорит, что вот его работу нельзя заменить методом, поскольку работу настоящего журналиста нельзя заменить формулами.
Нескончаемое приключение имени Владимира Проппа
В 2011 году в Микрософт Research начали разрабатывать приложение называющиеся Infinite Adventure Machine. Предположительно, если бы создатели Narrative Science объединили силы с Микрософт Research, то у нас бы уже было как раз то, о чём грезит всё прогрессивное человечество: программа, которая сама может генерировать художественные тексты.
Infinite Adventure Machine трудится по правилам, заложенным Владимиром Проппом. Он создал способ, которым возможно разбить повествование в фольклорных историях и сказках на функции и стандартных персонажей.
IAM не раскладывает готовые сказки на функции, она, напротив, генерирует неотёсанный набросок сказки, поделённый на пара сцен. Случайным образом переставляя 31 функцию повествования, обрисованную Проппом, приложение образовывает из них случайные комбинации (но, руководствуясь определёнными правилами).
На экране показывается этап нарратива и иллюстрация сцены. При перезагрузке история получает совсем другой вид. Ясно, что комбинаций у 31 элемента возможно весьма и довольно много.
Куда податься живому писателю
У прочитавшего об этих проектах может сложиться чувство, что не так долго осталось ждать журналисты и живые писатели по большому счету не будут необходимы и всё закончится тем, что программы будут писать сценарии для фильмов (но, в некоторых случаях это кроме того к лучшему). Но, не обращая внимания на стремительное внедрение этих разработок, запас времени у людей имеется.
Нетрудно представить ситуации, в то время, когда такие программы будут не соперничать с живыми писателями, а помогать им при творческого застоя. К примеру, зная логику персонажей и повествования, предлагать человеку варианты развития сюжета, быть может, кроме того и делать неотёсанные наброски текста (что, конечно же, всё равняется нужно будет дописывать и править). Так или иначе, любой механический труд, что может делать машина, должен быть поручен машине, человек же обязан заниматься тем, что получается лишь у него одного: мыслить.