Использование искусственного интеллекта для кастомизации контента

На наших глазах сбывается давняя мечта ленивых копирайтеров — появилась кнопка «сделать красиво». А также «написать креативно» и «сочинить музыку для фона». И всё это благодаря происходящей прямо сейчас нейросетевой революции в производстве контента, которая кардинально меняет рынок. Ветер нейросетевых перемен грозит оставить без работы десятки специалистов, которые ещё вчера чувствовали себя спокойно и уверенно. Давайте попробуем разобраться с основными «фронтами» этой революции.

Согласно Global AI Adoption Index 2021 от IBM, 80% компаний и брендов либо уже используют, либо планируют внедрить решения на базе искусственного интеллекта в свой стэк маркетинговых технологий. В России сейчас к ИИ-инструментам относятся с осторожностью. Но это вопрос времени, так как всё чаще стали появляться кейсы, которые доказывают, что коэффициент полезного действия при работе с нейросетями высокий.

Инструменты и помощь в кастомизации контента

Есть несколько очевидных направлений работы нейросетей с контентом, которые можно разделить на ключевые типы: видео, аудио, текст и изображения. В потоке социальных сетей мы прежде всего видим два из них — визуальный (создание изображений и видео) и текстовый.

Самые популярные нейросети для создания визуалов — Midjourney и Stable Diffusion, но есть множество конкурентов, в том числе в России, например Kandinsky от Сбер (это улучшенная версия мультимодальной нейросети ruDALL-E, которая генерирует картинки по описанию на русском языке).

Явным лидером среди текстовых можно назвать ChatGPT от компании OpenAI, в которую Microsoft в этом году инвестировал $10 млрд.

Microsoft анонсировал новые версии поисковика Bing и браузера Edge на основе искусственного интеллекта. В этих программах добавят возможность интерактивного поиска с помощью оптимизированной версии ChatGPT, при этом разработчики, по сути, переосмыслили пользовательский опыт: объединили поиск, просмотр веб-страниц и чат в единое целое и оптимизировали таким образом скорость и качество получаемых ответов.

Перечисленные выше инструменты легко использовать для создания и кастомизации любого контента. Предположим, вам нужно сделать пост о новом продукте компании для нескольких социальных сетей и пары-тройки СМИ. Вы можете написать текстовую основу, которую далее с помощью ChatGPT легко перепишете 5, 10 или 15 раз, меняя подачу, акценты и стилистику.

Или, например, у вас сеть кофеен и вы хотите объявить об акции к празднику. В Telegram вы напишете короткий пост о самой акции, а на сайте и в других источниках (Дзен, блог на vc и т. д.) можете подать эту тему совершенно по-другому, используя возможности нейросетей. У ChatGPT можно запросить подборку традиционных праздничных кофейных напитков для разных стран, получить текст и использовать его в качестве врезки на сайте, а в Дзене — как основную тему материала, нативно встроив информацию об акции.

А с помощью технологий генеративно-состязательных сетей, создающих изображения по текстовым описаниям, вы получите абсолютно любое количество картинок для иллюстрации ваших текстов. При этом их создание займёт не много часов, а 15–20 минут. Эти картинки с помощью добавления нескольких уточняющих слов без труда будут стилизованы под работы любого известного вам художника или фотографа.

Важно помнить, что, помимо популярных и находящихся постоянно на слуху нейросетей, есть сотни других, которые контент-мейкеры могут использовать как удобный и быстрый инструмент под конкретные нужды: сделать из обычной аудиозаписи практически студийного качества звук, высокоточно сделать AI-перевод, убрать фон на изображении, улучшить размер и качество изображения, создать эффектную презентацию и решить ещё множество повседневных задач.

Deepfake-технология и цифровые копии

Deepfake-технология активно проникает в digital-индустрию в формате видеоконтента: рекламные ролики, кино, сериалы и т. д. Бренды уже сейчас могут заполучить в свои кампании абсолютно любого персонажа, инфлюенсера, актёра, учёного, подключив возможности ИИ.

Если у вас есть цифровая копия определённого персонажа, то вы можете заниматься бесконечной кастомизацией контента на разные площадки. Актёра не нужно приглашать на съёмки, регулярно платить гонорар и выполнять условия райдера. Достаточно подключить нейросети и команду из нескольких технических специалистов. Например, у вас есть бренд шоколада. В ТикТоке в течение 15 секунд про ваш продукт может рассказывать Роберт Паттинсон, во ВКонтакте Киану Ривз сделает распаковку разных вкусов, а в Одноклассниках Арнольд Шварценеггер душевно ответит на все вопросы о составе продукта. Таким образом, вы охватите несколько площадок, подстроив контент под ЦА, цели и задачи.

Огромное пространство для творчества технология открывает в сфере образования — школьную программу по литературе может рассказать кумир школьников Влад А4, а для людей более взрослых можно «пригласить» Жан-Поля Бельмондо. Владимир Маяковский лично и в великолепном качестве прочитает свои лучшие стихотворения, а театралы смогут насладиться новыми спектаклями Иннокентия Смоктуновского. Безусловно, всё это возможно только при согласии и одобрении правообладателей или наследников знаменитости.

Но судя по наметившейся тенденции среди голливудских звёзд создавать раз в год свои высококачественные цифровые копии, они совсем не прочь позагорать у бассейна, пока цифровой двойник зарабатывает им деньги, снимаясь в очередной рекламе премиального авто.

Увеличение скорости публикации контента и оптимизация маркетингового бюджета

Человечество ещё со времён промышленной революции волнует вопрос, возможна ли полная замена специалистов машинами. Текущая нейросетевая революция вновь вывела на арену споры относительно этики, авторского права и потери рабочих мест. В каком-то смысле мы наблюдаем возрождение луддитов: специалисты, находящиеся под угрозой проигрыша программным продуктам активно сопротивляются этому давлению. В США группа художников подала коллективный иск к компаниям Stability AI Ltd., Midjourney Inc. и DeviantArt Inc. за использование защищённых авторским правом изображений для обучения искусственного интеллекта. Чем закончится этот процесс мы пока не знаем, но он однозначно значительно повлияет на будущее технологии.

При этом угроза исчезновения массы рабочих мест явно преувеличена. На сегодняшний день полностью делегировать работу с креативными задачами искусственному интеллекту нельзя, этот процесс невозможен без человека. Пока что речь идёт об оптимизации творческого процесса, сокращении смен некоторых специалистов и контент-команд, уменьшении времени их работы. Если приглядеться, нейросети, наоборот, дают специалистам новые возможности, которых у них не было ещё вчера.

Возьмём в пример копирайтинг. Копирайтер, освоивший несколько нейросетей, может выполнять функции дизайнера, монтажёра и даже саунд-продюсера. Если раньше над разными медиаформатами работало множество специалистов и на создание одного поста порой требовалось несколько часов или целый рабочий день, сейчас один специалист, вооружившись нейросетями, может сделать большую часть работы самостоятельно. Но human touch всё ещё играет роль. Поэтому, какими бы качественными и исчерпывающими ни были процессы ИИ, они потребуют корректировок и более существенной персонализации (в зависимости от кейса).

Нейронные сети не способны на творчество в привычном понимании. То есть технически ИИ не может ничего придумать. Соответственно, в сферах, где необходимо творчество и креатив, он может использоваться как инструмент для помощи в генерации новых идей. «Живой» арт станет в будущем чем-то выделяющимся и, соответственно, более дорогим. Отдельная, неподвластная компьютеру сущность — индивидуальный стиль, присущий любому хорошему художнику.

Аудио и подкасты — отдельная строка

В сентябре 2020 года портал «Рамблер» внедрил в свои подкасты технологии искусственного интеллекта и запустил «<Техно_субботу>». Основного ведущего подменяет робот Валера, который при помощи text-to-speech зачитывает новости из мира технологий, рассказывает о научных прорывах, исследованиях и отраслевых прогнозах. Технология синтеза речи и её внедрение в подкасты позволяет автоматизировать процесс производства выпусков и вывести процессы на новый уровень.

Существуют приложения и боты для озвучки. Наиболее популярным русскоязычным ботом в Telegram можно назвать Silero , который позволяет вводить текст и получать озвучку голосами разных персонажей, профессиональных дикторов и простых людей.

На данный момент процесс синтеза речи искусственным интеллектом всё ещё не идеален. Часто встречаются ошибки в ударениях, паузах, интонациях и произношении отдельных групп слов. Но это вопросы времени, так как технология довольно гибкая и быстро развивающаяся.

Сейчас одновременно разрабатываются и выводятся на рынок множество продуктов по генерации голоса, которые можно использовать при создании подкастов. С другой стороны, это ещё и возможности для манипуляции и скандалов. Урегулирование вопросов касательно ИИ существенно отстаёт от стремительного развития самих технологий.

Как будет выглядеть процесс создания контента даже в не очень далёком будущем, предсказать сложно. Наиболее вероятным путём станет появление универсальных специалистов, освоивших множество нейросетей и умеющих выстраивать их работу в нужную последовательность. Нужен ролик? Собираем «команду проекта». За арт-дизайн будет отвечать нейросеть Midjourney, за диалоги и сюжет — GPT-3, за саундтрек — Soundover, а за голос рассказчика — Replica. Хотим текст? Вот вам другой алгоритм. А у нас наконец-то появится время выспаться.