September 28, 2023

Использование AI в digital-маркетинге. Часть 1 | Mobio

Использование AI в digital-маркетинге. Часть 1

Нейронные сети незаметно, но плотно вошли в нашу повседневную жизнь. И теперь трудно назвать область человеческой деятельности, которая обходится без использования технологий AI. Идентификация личности, автоматический трейдинг, визуализирующая диагностика в медицине, обучаемые автопилоты, анализ сейсмических данных, восстановление архивных материалов, оценка эффективности персонала в компаниях, расчет стоимости ценных бумаг, прогнозирование климатических и социальных изменений — перечень можно продолжать долго.

Естественно, что маркетинг и создание рекламы не остались в стороне от технического прогресса. И активно используют все возможности нейронных сетей. В интернет-маркетинге AI применяется для улучшения результатов выдачи в соцсетях и поисковых системах, для показа наиболее релевантного контента и рекламных сообщений пользователям, мониторинга и анализа рынка, отслеживания поведения целевой аудитории и так далее. Нейронные сети помогли маркетинговым командам избавиться от сложной многомерной или монотонной рутинной работы и сделать ее быстрее и эффективнее.


Сегодня одной из самых популярных тем применения AI в маркетинге является обсуждение GAN. Генеративно-состязательные сети — это класс фреймворков глубокого обучения со структурой генеративной модели. Простыми словами, генеративный AI — это класс алгоритмов машинного обучения, предназначенных для создания нового оригинального контента на основе набора входных данных. GAN могут выполнять творческие задачи, которые раньше считались уникальными для людей, например, создание текста, изображений, музыки, кодов, веб-сайтов и видео.

Многие функции генеративного AI Mobio уже тестирует на практике для выполнения конкретных заданий, и мы обязательно поделимся своими результатами и выводами. В этой статье систематизированы возможности применения GAN в рекламном бизнесе, которые мы выделили как перспективные.

Визуальная реализация

Использование AI в digital-маркетинге: визуальная реализация

Весь полученный с помощью GAN материал будет являться уникальным и предполагает коммерческие права (право собственности) на созданный контент.

  • Генерация изображения на основе текста

Искусственный интеллект дает возможность генерировать изображения на базе текста. На основании заданных параметров, темы, стиля или местоположения с помощью слов можно создавать необходимый визуальный материал, как анимационные изображения, так и реалистичные картинки, не отличимые от фотографий. Сети способны создавать абсолютно реалистичные изображения несуществующих людей или животных, абстрактные и сюрреалистические пейзажи и картины, которые не могут быть сделаны при помощи фотокамеры, и даже виртуальные миры.

  • Семантический перевод изображения и генерация 3D-форм

На основе семантического изображения или эскиза можно создать реалистичную версию изображения. Проанализировав миллионы фотографий, нейронная сеть воссоздает сцены и пейзажи, имитирующие реальные ландшафты. Также AI генерирует текст, числа и 2D-изображения в 3D-формы с топологией, богатыми геометрическими деталями и текстурами. Чтобы построить фотореалистичный мир, 3D-художнику нужно создать минимум, а GAN продолжат процесс 3D-моделирования сложных ландшафтных сцен.

  • Преобразование изображения в изображение

Вариаций преобразования у нейросетей бесконечное множество, а пользователь регулирует своими запросами получение желаемого результата. Что можно осуществить с применением разных тезисов (запросов):

  1. Переносить стиль одного изображения на другое или прописать определенный стиль в запросе текстом (реализм, аниме, фэнтези, киберпанк, скетчинг, стимпанк и т. д.). Также GAN дают возможность получать изображение в стиле известных художников (например, Ван Гога или Дали) или фотографов.
  2. Преобразовать элементы изображения, такие как цвет, среда или форма при сохранении составных элементов (например, превратить дневное изображения в ночное). Для персонажа можно также задать антураж или экипировку известных героев (человека-паука, Гарри Поттера или доктора Хауса) или поменять возраст человека на изображении.
  3. Восстанавливать или реконструировать фотографии и некачественные снимки.
  4. Объединять изображения.
  5. Создавать убедительные фейки знаменитостей, которые трудно отличить от реальных фото.
  • Увеличение качества изображения (супер-разрешение)

Нейросети можно использовать для улучшения качества изображений, делая их более четкими, резкими и детализированными. Применять эту способность GAN возможно не только для фотографий, но и для рисунков. Сервисы предлагают удаление шумов, фона, увеличение размера изображений и повышение качества в несколько раз (до 16).

  • Генерация видео

Генеративный AI позволяет преобразовывать текст или изображение в видео. Подходит для генерации простых роликов в формате «диктор+фон». Качество более сложных видеоматериалов еще сомнительно. Google, например, пока не предоставляет доступ к пользованию своей системой создания видео, но демонстрирует результаты работы своего сервиса, способного по словесным запросам генерировать видео с разрешением 1280×768 пикселей и частотой 24 кадра в секунду.

Способность алгоритмов AI накладывать изображение лица одного человека на реальное видео другого приводит к появлению deepfake. В сети много забавных дипфейковых видео, но также растет количество кибермошенников и deepfake-преступлений. Уже создаются сервисы, автоматически распознающие подделку, однако стоит заметить, что постоянно появляются и новые технологии машинного обучения, которые делают фейки все более реалистичными.

Основные генераторы изображений — MidjourneyDALL-EStable DiffusionDeep Dream GeneratorNightCafeAI Playground. Практически все сервисы платные, за исключением небольшого триального периода, когда новичкам предоставляются бесплатные минуты, энергия, попытки и т. д.

Бесплатные площадки также есть (Dream by WOMBOCraiyon), но качество изображений на выходе очень низкое. И использовать эти сервисы можно только в качестве развлечения. По крайней мере пока.

Протестировав ряд платформ для выполнения практических заданий заказчиков (смотрите наши следующие статьи), мы убедились, что бесплатные сервисы значительно уступают платным. Вот какие изображения нам сгенерировали Craiyon и Dream by WOMBO на простой запрос «грустный кот сидит под зонтом возле лужи, кружат осенние листья, идет дождь».

В России создали свой проект ruDALL-E, над которым работали команды Sber AI, SberDevices, Самарского университета, AIRI и SberCloud. Мы отметили неплохие возможности для генерации пейзажных и интерьерных изображений.

Изображения ландшафтов и интерьеров на бесплатных платформах достаточно качественные.

Изображения людей, животных и абстракций на платных платформах впечатляют пока намного больше.

Основные генераторы видео — Pictory.aiPhenakiInVideoImagen VideoVeed.ioLumen5Designs.aiElai, Synthesia. Как и в случае генераторов изображения, генераторы видео в основном платные. По крайней мере те, которые заслуживают пристального внимания.

Простые ролики не требуют особого профессионализма и записываются за несколько минут. С помощью Synthesia у нас получился абсолютно бесплатно вот такой примитивный ролик. С Pictory.ai мы записали такое видео, но возможности этого сервиса намного шире, если заняться им вплотную.

Основные генераторы дизайна — Uizard, Brandmark, Khroma, VanceAI для помощи в создании дизайна мобильных приложений, сайтов или лендингов, логотипов, подбора цветовых палитр и много другого.

Аудио реализация

Использование AI в digital-маркетинге: аудио реализация
  • Генератор преобразования текста в речь

На фоне развития Text-to-Speech (TTS) технологий общедоступными стали синтезаторы речи, которые распознают текст с учетом контекста с помощью искусственного интеллекта. Эта технология имеет множество применений, включая аудиокниги, озвучку фильмов, запись подкастов, «речевую навигацию», голосовой чат и т. д. Синтезированная речь может быть записана в аудиоформат или сохранена в формате OGG. Однако до сих пор все эти методы не могут превзойти по качеству естественный голос человека.

  • Преобразование речи в речь

Применение генеративного AI, связанное со звуком, включает генерацию голоса с использованием существующих источников голоса. С помощью STS можно создавать озвучку для рекламы или игр, не привлекая специалиста по озвучиванию.

  • Музыкальное преобразование

С помощью генеративного AI появилась возможность создавать музыку, исходя из своих предпочтений в отношении стиля, жанра и т. д. Эти инструменты можно использовать во многих сферах творчества, включая игры и рекламные объявления. Также некоторые системы работают путем преобразования аудиозаписи в спектрограмму, после чего нейросеть генерирует тексты, соответствующие, на ее взгляд, проигрываемой музыке.

Основные голосовые генераторы — iSpeechText-to-Speech, Voicemaker, Play.htLovo.ai.

Основные музыкальные генераторы — AIVASoundrawAmadeus Code. В маркетинге при использовании этих сервисов появилась возможность создавать фоновую музыку для рекламных объявлений, не имея специфических музыкальных навыков. Мы попробовали записать мелодию для ролика с тематикой рождественских скидок. Эта мелодия — наш первый опыт в этом направлении. Результат достаточно скромный, но перспективы многообещающие – нейронные сети смогли завершить неоконченную 10-ю симфонию Людвига ван Бетховена (BeethovANN Symphony 10.1).

Текстовая реализация

Текстовая реализация

Несмотря на то, что первоначально GAN использовались для визуальных целей, в настоящее время алгоритмы применяют и для генерации текста. В маркетинге и играх генеративный AI используют для создания диалогов, заголовков, рекламных слоганов и текстов, сообщений в блогах, в чатах для общения с клиентами в режиме реального времени или для создания описаний продуктов, статей и контента в социальных сетях.

Этот абзац, к примеру, после обработки на сервисе Rytr получился таким:

Нейросетей для генерации текста достаточно много — Frase IO, OutrankingWritesonicа GPT-3 — одна из самых больших (до 4,5млрд сгенерированных слов в день). Но все-таки надо понимать, что эти сервисы – это не панацея. И пока они лучше всего подходят для написания заголовков или коротких постов (описания продукта, заполнения карточек товаров, описания функций и т.д.) и для небольших текстов, где не нужно учитывать контекст. Но в больших объемах участие человека в создании контента пока необходимо. Хотя бы для проверки сгенерированного текста. Потому что некоторое «мысли» AI могут поставить в тупик или заставить задуматься. К примеру, при тестировании нейросетей на создание текстов мы получали такие фразы: «В первую очередь, нужно уметь писать хорошо, иначе вы будете писать плохо» или «Дизайнеры не беспокоятся о том, что их заменяет AI; они беспокоятся о том, что другие дизайнеры используют AI».

Генерация кода

Генерация кода

Еще одним применением генеративного AI является разработка программного обеспечения благодаря его способности создавать код без необходимости ручного кодирования. Благодаря этому качеству разработка кода возможна не только для профессионалов, но и для людей, не связанных с программированием.

В маркетинге генератор кода может использоваться для написания нужных ботов. Например, бот, который будет присылать ссылки на статьи конкурентов, получившие более 100 лайков. Таким образом будет мониториться интерес аудитории к определенной теме.

Основные генераторы кода — CodeWhisperer, Copilot, Tabnine, AlphaCode.

Создание контента (текстового, аудио или видео) с помощью GAN — это будущее, которое уже наступило. А это означает, что пришло время начать использовать те возможности, которые предоставляют нам нейронные сети. Самым перспективным на сегодняшний день нам показалось использование генераторов изображений, в частности Midjourney и DALL-E. Мы проверили, как эти нейросети могут помочь в выполнении реальных заданий наших заказчиков, а именно в создании визуальных креативов и дизайна. Что нас приятно удивило, с какими трудностями мы столкнулись, какие сделали выводы и что конкретно у нас получилось — читайте в наших следующих статьях.


Источник: https://www.cossa.ru/mobio/318631/

Обсудим
     Проект?

    В соответствии с нашей Политикой конфиденциальности.

    This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

    Переходите
    в Telegram-канал Мобио

    и будьте в курсе всех digital-новостей

    Подписаться