среда, 7 июля 2021 г.

Творческие функции, имитируемые ИИ

Креативно-подобные функции


Генеративные состязательные сети (GAN) способны не только на создание Deepfake-видео. Исследователи сотрудничают с художниками и музыкантами, чтобы генерировать совершенно новые формы творческого самовыражения посредством алгоритмов искусственного интеллекта.

ИИ используется для исследования новых идей - от синтеза масок африканских племен до создания фантастических вымышленных галактик. Nvidia запустила GauGAN (названный в честь художника-постимпрессиониста Поля Гогена), генеративную состязательную систему искусственного интеллекта, которая позволяет пользователям создавать реалистичные изображения пейзажей, которых никогда не существовало. Национальный институт информатики в Токио создал автора текстов на основе искусственного интеллекта, а Amazon выпустила свою систему DeepComposer, которая сочиняет музыку «автоматически». Эти ИИ якобы предназначены не для замены художников, а, скорее, для улучшения их творческого процесса.

Генеративные алгоритмы для производства контента


В прошлом году создатели «Южного парка» построили целое шоу, используя дипфейки.

«Sassy Justice», транслировавшаяся на YouTube, показала синтетического репортера Фреда Сасси, который очень похож на бывшего президента Трампа - только с другим голосом и прической, чтобы избежать судебных разбирательств.

В эпизодах использовались дипфейки Эла Гора, Марка Цукерберга, Джареда Кушнера и других. Алгоритм с открытым исходным кодом DeepFaceLab использовался другими художниками и режиссерами. В рекламе Hulu был дипфейк звезд спорта, а в нескольких рекламных роликах Суперкубка 2021 года, включая жуткое появление Винса Ломбарди, использовались дипфейки и синтетические медиа. Алгоритм глубокого обучения OpenAI выпустил нейронную сеть под названием Jukebox, которая генерирует песни во множестве разных стилей и имитирует голоса, которые звучат (вроде) как Элвис и другие.

Создание виртуального окружения из коротких видеороликов


Разработчик чипов Nvidia учит ИИ создавать реалистичные 3D-среды из коротких видеоклипов. Этот метод основан на предыдущих исследованиях сетей GAN. Система Nvidia генерировала графику на основе наборов данных с открытым исходным кодом, используемых в области автономного вождения. Используя короткие клипы, сегментированные по различным категориям - например, здания, небо, автомобили, знаки, деревья или люди - GAN создавали новые и разные версии этих объектов. Спектр возможных приложений огромен. Автоматически сгенерированные виртуальные среды могут использоваться для фильмов в жанрах фэнтези, для генерации супергероев, могут снизить затраты на производство телепрограмм и разработку игр.

Автоматическое управление версиями историй


Журналисты швейцарской компании Tamedia экспериментировали с генеративными методами во время выборов в своей стране в 2018 году. Алгоритм дерева решений Tamedia по имени Tobi генерировал автоматизированные статьи с подробным описанием результатов голосования для каждого муниципалитета, освещаемого 30 газетами частной медиа-группы. Он также производил контент одновременно на нескольких языках.

Всего Тоби опубликовал 39 996 различных версий предвыборных историй, каждая из которых в среднем содержала 250 слов. Статьи были снабжены специальной подписью, предупреждающей читателей о том, что они написаны с помощью алгоритма. Ожидается, что по мере увеличения числа экспериментов, новостные и развлекательные медиа-компании разрабатывают несколько версий одного и того же контента для охвата более широкой аудитории или для создания огромных объемов контента в больших масштабах.

Автоматическое клонирование и дублирование голоса


Любой, кто когда-либо записывал подкаст, знаком с проблемами редактирования и удаления лишних шумов, таких как разговоры гостей друг с другом, звуки сирен и другие фоновые шумы, а также кашель и чихание. Эти моменты портят разговор. А что, если бы вы могли редактировать устную речь так же, как редактируется текстовый документ?

Это обещание компаний, занимающихся ИИ, включая Resemble AI и Descript, основанные на смопособности клонировать голоса. Очевидно, что у этой технологии есть и обратная сторона. В прошлом году хакеры использовали инструменты клонирования голоса, чтобы заставить сотрудника думать, что он разговаривает по телефону со своим генеральным директором; Затем он перевел 243 000 долларов на банковский счет мошенника.

Автоматическая перезапись окружающего шума


Мы обучаем компьютеры смотреть видео и предсказывать соответствующие звуки в нашем физическом мире. Например, какой звук издается, когда деревянная голень стучит по кушетке? Куча листьев? Стеклянное оконное стекло?

В центре внимания исследования, которое проводится в Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института, разработка способности понимания системами того, как объекты взаимодействуют друг с другом в физической сфере.

В настоящее время реализуются многочисленные проекты, упрощающие автоматическую генерацию голоса, видео и даже создание сюжетных линий.

2 комментария:

  1. Пока еще не придумали искусственный интеллект для интернет-маркетинга, предпочитаем в interchili.ru делать все вручную и контролировать каждый шаг, повышая продажи заказчика.

    ОтветитьУдалить
  2. Работают над этим. См запрос в гугле "Искусственный интеллект для интернет магазина".
    SAP движется в этом направлении (SAP Commerce Cloud), но тут более реалистичные решения, проверенные, во всяком случае. Желающим конечно предоставляются API для экспериментов в этом направлении.

    ОтветитьУдалить