Краткое о генеративном ИИ
Чтобы понять цепочку создания ценности генеративного ИИ, полезно иметь базовые знания о том, что такое генеративный ИИ и чем его возможности отличаются от «традиционных» технологий искусственного интеллекта, которые компании используют, например, для прогнозирования оттока клиентов, прогнозирования спроса на продукт и выдачи рекомендаций по следующему лучшему продукту.
Ключевым отличием генеративного ИИ является его способность создавать новый контент. Этот контент может быть доставлен в нескольких модальностях, включая текст (например, статьи или ответы на вопросы), изображения, которые выглядят как фотографии или картины, видео и трехмерные представления (например, сцены и пейзажи для видеоигр).
Большинство генеративных моделей ИИ производят контент в одном формате, но также появляются мультимодальные модели, которые могут, например, создавать слайд или веб-страницу с текстом и графикой.
Все это стало возможным благодаря обучению нейронных сетей на огромных объемах данных и применению «механизмов внимания» — метода, который помогает моделям ИИ понять, на чем следует сосредоточиться. С помощью этих механизмов система генеративного ИИ может определять шаблоны слов, отношения и подсказки пользователя. Традиционный ИИ также может использовать нейронные сети и механизмы внимания, но эти модели не предназначены для создания нового контента. Они могут только описывать, предсказывать или предписывать что-то на основе существующего содержания.
Цепочка создания стоимости: шесть звеньев
По мере того как разработка и развертывание систем генеративного ИИ идет полным ходом, появляется новая цепочка создания стоимости. На первый взгляд может показаться, что это очень похоже на традиционную цепочку создания стоимости ИИ. В конце концов, из шести категорий верхнего уровня — компьютерного оборудования, облачных платформ, базовых моделей, концентраторов моделей и операций машинного обучения (MLOps), приложений и услуг — только базовые модели являются новым дополнением.
Цепочка создания стоимости для генеративного ИИ
- Услуги. Услуги, связанные со специализированными знаниями о том, как использовать генеративный ИИ (например, обучение, обратная связь и обучение с подкреплением).
- Приложения. Продукты B2B или B2C, которые используют базовые модели либо в основном "как есть", либо в тонкой настройке для конкретного варианта использования ИИ.
- Концентраторы моделей и MLOps. Инструменты для курирования, размещения, тонкой настройки или управления базовыми моделями.
- Базовые модели. Базовые модели, на основе которых можно создавать генеративные приложения ИИ.
- Облачные платформы. Платформы для предоставления доступа к компьютерному оборудованию.
- Компьютерное оборудование. Чипы-ускорители, оптимизированные для обучения и настройки моделей.
Ожидается, что рынок приложений для генеративного ИИ будет быстро расширяться, предлагая возможности для создания стоимости как действующим технологическим компаниям, так и новым участникам рынка. Компании, которые используют специализированные или собственные данные для точной настройки приложений, могут добиться значительного конкурентного преимущества по сравнению с теми, кто этого не делает.
Компьютерное оборудование для генеративного ИИ
Генеративным системам ИИ нужны знания, - и много, - для создания контента. Например, OpenAI GPT-3, генеративная модель искусственного интеллекта, лежащая в основе ChatGPT, была обучена примерно на 45 терабайтах текстовых данных. С такими объемами не справится традиционное компьютерное оборудование. Рабочие нагрузки требуют больших кластеров графических процессоров (GPU) или тензорных процессоров (TPU) со специализированными «ускорителями», способными обрабатывать параллельно данные по миллиардам параметров.
После завершения обучения базовой модели генеративного ИИ для тонкой настройки модели могут использоваться кластеры для запуска энергоемких моделей, используемых в продуктивных приложениях. Правда стоит отметить, что тонкая настройка требует меньших вычислительных мощностей по сравнению с начальным обучением ИИ.
Новые участники рынка сталкиваются с высокими начальными затратами на исследования и разработки, а традиционные разработчики оборудования должны развивать специальные навыки, знания и вычислительные возможности, необходимые для обслуживания рынка генеративного ИИ.
Облачные платформы для генеративного ИИ
Графические процессоры и тензорные процессы (TPU) дороги и дефицитны, поэтому большинству предприятий сложно и нерентабельно приобретать и поддерживать аппаратную платформу в локальной среде. В результате большая часть работы по созданию, настройке и запуску больших моделей ИИ выполняется в облаке. Это позволяет компаниям получать доступ к вычислительной мощности и управлять соответствующими расходами. Крупные облачные провайдеры обладают полными платформами для запуска генеративных ИИ с доступом к оборудованию и чипам. Соответственно, компании, использующие облачные предпложения могут выйти на рынок, а специализированные облачные провайдеры могут получить свою долю рынка.
Базовые модели генеративного ИИ
В основе генеративного ИИ лежат базовые модели. Эти большие модели глубокого обучения по определенному типу контента. Они могут быть адаптированы для поддержки широкого круга задач. Базовая модель похожа на швейцарский армейский нож — ее можно использовать для разных целей. Как только базовая модель разработана, любой может создать на ее основе специализированные приложения. Базовые модели GPT-3 и GPT-4 OpenAI могут создавать текст человеческого качества. Они поддерживают десятки приложений.
Базовые модели обучаются на массивных наборах данных. Сюда могут входить общедоступные данные из Википедии, с государственных сайтов, из социальных сетей и книг, а также частные данные из больших баз данных. OpenAI, например, сотрудничает с Shutterstock для обучения своей модели изображения на изображениях Shutterstock.
Разработка базовых моделей требует глубоких знаний в нескольких областях. К ним относятся подготовка данных, выбор архитектуры модели, которая может создать целевой вывод, обучение модели, а затем настройка модели для улучшения вывода.
Сегодня обучение базовых моделей обходится дорого. В начале процесса обучения модель обычно выдает случайные результаты. Чтобы улучшить последующий вывод, алгоритм обучения корректирует веса базовой нейронной сети. Возможно, это потребует миллионов итераций для достижения желаемого уровня точности. В настоящее время затраты обучения могут стоить миллионы долларов и занимать месяцы. Например, обучение OpenAI GPT-3 оценивается в 4-12 миллионов долларов. В результате на рынке в настоящее время доминируют несколько технологических гигантов и стартапов, подкрепленных значительными инвестициями. Тем не менее, ведется работа по созданию меньших моделей, которые могут обеспечить эффективные результаты для некоторых задач. Это может привести к более эффективному обучению, что в конечном итоге может открыть рынок для большего количества участников.
Концентраторы моделей и MLOps
Чтобы создавать приложения на основе базовых моделей, компаниям нужны две вещи. Во-первых, место для хранения модели и обеспечения доступа к базовой модели. Во-вторых, специализированные инструменты, технологии и методы MLOps для адаптации базовой модели и развертывания в приложениях конечных пользователей. Сюда входят, например, возможности включения и маркировки дополнительных данных для обучения или создания API-интерфейсов, позволяющих приложениям взаимодействовать с моделями.
Концентраторы моделей предоставляют услуги доступа к моделям. Для моделей с закрытым исходным кодом, в которых исходный код не доступен для общественности, разработчик базовой модели обычно выступает в качестве владельца модели. Он будет предлагать лицензионный доступ к модели через API. Иногда поставщик также предоставляет возможности MLOps для настроики модели и ее разворачивания в разных приложениях.
Для моделей с открытым исходным кодом каждый может свободно использовать и модифицировать модели. Появляются независимые концентраторы моделей, предлагающие целый спектр услуг. Некоторые из них могут действовать только как агрегаторы моделей, предоставляя доступ к различным базовым моделям, в том числе настроенным другими разработчиками. Команды ИИ могут загружать модели на серверы, настраивать и развертывать их в приложениях. Другие могут предоставлять доступ к моделям и возможностям MLOps, включая опыт настройки базовой модели с использованием собственных данных и ее развертывание в своих приложениях. Эта последняя модель заполняет растущий пробел для компаний, стремящихся использовать технологию генеративного ИИ, но не имеющих для этого собственных специалистов и инфраструктуры.
Приложения
Базовая модель способна выполнять широкий спектр задач и приложения, построенные на ее основе, позволяют выполнять конкретные задачию Например, приложения могут помогать в деле обслуживания клиентов, могут помогать составлять маркетинговые электронные письма. Подобные приложения могут быть разработаны новыми участниками рынка, стремящимися представить новое предложение на рынке или работающими над добавлением инновационных возможностей к текущим предложениям, а также обеспечить бизнесу возможности создания конкурентного преимущества.
Две категории приложений на основе точно настроенных моделей
Выделяются две категории.
Вторая категория - использование точно настроенных базовых моделей, которые были дообучены на основе дополнительных релевантных данных. Для обучения базовых моделей требуются огромные объемы данных, это чрезвычайно дорого и может занять месяцы. В тоже время точная настройка базовых моделей требует меньше данных, стоит меньше и может быть выполнена за несколько дней.
Разработчики приложений могут накапливать эти данные на основе глубоких знаний отрасли или потребностей клиентов. Например, рассмотрим Harvey, генеративное приложение ИИ, созданное для ответов на юридические вопросы. Разработчики Harvey загружали наборы юридических данных в OpenAI GPT-3 и тестировали различные подсказки, чтобы настроенная модель могла генерировать юридические документы, которые были намного лучше, чем те, которые могла создать исходная базовая модель.
Организации также могут использовать собственные данные из повседневных бизнес-операций. Например, разработчик программного обеспечения, настроивший генеративного чат-бота с искусственным интеллектом специально для банков, может сотрудничать с клиентами, чтобы использовать данные из чатов колл-центра, что позволит повышать качество обслуживания клиентов по мере роста их пользовательской базы. Наконец, компании могут создавать собственные данные на основе данных обратной связи, управляемых системой оценки конечных пользователей.
Влияние приложений ИИ
Хотя генеративный ИИ, вероятно, повлияет на большинство бизнес-функций в долгосрочной перспективе, информационные технологии, маркетинг и продажи, обслуживание клиентов и разработка продуктов наиболее созрели для первой волны приложений.
- Информационные технологии. Генеративный ИИ может помочь командам писать код и документацию. Уже представленные на рынке автоматизированные кодировщики повысили производительность разработчиков более чем на 50%, помогая ускорить разработку программного обеспечения.
- Маркетинг и продажи. Команды могут использовать генеративные приложения ИИ для создания контента для работы с клиентами. Ожидается, что в течение двух лет 30% всех исходящих маркетинговых сообщений будут разрабатываться с помощью генеративных систем искусственного интеллекта.
- Обслуживание клиентов. Естественные, персонализированные чат-боты и виртуальные помощники могут обрабатывать запросы клиентов, рекомендовать быстрое решение и направлять клиентов к необходимой им информации.
- Разработка продукта. Компании могут использовать генеративный ИИ для быстрого создания прототипов продуктов. Например, медико-биологические компании уже начали изучать возможности использования генеративного ИИ для создания последовательностей аминокислот и нуклеотидов ДНК, чтобы сократить фазу разработки лекарств с месяцев до недель.
В ближайшем будущем некоторые отрасли могут использовать приложения генеративного ИИ с большей эффективностью, чем другие. Медиа и индустрия развлечений могут стать более эффективными, используя генеративный ИИ для производства уникального контента (например, локализации фильмов без необходимости многочасового перевода человеком), быстрой разработки идей для нового контента и визуальных эффектов для видеоигр, музыки, киноисторий. новостных статей. Ожидается, что банковские, потребительские, телекоммуникационные, медико-биологические и технологические компании ощутят огромную операционную эффективность, учитывая их значительные инвестиции в ИТ, обслуживание клиентов, маркетинг и продажи, а также разработку продуктов.
Услуги в сфере генеративного ИИ
Как и в случае с ИИ в целом, обязательно появятся специализированные сервисы генеративного ИИ. Ожидается, что существующие поставщики услуг ИИ будут развивать свои возможности для обслуживания рынка генеративного ИИ. Нишевые игроки также могут выйти на рынок со специальными знаниями для применения генеративного ИИ в рамках определенной функции (например, как применять генеративный ИИ в рабочих процессах обслуживания клиентов), в рамках определенной отрасли (например, руководство фармацевтическими компаниями по использованию генеративного ИИ для разработки лекарств).
Заключение
Хотя технология генеративного ИИ и поддерживающая ее экосистема все еще развиваются, приложения предлагают бизнесу значительные возможности для создания ценности. Те, кто может использовать нишевые — или, что еще лучше, частные — данные для точной настройки базовых моделей, могут рассчитывать на достижение наибольшей дифференциации и конкурентного преимущества. Гонка уже началась, о чем свидетельствует постоянный поток объявлений от поставщиков программного обеспечения — как существующих, так и новых участников рынка — о выводе на рынок новых решений.
Источник
Exploring opportunities in the generative AI value chain. April 26, 2023. By Tobias Härlin, Gardar Björnsson Rova, Alex Singla, Oleg Sokolov, and Alex Sukharevsky/
Изучение возможностей в цепочке создания ценности генеративного ИИ. 26 апреля 2023г. Тобиас Херлин, Гардар Бьорнссон Рова , Алекс Сингл, Олег Соколов и Алекс Сухаревский.