Агентный ИИ — это система, основанная на фундаментальных моделях искусственного интеллекта, которая может действовать в реальном мире и выполнять многоэтапные процессы. Агенты ИИ могут автоматизировать и выполнять сложные задачи, часто используя обработку естественного языка, которые обычно требуют человеческих усилий.
Достижение бизнес-ценности с помощью агентского ИИ требует изменения рабочих процессов. Однако часто организации слишком сосредотачиваются на агенте или инструменте агента. Это неизбежно приводит к появлению привлекательных на вид агентов, которые фактически не улучшают общий рабочий процесс, что приводит к неудовлетворительной ценности.
Усилия в области агентного ИИ, направленные на фундаментальное переосмысление всех рабочих процессов, то есть этапов, в которых задействованы люди, процессы и технологии, с большей вероятностью приведут к положительному результату. Понимание того, как агенты могут помочь на каждом из этих этапов, — это путь к достижению ценности. Люди по-прежнему будут играть центральную роль в выполнении работы, но теперь им будут помогать другие агенты, инструменты и средства автоматизации.
Важной отправной точкой в перестройке рабочих процессов является картирование процессов и выявление ключевых болевых точек пользователей. Этот шаг критически важен для проектирования агентных систем, которые сокращают ненужную работу и позволяют агентам и сотрудникам взаимодействовать и достигать бизнес-целей более эффективно и результативно. Такое взаимодействие может осуществляться посредством циклов обучения и механизмов обратной связи, создавая самоусиливающуюся систему. Чем чаще используются агенты, тем они становятся умнее и согласованнее.
Агенты не всегда являются решением
Агенты ИИ могут многое, но их не обязательно использовать для всего. Слишком часто руководители недостаточно внимательно изучают необходимую работу и не задумываются, будет ли агент лучшим выбором для её выполнения.
Чтобы избежать ненужных инвестиций или нежелательного усложнения, руководители компаний могут подходить к роли агентов так же, как они подходят к оценке сотрудников для высокоэффективной команды. Ключевой вопрос, который следует задать: «Какую работу предстоит выполнить и каковы относительные таланты каждого потенциального члена команды — или агента — для совместной работы над достижением этих целей?» Бизнес-задачи часто можно решить с помощью более простых подходов к автоматизации, таких как автоматизация на основе правил, предиктивная аналитика или подсказки на основе больших языковых моделей (LLM), которые могут быть более надёжными, чем готовые агенты.
Прежде чем прибегать к агентскому решению, руководители бизнеса должны оценить требования задачи. На практике это означает чёткое понимание того, насколько стандартизированным должен быть процесс, какую степень вариативности он должен выдерживать и какие задачи лучше всего подходят агентам.
С одной стороны, эти проблемы очевидны. Например, рабочие процессы с низкой дисперсией и высокой степенью стандартизации, такие как привлечение инвесторов или раскрытие информации регулирующим органам, как правило, строго регламентированы и следуют предсказуемой логике. В таких случаях агенты, основанные на недетерминированных LLM, могут добавить больше сложности и неопределенности, чем ценности.
Напротив, высоковариантные и слабостандартизированные рабочие процессы могли бы значительно выиграть от использования агентов. Например, в компании, предоставляющей финансовые услуги, агенты были задействованы для извлечения сложной финансовой информации, что сократило объём необходимой человеческой проверки и оптимизировало рабочие процессы. Эти задачи требовали агрегации информации, проверки достоверности данных и анализа соответствия требованиям — задач, в которых агенты могут быть эффективны.
Важно помнить, что не следует попадать в ловушку бинарного мышления «есть агент/нет агента». Некоторые агенты хорошо справляются с определёнными задачами, другие помогают людям лучше выполнять свою работу, и во многих случаях могут быть более подходящими разные технологии. Ключ к успеху — понять, какой инструмент или агент лучше всего подходит для конкретной задачи, как люди могут работать с ними наиболее эффективно и как следует комбинировать агентов и сотрудников для достижения максимальной отдачи. Секрет успеха заключается в том, насколько хорошо люди, агенты и инструменты взаимодействуют друг с другом.
Общие правила при выборе инструментов ИИ
При выборе инструмента ИИ для различных задач вам могут пригодиться следующие рекомендации:
- Если задача основана на правилах и повторяется, со структурированным вводом (например, вводом данных), используйте автоматизацию на основе правил.
- Если входные данные неструктурированы (например, объемные документы), но задача все еще требует извлечения или генерации данных, используйте искусственный интеллект, обработку естественного языка или предиктивную аналитику.
- Если задача подразумевает классификацию или прогнозирование на основе прошлых данных, используйте предиктивную аналитику или искусственный интеллект.
- Если вывод требует синтеза, суждения или творческой интерпретации, используйте искусственный интеллект.
- Если задача подразумевает многоэтапное принятие решений и имеет длинный «шлейф» крайне изменчивых входных данных и контекстов, используйте агентов ИИ.
Одна из самых распространённых проблем, с которой сталкиваются команды при внедрении ИИ-агентов, — это агентские системы, которые выглядят впечатляюще в демонстрационных версиях, но вызывают разочарование у пользователей, которые фактически выполняют эту работу. Пользователи часто жалуются на «недобросовестность ИИ» или низкое качество результатов. Пользователи быстро теряют доверие к агентам, и уровень их внедрения низок. Любой выигрыш в эффективности, достигнутый за счёт автоматизации, может быть легко сведён на нет потерей доверия или снижением качества.
Из этой повторяющейся проблемы выстраданным уроком стало то, что компаниям следует активно инвестировать в развитие агентов, так же, как они инвестируют в развитие сотрудников. Как сказал нам один из руководителей компаний: «Адаптация агентов больше похожа на найм нового сотрудника, чем на внедрение программного обеспечения». Агентам следует предоставить чёткие должностные инструкции, провести адаптацию и постоянно получать обратную связь, чтобы они становились эффективнее и постоянно совершенствовались.
Разработка эффективных агентов — сложная задача, требующая привлечения индивидуальных экспертов для создания оценок (или «оценок») и систематизации передового опыта с достаточной степенью детализации для конкретных задач. Эта систематизация служит одновременно и учебным пособием, и тестом производительности для агента, гарантируя его соответствие ожиданиям.
Эти практики могут существовать в виде стандартных рабочих процедур или неявного знания в головах людей. При систематизации практик важно сосредоточиться на том, что отличает лучших специалистов от остальных. Для торговых представителей это может включать в себя то, как они ведут беседу, справляются с возражениями и подстраиваются под стиль клиента.
Типы оценки
Вот некоторые типичные оценки, используемые для оценки эффективности работы агента:
- Показатель успешности выполнения задач (от начала до конца). Показатель успешности выполнения задач измеряет процент рабочих процессов, выполненных правильно без эскалации или вмешательства человека, отражая реальную полезность.
- Оценка F1/точность и полнота. Эта метрика балансирует ложноположительные и ложноотрицательные результаты, что делает её полезной для задач классификации, извлечения и точности решений, где существует чёткий измеримый результат (то есть «да» или «нет»).
- Точность поиска. Точность поиска — это процентное соотношение верных документов, фактов или доказательств, полученных относительно исходного набора данных, что критически важно для рабочих процессов, дополненных поиском.
- Семантическое сходство. Семантическое сходство измеряется с помощью косинусного сходства, основанного на встраивании, между сгенерированным и эталонным выводами, что позволяет оценить соответствие значений, выходящее за рамки точного совпадения слов.
- LLM как судья. Использование большой языковой модели (LLM) в качестве судьи подразумевает оценку результатов на основе эталонных стандартов или человеческих предпочтений. Эта метрика хорошо масштабируется для субъективных суждений, таких как ясность, полезность и обоснованность рассуждений.
- Обнаружение предвзятости (с помощью матриц несоответствия). Обнаружение предвзятости измеряет систематические различия в результатах между группами пользователей с помощью матриц несоответствия, которые выявляют места проявления предвзятости (например, ложноотрицательные результаты, непропорционально влияющие на одну группу).
- Частота галлюцинаций. Эта метрика отслеживает частоту фактически неверных или неподтверждённых заявлений, обеспечивая достоверность информации, полученной от агента.
- Ошибка калибровки (уверенность против точности). Ошибка калибровки показывает, соответствуют ли оценки уверенности агента фактической корректности, что важно для рабочих процессов, чувствительных к риску.
Крайне важно, чтобы эксперты оставались вовлеченными в процесс тестирования эффективности агентов с течением времени; в этой области не может быть принципа «запустил и ушёл». Такая приверженность оценке требует, например, от экспертов буквально записывать или маркировать желаемые (и, возможно, нежелательные) результаты для заданных входных данных, которые иногда могут исчисляться тысячами для более сложных агентов. Таким образом, команды могут оценить, насколько агент был верен или неверен, и внести необходимые исправления.
Упростите отслеживание и проверку каждого шага
При работе всего с несколькими ИИ-агентами анализ их работы и выявление ошибок может быть довольно простым. Но когда компании внедряют сотни, а то и тысячи агентов, задача становится сложной. Проблема усугубляется тем, что многие компании отслеживают только результаты. Поэтому, когда происходит ошибка (а ошибки будут всегда по мере масштабирования агентов компаниями), сложно определить, что именно пошло не так.
Эффективность работы агентов должна проверяться на каждом этапе рабочего процесса. Интеграция мониторинга и оценки в рабочий процесс позволит командам выявлять ошибки на ранних этапах, совершенствовать логику и постоянно повышать эффективность, даже после развертывания агентов.
Например, в одном из рабочих процессов проверки документов команда продукта поставщика услуг альтернативного разрешения споров заметила внезапное падение точности, когда система столкнулась с новым набором дел. Но поскольку агентский рабочий процесс был построен с использованием инструментов наблюдения для отслеживания каждого этапа процесса, команда быстро выявила проблему: некоторые сегменты пользователей предоставляли данные низкого качества, что приводило к некорректной интерпретации и неэффективным рекомендациям на последующих этапах. Благодаря этому пониманию команда улучшила методы сбора данных, предоставила рекомендации по форматированию документов заинтересованным сторонам на более высоком уровне и скорректировала логику анализа системы. Производительность агентов быстро восстановилась.
Лучший вариант использования — это вариант повторного использования.
Стремясь к прогрессу в области агентного ИИ, компании часто создают уникального агента для каждой поставленной задачи. Это может привести к значительной избыточности и потерям, поскольку один и тот же агент часто может выполнять разные задачи, выполняя многие из одинаковых действий (например, прием, извлечение, поиск и анализ).
Решение о том, сколько инвестировать в создание многоразовых агентов (по сравнению с агентом, выполняющим одну конкретную задачу), аналогично классической задаче ИТ-архитектуры, когда компаниям необходимо быстро создавать решения, не ограничивая будущие возможности. Достижение такого баланса часто требует тщательного анализа и суждений.
Хорошей отправной точкой будет выявление повторяющихся задач. Компании могут разрабатывать агенты и компоненты агентов, которые можно легко использовать повторно в различных рабочих процессах, и упрощать разработчикам доступ к ним. Это включает в себя разработку централизованного набора проверенных сервисов (например, наблюдаемость LLM или предварительно одобренные подсказки) и ресурсов (например, шаблонов приложений, повторно используемого кода и учебных материалов), которые легко найти и использовать. Интеграция этих возможностей на единой платформе имеет решающее значение. По нашему опыту, это помогает практически исключить от 30 до 50 процентов несущественной работы, которая обычно требуется.
Люди остаются важными, но их роли и численность изменятся
По мере того, как число агентов искусственного интеллекта продолжает расти, вопрос о том, какую роль будут играть люди, вызывает серьёзную тревогу: с одной стороны, о гарантиях занятости, с другой — о высоких ожиданиях роста производительности. Это привело к радикальному расхождению взглядов на роль человека во многих современных профессиях.
Для ясности: агенты смогут многое сделать, но люди останутся неотъемлемой частью уравнения рабочей силы, даже несмотря на то, что характер работы, выполняемой как агентами, так и людьми, со временем изменится. Людям потребуется, например, контролировать точность моделей, обеспечивать соответствие требованиям, применять здравый смысл и обрабатывать пограничные случаи. Как мы уже обсуждали, агенты не всегда будут лучшим решением, поэтому потребуются специалисты, работающие с другими инструментами, такими как модели машинного обучения. Однако количество сотрудников, работающих в конкретном рабочем процессе, вероятно, изменится и зачастую сократится после его трансформации с использованием агентов. Руководителям компаний критически важно будет управлять этими переходами, как и любой другой программой изменений, и продуманно распределять работу, необходимую для обучения и оценки агентов.
Ещё один важный урок заключается в том, что компаниям следует целенаправленно перестраивать работу, чтобы люди и агенты могли эффективно взаимодействовать. Без этого даже самые продвинутые агентские программы рискуют столкнуться с тихими сбоями, усугубить ошибки и отказать пользователям.
Источник
Один год агентного ИИ: шесть уроков от людей, выполняющих эту работу. 12 сентября 2025 г. Статья. Ларейна Йи, Майкл Чуй, Роджер Робертс с Стивен Сюй.
One year of agentic AI: Six lessons from the people doing the work. September 12, 2025. By Lareina Yee, Michael Chui, and Roger Roberts with Stephen Xu.
https://www.mckinsey.com/capabilities/quantumblack/our-insights/one-year-of-agentic-ai-six-lessons-from-the-people-doing-the-work
* * *
Внимание, интернет-магазины! Покупатели-боты скоро всё изменят.
Эван Шуман
12 августа 2025 г.
В ближайшие пару лет роботы-покупатели, вероятно, начнут заменять покупателей-людей. И это заставит ритейлеров изменить тактику продаж, чтобы добиться успеха.
Автономные боты, выступающие в роли виртуальных покупателей для потребителей и предприятий, скорее всего, станут обычным явлением в течение ближайших двух-трех лет, но интернет-магазины пока далеки от готовности к грядущим переменам.
Появление ботов-покупателей приведёт к изменению розничных продаж на всех этапах процесса покупки: от демонстрации товаров до их продвижения, ценообразования и продажи. И даже когда онлайн-площадки будут оптимизированы для всех этих цифровых покупателей, неприятные проблемы почти наверняка возникнут.
Подумайте об этом так: учитывая, что боты-покупатели, вероятно, представляют собой большое количество клиентов за один поход по магазинам, как будут работать возвраты? Многие ритейлеры сегодня ограничивают количество возвратов, которые может сделать один покупатель, чтобы предотвратить мошенничество, называемое «аренда» или «гардеробининг».
Если, например, лимит магазина составляет 20 возвратов в течение шести месяцев, что произойдёт, если бот представляет 18 000 покупателей? Кстати, как насчёт баллов лояльности, которые часто используются для стимулирования продаж и привлечения клиентов? Сохранятся ли эти баллы у бота (то есть они действительно перейдут к владельцу бота, например, OpenAI, Microsoft, AWS, Google или Anthropic)? Или они будут начисляться покупателям-людям пропорционально совершённым покупкам? Или куда-то ещё?
На некоторые из этих проблем, вызванных ботами, нет однозначного ответа. Боты — это программное обеспечение, а их клиенты — люди. Каждый из них будет совершать покупки, используя свой набор параметров. Есть некоторые элементы шопинга, которые ботов совершенно не интересуют, например, красивые фотографии высокого разрешения и эффектные маркетинговые тексты, восхваляющие роскошный образ жизни, демонстрируемый каждой конкретной покупкой.
Но клиенты-люди могут действительно интересоваться этими элементами. Игнорирует ли бот эти элементы при покупке, а затем загружает их после покупки, чтобы поделиться с клиентом-человеком?
Как вообще работает автономный покупатель-бот? Совершает ли он покупку самостоятельно и просто сообщает клиенту: «Купили нужные вам обувь и холодильник. Они должны прибыть во вторник»? Или же он предоставляет небольшой список рекомендуемых покупок, позволяя человеку принять решение (и завершить) покупку?
Вот ключевой вопрос электронной коммерции, лежащий в основе этих сценариев: будут ли ритейлеры поощрять ботов посещать их обычные сайты и надеяться на лучшее? Или же ритейлерам придётся создавать специальные версии своих интернет-магазинов, оптимизированные для ботов и обеспечивающие максимальную эффективность для ИИ-агентов? Приведёт ли это к настоящему взаимодействию ботов — без участия людей?
Работаешь на меня или на себя?
Раньше турагентства работали бесплатно, получая деньги от различных отелей, ресторанов, авиакомпаний и компаний по прокату автомобилей. Это часто заставляло путешественников задуматься, продвигает ли турагент определённый отель или турпакет из-за лучшего соотношения цены и качества или же из-за комиссионных?
Это подводит нас к самому сложному вопросу, связанному с торговыми ботами: доверию. Будут ли покупатели-люди задаваться вопросом, совершает ли бот покупки ради выгоды покупателя или ради выгоды владельца бота?
Источник
https://www.computerworld.com/article/4037756/attention-online-retailers-bot-shoppers-are-about-to-change-everything.html
Attention online retailers! Bot shoppers are about to change everything. by Evan Schuman. Aug 12, 2025
Комментариев нет:
Отправить комментарий