суббота, 24 декабря 2022 г.

Тренды - индустриализация машинного обучения

Что ожидается в деле индустриализации машинного обучения?



Этот новый технологический стек стремится к простоте, масштабируемости и функциональной совместимости на протяжении всего жизненного цикла рабочего процесса машинного обучения.

В деталях это выглядит так

Общий рабочий процесс машинного обучения.
Переход от... "устаревшие инструменты работают неэффективно. Фрагментированный технологический ландшафт создает противоречивые стандарты и ограничивает сотрудничество между командами."
к... "Инструменты, оптимизирующие рабочие процессы машинного обучения. Технология, обеспечивающая совместное обучение и совместную работу технических и нетехнических сотрудников."

Управление данными
Переход от... "Огромные ручные усилия одноразового использования без контроля качества, что сказывается на общей производительности."
к... "Автоматизированное управление данными для получения высококачественных данных. Повторное использование данных в сотнях решений с надежными средствами управления данными".

Разработка модели
Переход от... "Индивидуальные, "ремесленные" эксперименты. Ручная работа, требующая рефакторинга перед использованием".
к... "Структурированная и совместная разработка. Решения, собранные из готовых компонентов и инструментов с высокой степенью автоматизации".

Развертывание модели
Переход от... "Отсутствие работы в производственной среде. Ручное и чреватое ошибками развертывание с плохим тестированием и проверкой".
к... "Контролируемые решения о выпуске продукции. Управление моделями, обеспечивающее полную прозрачность производственных решений. Автоматизированный эффективный CI/CD (Continuous integration (CI) and continuous delivery (CD)) для тестирования и проверки всех выпусков".

Операции с продуктивной моделью
Переход от... "Снижение производительности, часто остающееся незамеченным, подрывающее ценность модели. Нестабильные решения не работают неделями".
к... "Сквозной мониторинг системы машинного обучения с мгновенными оповещениями, позволяющими быстро решать проблемы".

Каковы наиболее примечательные технологии?

Программные решения рабочего процесса машинного обучения

Обнаружение и создание данных
  • Преобразование данных
    • маркировка
    • валидация
  • Версии данных

Примеры:
  • Платформы данных для обнаружения и извлечения данных
  • Синтетические данные
  • Автоматическая маркировка данных
  • Воспроизводимые конвейеры данных

Разработка функций
  • Разработка и оптимизация модели
    • выбор модели
    • обучение и настройка
  • Эксперименты и тестирование
Примеры:
  • Библиотеки моделей
  • Централизованный репозиторий экспериментов
  • Инструменты отслеживания экспериментов и визуализации моделей
  • Среды разработки
Реестр моделей и управление
  • Тестирование и проверка модели
  • Развертывание модели
    • непрерывная интеграция
    • непрерывное развертывание
Примеры:
  • Пакетные платформы для тестирования и развертывания
  • Отслеживание версий и результатов
Мониторинг (например, инфраструктура, данные, модель, ключевые показатели эффективности)

  • Обслуживание модели
    • постоянное совершенствование
  • Объяснимость модели


Мониторинг продуктивной модели, конвейеров данных и связанных с этим проблем
  • Непрерывное переобучение с периодическим обновлением наборов данных
Примеры:
  • Готовые сквозные платформы
  • Интегрированные среды разработки.

Аппаратные решения для взаимодействия программного обеспечения и оптимизации рабочей нагрузки

Интегрированное оборудование. Решения, соединяющие физические аппаратные чипы и программные платформы.
  • Вертикально интегрированные аппаратные системы. Специализированные программно-аппаратные решения, заточенные под конкретные задачи машинного обучения; примеры на основе служб включают службу управления доступом к графическим процессорам и поток данных как услугу.
  • Горизонтально интегрированное оборудование. Аппаратное обеспечение, предлагающее разнообразный и широкий набор решений (например, упрощение использования распределенных вычислений).

Гетерогенные вычисления. Решения, оптимизирующие вычислительные рабочие нагрузки за счет выделения различных аппаратных микросхем исходя из конкретной задачи.
  • Графические процессоры (GPU). Аппаратное обеспечение, полезное для вычислений на основе линейной алгебры. Графические процессоры для искусственного интеллекта разрабатываются с более высокой скоростью обучения, более высокой скоростью передачи данных и более высокой вычислительной мощностью.
  • Блоки тензорной обработки (TPU). Специализированное оборудование, полезное для вычислений глубокого обучения и способное обрабатывать сложную линейную алгебру (например, «тензорное» или матричное умножение).
  • Нейроморфные процессоры (NPU). Аппаратный чип ранней стадии на основе архитектуры нейронной сети мозга с потенциально низким энергопотреблением.

Преимущества технологии

  • Ускоренное внедрение ИИ благодаря сокращению технических барьеров и требований для внедрения ИИ.
  • Повышение производительности технических сотрудников на протяжении всего жизненного цикла машинного обучения.
  • Упрощение сотрудничества между техническими и нетехническими экспертами при разработке моделей машинного обучения.
  • Масштабируемость и функциональная совместимость с использованием больших и богатых повторно используемых наборов данных.
  • Снижение затрат за счет более быстрой разработки и развертывания, стандартизированных процессов, улучшения технических характеристик.
  • Улучшенная безопасность и конфиденциальность, а также сниженный риск благодаря большей стандартизации и автоматизации процессов, прозрачности и надежности.

Риски и неопределенности

  • Нехватка первоначальных инвестиций и ресурсов для настройки моделей.
  • Зависимость от сторонних поставщиков, ведущих разработку технологий машинного обучения для начальной адаптации и непрерывной поддержки.
  • Быстро развивающийся рынок, где плохо определены процессы и ответственность за поддержку решений ML.
  • Усиление регулирования, когда законодательство может повлиять на развитие ML (например, политики управления данными, влияющие на решения по управлению данными)
  • Растущая потребность в ответственном и надежном машинном обучении системы для решения проблем, связанных с этикой, конфиденциальностью, справедливостью и справедливостью, объяснимостью, подотчетностью, безопасностью и управлением.

Что дебатируется?

1. Влияние индустриализации машинного обучения на организации и технические таланты.

Как решения, которые индустриализируют машинное обучение, могут изменить организации, их операционные модели и их инженерные роли?
Технологии являются частью более широких усилий по масштабированию операций машинного обучения в направлении модульного, автоматизированного, контролируемого подхода к жизненному циклу искусственного интеллекта/машинного обучения.
Требуется
  • сократить потребность в ресурсах и время производства;
  • «демократизировать» (т.е. использовать неспециализированных) специалистов по данным, работающих горизонтально над большинством задач с добавленной стоимостью с помощью стандартизированных инструментов;
  • уменьшить технические барьеры и обеспечить более тесное сотрудничество с нетехническими малыми и средними предприятиями, предлагая большую наглядность и расширяя потенциальные варианты использования.

2. Критерии выбора решения для индустриализации машинного обучения.

Как организациям следует выбирать решения для индустриализации машинного обучения в соответствии с их потребностями и стратегей?
  • Отраслевые варианты использования влияют на рабочие процессы машинного обучения, сильно различаясь в зависимости от уровня риска, требуемого управления данными, актуальности для малого и среднего бизнеса и сложности модели.
  • Потенциальная долгосрочная зависимость от сторонних поставщиков означает, что организации могут иметь долгосрочные партнерские отношения, часто делая выбор между лучшими в своем классе и сквозными/облачными платформами машинного обучения, а также между открытым исходным кодом и поддерживаемым предприятием программнымого обеспечения
3. Ответственность за AI и ML

Как определляются роли подотчетности в деле обеспечения надежного и ответсвенного AI/M по мере развития решений?
  • Процессы и ответственность за поддержку решений ML в настоящее время плохо определены, при этом отсутствует ясность в отношении ролей ответственности в рабочем процессе ML.
  • Как и в случае с прикладным ИИ, организациям придется искать компромиссы в отношении того, какие аспекты надежного ИИ являются приоритетными для их бизнеса, что будет иметь последующее влияние на их решения и взаимодействие с решениями для индустриализации МО.

Источник. 
McKinsey Technology Trends Outlook 2022. August 2022. McKinsey analysis. 

Комментариев нет:

Отправить комментарий