Вопрос
В чем разница между специалистом по обработке данных (data scientist) и инженером по машинному обучению (machine learning engineer)? What is the difference between a data scientist and a machine learning engineer?
Специалист по обработке данных (Data Scientist) стратегически ориентирован, тогда как инженер по машинному обучению играет в тактическом поле.
Специалист по обработке данных - это бизнес-ориентированная функция. Их основная роль заключается в повышении ценности бизнеса на базе использования научных методов работы с данными. Инженер по машинному обучению - это функция, ориентированная на продукт. Его основная роль заключается в создании определенного алгоритма, соответствующего конкретным требованиям. Но и тут не следует путать с исследователями методов машинного обучения, такие специалисты обычно имеют научную степень.
Специалист по данным решает бизнес-задачи, переводя их на научный язык, с тем, чтобы решать их с помощью статистики и математики. Инженер по машинному обучению решает очень узкую задачу: как обучить модель на конкретном наборе данных, чтобы получить конкретный результат.
Специалист по обработке данных - это архитектор, который выясняет, как использовать в определенной области инструменты машинного обучения. Инженер по машинному обучению реализует определенный класс инструментов (например, нейронную сеть глубокого обучения) для выполнения конкретной задачи, например, распознавания объектов в последовательности изображений.
Специалист по данным может разработать сценарий, в который он может добавить алгоритм для оптимизации конкретного процесса или конкретный алгоритм. Инженер по машинному обучению построит алгоритм, который будет включен в предоопреденный сценарий. Конечно, тут часть функций может быть одинакова, но специалист по данным тратит большую часть времени на моделирование и понимание данных.
Сегодня специалист по анализу данных может заложить основы решения и выполнить некоторые работы по доказательству концепции, которые подтверждают вариант использования и определяют ценность для бизнеса. Затем приходит инженер по машинному обучению, строит и подправляет модель. Инженер по машинному обучению не обязан знать о о бизнесе, результатах или о предметной области. Ему просто нужен спроектированный набор данных, который специалист по анализу данных представил команде инженеров данных, чтобы построить модель для решения очень конкретной задачи.
Специалист по анализу данных имеет широкий спектр входных данных, которые он должен преобразовать в четко определенные и хорошо продуманные выходные данные. Инженер по машинному обучению имеет последовательные входные данные и выдает согласованные выходные данные.
На деле инженеров по машинному обучению просят делать и то, и другое, что не является их настоящей специальностью. Специалистов по обработке данных также просят делать и то, и другое, но это не обязательно то, что они должны делать с точки зрения эффективного использования их времени и квалификации.
С точки зрения обучения инженеру по машинному обучению требуется гораздо меньше фундаментальных знаний - каким бы глубоким не было бы обучения, какой бы сложной не была бы модель. Специалисту по анализу данных, возможно, потребуется большая подготовка и хорошее чувство интуиции в отношении реального мира, потому что его роль кросс-функциональна. Специалист по анализу данных с глубокими знаниями в области количественного анализа данных мог бы выполнить функции инженера по машинному обучению, но инженер по машинному обучению не может с легкостью заместить специалиста по данным.
Проще говоря, специалист по данным переводит бизнес-проблемы в научную область и создает основу для решения, управляемого данными. Инженер по машинному обучению вряд ли будет обучен этому, хотя на деле, это действительно зависит от конкретного образования человека и его сильных сторон.
Если рассмотреть роли «Ученый» и «Инженер», то можно утверждать что роль «Инженер» требует меньше уникальных способностей и навыков по сравнению с ролью "Ученый". И это соображение имеет значение с точки зрения функции поиска и найма талантливых и квалифицированных сотрудников. Правильное соответствие ролей и квалификации с обязанностями и способностями сотрудников определяет эффективность как кадровой так и функциональной работы. Вопреки эгалитарному мифу плоской организации, титулы не являются бессмысленными или произвольными, они выполняют жизненно важную функцию - они объясняют, что вы на самом деле должны делать, что делаете и что способны делать. Согласно Фейнмана нельзя путать знание имени вещи со знанием самой вещи, но в интересах здравомыслия стоит назовать вещи в соответствии с тем, чем или кем они являются на самом деле.
Ответ
Специалист по обработке данных (Data Scientist) стратегически ориентирован, тогда как инженер по машинному обучению играет в тактическом поле.
Специалист по обработке данных - это бизнес-ориентированная функция. Их основная роль заключается в повышении ценности бизнеса на базе использования научных методов работы с данными. Инженер по машинному обучению - это функция, ориентированная на продукт. Его основная роль заключается в создании определенного алгоритма, соответствующего конкретным требованиям. Но и тут не следует путать с исследователями методов машинного обучения, такие специалисты обычно имеют научную степень.
Специалист по данным решает бизнес-задачи, переводя их на научный язык, с тем, чтобы решать их с помощью статистики и математики. Инженер по машинному обучению решает очень узкую задачу: как обучить модель на конкретном наборе данных, чтобы получить конкретный результат.
Специалист по обработке данных - это архитектор, который выясняет, как использовать в определенной области инструменты машинного обучения. Инженер по машинному обучению реализует определенный класс инструментов (например, нейронную сеть глубокого обучения) для выполнения конкретной задачи, например, распознавания объектов в последовательности изображений.
Специалист по данным может разработать сценарий, в который он может добавить алгоритм для оптимизации конкретного процесса или конкретный алгоритм. Инженер по машинному обучению построит алгоритм, который будет включен в предоопреденный сценарий. Конечно, тут часть функций может быть одинакова, но специалист по данным тратит большую часть времени на моделирование и понимание данных.
Сегодня специалист по анализу данных может заложить основы решения и выполнить некоторые работы по доказательству концепции, которые подтверждают вариант использования и определяют ценность для бизнеса. Затем приходит инженер по машинному обучению, строит и подправляет модель. Инженер по машинному обучению не обязан знать о о бизнесе, результатах или о предметной области. Ему просто нужен спроектированный набор данных, который специалист по анализу данных представил команде инженеров данных, чтобы построить модель для решения очень конкретной задачи.
Специалист по анализу данных имеет широкий спектр входных данных, которые он должен преобразовать в четко определенные и хорошо продуманные выходные данные. Инженер по машинному обучению имеет последовательные входные данные и выдает согласованные выходные данные.
На деле инженеров по машинному обучению просят делать и то, и другое, что не является их настоящей специальностью. Специалистов по обработке данных также просят делать и то, и другое, но это не обязательно то, что они должны делать с точки зрения эффективного использования их времени и квалификации.
С точки зрения обучения инженеру по машинному обучению требуется гораздо меньше фундаментальных знаний - каким бы глубоким не было бы обучения, какой бы сложной не была бы модель. Специалисту по анализу данных, возможно, потребуется большая подготовка и хорошее чувство интуиции в отношении реального мира, потому что его роль кросс-функциональна. Специалист по анализу данных с глубокими знаниями в области количественного анализа данных мог бы выполнить функции инженера по машинному обучению, но инженер по машинному обучению не может с легкостью заместить специалиста по данным.
Проще говоря, специалист по данным переводит бизнес-проблемы в научную область и создает основу для решения, управляемого данными. Инженер по машинному обучению вряд ли будет обучен этому, хотя на деле, это действительно зависит от конкретного образования человека и его сильных сторон.
Если рассмотреть роли «Ученый» и «Инженер», то можно утверждать что роль «Инженер» требует меньше уникальных способностей и навыков по сравнению с ролью "Ученый". И это соображение имеет значение с точки зрения функции поиска и найма талантливых и квалифицированных сотрудников. Правильное соответствие ролей и квалификации с обязанностями и способностями сотрудников определяет эффективность как кадровой так и функциональной работы. Вопреки эгалитарному мифу плоской организации, титулы не являются бессмысленными или произвольными, они выполняют жизненно важную функцию - они объясняют, что вы на самом деле должны делать, что делаете и что способны делать. Согласно Фейнмана нельзя путать знание имени вещи со знанием самой вещи, но в интересах здравомыслия стоит назовать вещи в соответствии с тем, чем или кем они являются на самом деле.
Источник
Pradyumna S. Upadrashta
https://www.quora.com. "What-is-the-difference-between-a-data-scientist-and-a-machine-learning-engineer"
Комментариев нет:
Отправить комментарий