В любом случае, наука о данных — это обоснованное извлечение ценности (или пользы) из данных. В этом случае человек понимает, что данные требуют серьезной обработки и работы со стороны многих заинтересованных сторон, прежде чем эти данные станут ценными.
Отсюда можно вывести такое следствие, что наука о данных как организационная деятельность часто описывается с помощью «процесса»ю То есть некоторого рабочего процесса, описывающего шаги, которые необходимо предпринять в превращении данных в ценность. Таким процессом может построение прогностической модели для того, что бы например, знать какой будет отток клиентов, или кто и как положительно отреагирует на маркетинговую кампанию. Это может быть задача сегментации клиентов или просто автоматическое создание периодического отчета с описательной статистикой.
Исходным источником, входом процесса являются данные. Отталкиваясь от это были предложены различные структуры процессы, из которых процесс CRISP-DM или процесс KDD являются довольно популярными в настоящее время.
Примечание. CRISP-DM (Cross-Industry Standard Process for Data Mining) расшифровывается как «Межотраслевой стандартный процесс интеллектуального анализа данных».
Комментариев нет:
Отправить комментарий