Блог

Business Analytics и Data Science

Business Analytics и Data Science 

(после прочтения статьи рекомендуем ознакомиться с материалами Системы непрерывного развития специалиста в области прогнозирования и планирования Predictica)

Наблюдая различные варианты использования терминов Data Science и Business Analytics, нам захотелось внести ясность в различия между этими терминами. Ну, по крайней мере, так, как это интерпретируем мы. Соотнеся наш опыт с мнением зарубежных коллег мы написали эту статью.

В ней мы хотим поговорить о двух основных технологиях, связанных с данными, а именно: бизнес-аналитика (Business Analytics) и Data Science.

Оба этих понятия включают в себя сбор данных, моделирование и анализ информации. Разница между ними заключается в том, что бизнес-аналитика специфична для связанных с бизнесом проблем, таких как стоимость, прибыль, эффективность использования оборудования и т. д., а Data Science отвечает на такие вопросы, каким образом различные факторы, например, социальные, географические, сезонные и т.п влияют на бизнес в целом. Data Science увязывает данные воедино с построением алгоритма и технологией, с тем чтобы давать ответы на поставленные вопросы.

На первый взгляд, оба термина довольно тесно связаны друг с другом и используются взаимозаменяемо, но на самом деле они отличаются друг от друга.

Бизнес-аналитика, как широко используемая прикладная область, существовала довольно долго, более трех-четырех десятилетий, с конца 20-го века. Data Science как отдельная дисциплина получила оформление в качестве отдельной дисциплины где-то в 2010-х годах.

Прежде чем описывать различия, мы предлагаем рассмотреть основные понятия, общие для каждой из этих сущностей.

Итак:

Данные (если использовать это слово как термин) существуют в необработанном виде, а обработанные данные называются информацией. Тут необходимо еще упомянуть «Управление жизненным циклом данных (DLCM)» и классификацию данных.

Что такое DLCM или управление жизненным циклом данных?

- Данные, которые инициируются или обрабатываются, затем создаются, классифицируются, сохраняются, к ним обращаются, обрабатывают, снова сохраняют, используют и, наконец, уничтожают, называют управлением жизненным циклом данных.

Обычно данные в цифровом мире классифицируются как

  1. Структурированные

Данные видны и понятны

Для интерпретации данных требуется очень ограниченная обработка

  1. Слабоструктурированные

Плохо структурированы, но не случайным образом.

Имеют некоторую корреляцию

Для понимания данных требуется небольшой анализ

  1. Неструктурированные

Случайные данные

Требуют много ресурсов и процессов для их преобразования в значимые данные

 

Теперь, когда основные термины определены, попробуем разобраться что есть что.

Что такое Data Science?

Data Science - это междисциплинарная область, которая работает над декодированием и, если этот термин уместен, демистификацией больших наборов данных, именно больших данных (Big Data). В Data Science используется комбинация математики, статистики, информатики, машинного обучения, анализа данных и других смежных областей исследования.

Data Science как таковая состоит из основных 5 этапов (общий взгляд):

  1. Сбор данных
  2. Сохранение данных
  3. Обработка данных
  4. Анализ данных
  5. Отчётность и презентация результатов

А что есть бизнес-аналитика?

Business Analytics - это спектр технологий и практик, предназначенных для сбора, сопоставления, обработки, анализа и изучения данных, относящихся к конкретному бизнесу. Также используется  для мониторинга эффективности бизнеса и улучшения бизнес-планирования.

Роль бизнес-аналитика:

Бизнес-аналитик (Business Analyst) использует различные формы количественного анализа, статистического, прогнозного, аналитического моделирования и итерационных методов для интерпретации бизнес-данных. Таким образом, с помощью полученных результатов компания получает информацию о своей прошлой деятельности, что помогает разрабатывать планы развития бизнеса. Кроме того, бизнес-аналитика также открывает возможности для решения сложных проблем в бизнес-процессах и, тем самым повышает доходность бизнеса через повышение производительности и снижение потерь.

Выделяются четыре вида бизнес-анализа:

1) Описательный анализ - эта форма аналитики отвечает на вопрос «Что случилось?» и является основной формой аналитики, которая не требует высококлассных инструментов, и может быть сделана вручную с минимальным набором инструментов, например, на Excel.

2) Диагностика - здесь основное внимание уделяется вопросу «Почему это произошло?». Этот ответ ищется с помощью аналитических инструментов, таких как детализация, анализ данных и корреляции.

3) Предиктивная аналитика. На этом этапе в аналитике появляется будущее, поскольку этот вид анализа связан с поиском ответа на вопрос «Что будет?» Тут используются статистические и математические инструменты.

Предиктивная аналитика может быть дополнительно разделена на следующие подкатегории:

  1. Прогнозное моделирование (Что дальше?)
  2. Анализ первопричин (RCA) (Почему так случилось?)
  3. Идентификация и корреляция данных - Data Mining
  4. Прогноз (Что будет с этой тенденцией, если она продолжится?)
  5. Метод Монте-Карло (Моделирование, определяющее, как это будет происходить?)

4) Предписывающий анализ (prescriptive analysis) – это момент действия с точки зрения бизнеса.  Именно тут появляется вопрос: «Что должен делать бизнес?», и первичные рекомендации в стиле «Делать надо так». Для этой цели используются инструменты оптимизации и моделирования.

Как соотносятся Data Science и Business Analytics?

Data Science охватывает множество междисциплинарных областей, таких как компьютерные науки, математика, статистика, анализ данных и программирование, искусственный интеллект, машинное обучение, нейронные сети и deep learning для решения сложных задач, состоящих из больших наборов данных.

А учитывая, что Business Analytics используется для решения конкретных бизнес-задач с использованием оптимизации, моделирования, статистики и математики, то, как часть общего процесса Бизнес-аналитику в определенной мере можно назвать частью Data Science.

Таблица основных отличий Data Science от Business Analytics?

 

Бизнес-аналитика

Data Science

Навыки

От специалиста требуются: знание математики, навыки моделирования, оптимизации и статистики

Требует междисциплинарных навыков в области компьютерных наук, программирования, статистики, анализа данных, математики, искусственного интеллекта, ML, DL и нейронных сетей

Использование данных

Использование бизнес-данных

Использование больших наборов данных, называемых Big data

Тип используемых данных

Используются только структурированные данные

Используются все 3 типа данных

Для чего применяется

Используется для получения бизнес-аналитики по бизнес-операциям, получению доходов, прогнозированию продаж, повышению производительности, снижению издержек и брака. То есть, используется для решения конкретных бизнес-задач

Используется для получения ответов о поведении пользователя и решения очень сложных проблем. То есть, используется для определения трендов и создания поведенческих моделей.

Этапы или типы

Четыре типа бизнес-аналитики - описательная, диагностическая, прогнозная и предписывающая

Пять этапов - сбор, сохранение, обработка, анализ и отчетность

Наиболее часто применяемые отрасли

Применяется в промышленности, маркетинге, технологиях, ритейле и финансах

Применяется в образовании, технологиях, финансах и электронной коммерции

Критически важные решения

Используется для принятия критических решений

Результаты Data Science не используются для принятия критических решений

Основные инструменты

Статистический анализ

Программирование

Использование статистики

Статистическое исследование данных – это основа

Данные изучаются в том числе с использованием статистики

Инструменты

MS Excel, базы данных и специализированные пакеты статистического ПО

Языки программирования. Python, AI, алгоритмы, ML, R программирование, Hadoop, алгоритмы DL, нейронные сети и т.п.

Тип работы

Обычная работа, требующая много итераций

Работа включает в себя много исследований и много работы по извлечению данных

Функциональная область

Требуется работа, специфичная для бизнеса

Требуется межфункциональная и междисциплинарная работа

 

Комментарий Центра Статистических Технологий:

Для повышения профессионального уровня рекомендуем Систему Непрерывного Развития специалиста в области прогнозирования и планирования Predictica https://predictica.ru/ 

 

 

comments powered by HyperComments

Остались вопросы?

Напишите нам и мы подробно ответим на все Ваши вопросы!