Стоит Ли Обратить Внимание На Науку О Данных?

Множество людей с очень разным образованием, не всегда даже техническим, в последнее время пытаются заняться наукой о данных.

И такой бурный интерес – проблема для всех, кто задумывается о переквалификации в этой сфере.

Потому что рынок труда может быть переполнен соискателями без опыта.

С точки зрения потенциального работодателя: вы бы предпочли взять на работу выпускника технического вуза или человека за 40 лет, без профильного опыта, решившего изменить свою жизнь? Ведь университеты также активно готовят профильных специалистов (хотя и не всегда на высоком уровне).

На рынке явно ощущается нехватка специалистов с профильным опытом.

Но среди людей с непрофильным опытом работы, вероятно, больше шансов найти выпускников с профильным образованием.

Написать этот пост меня побудило то, что полгода назад я начал писать серию статей о самообучении и переподготовке в области науки о данных.

В итоге за 5 месяцев мне написали более ста человек с различными вопросами о такой переподготовке.

И многие люди, вероятно, недооценивают объем знаний, который для этого необходимо получить.

Наверное, в этом виноваты заголовки моих постов «с нуля до старшего специалиста по данным за 2 года».

Как мне подсказали в комментариях к тому посту, мой начальный уровень был отнюдь не нулевым (я был топовым 1С-разработчиком).



Почему трудно попасть в науку о данных?



Это много учебы и практики.

Идеальный дата-сайентист – это высококвалифицированный специалист, который одновременно знает:
  • все, что нужно знать «простым аналитикам» (SQL + визуализация данных)
  • хороший программист на Python
  • с хорошим знанием английского языка (подавляющее большинство инструментов имеют документацию только на английском языке; многие книги и курсы не переведены, либо переводятся с большой задержкой)
  • с отличным знанием хотя бы основ теории вероятностей (в идеале гораздо глубже + линейный, математический анализ)
  • хорошие коммуникативные навыки и понимание бизнеса (невозможно эффективно обрабатывать данные из домена, если вы их не понимаете)
По большому счету это несколько лет профильного (само)образования + опыт работы.



Это дорого

Даже имея большой опыт работы в IT, я 8 месяцев не работал и проедал все свои сбережения только на учебу, оставшись без работы.

Уровень моей зарплаты в первый год после того, как я нашел работу, был ниже, чем раньше.

Лишь через 2 года я вышел на тот же уровень дохода.

И все это было довольно страшно, несмотря на то, что у меня была своя квартира, большая финансовая подушка и отсутствие финансово зависимых родственников.

Большинство людей, желающих изменить свою жизнь, не могут позволить себе такую траекторию переподготовки из-за ее финансовых ограничений.



Аналитика — сестра науки о данных

Когда говорят о науке о данных, обычно имеют в виду высшую квалификацию человека, который может работать аналитиком данных.

Но квалификация среднего уровня также ценна.

Отличие аналитика: не нужно хорошо знать статистику, не нужно заниматься машинным обучением.

Статистика необходима, когда ценность небольшого улучшения настолько велика, что важно научиться различать небольшие различия в производительности, отделяя реальные различия от случайных колебаний.

Машинное обучение необходимо, когда необходимо автоматизировать какой-либо процесс принятия решений на основе данных.

По сути, это означает замену работы аналитика решением отдельной стандартной задачи.

Обычно это требует гораздо больше времени, чем одноразовый анализ.

За это время аналитик может решить множество различных задач.

Но когда какой-то анализ необходимо проводить постоянно или для тысяч объектов (клиентов, товаров), целесообразно делать это автоматически.

То есть аналитик нужен тогда, когда нет необходимости различать колебания эффективности, измеряемой в процентах, и когда нет необходимости делать анализ полностью автоматическим.

Требуется меньше точности/автоматизации.

Ценное: скорость анализа, его корректность, умение четко и убедительно объяснить свои результаты.

В то же время ценность аналитика может быть очень высокой, т.к.

такой разовый анализ данных может использоваться для принятия различных стратегических решений.

Суть задач аналитика — разобраться в данных, разобраться в них и найти интересные закономерности, представить результаты в удобной и понятной для коллег форме (обычно графики и презентации).

Ключевой набор навыков для такой работы: природные «аналитические способности» + знание базовых инструментов (SQL+Excel) + инструменты визуализации данных (Tableau, PowerBI).

Имея такой набор знаний + знания, специфичные для определенных областей, уже можно найти большое количество вакансий с хорошей зарплатой и интересными задачами.

Знания инструментов визуализации SQL+ достаточно для работы специалистом по отчетности, создавая необходимые отчеты и графики для принятия повседневных решений.

Такая работа обычно требует больше усидчивости и чуть меньше творчества.

Должность аналитика должна будет создавать точно такие же отчеты.

Но, чаще всего, задачей аналитика будет самому разобраться в чем-то и решить, на каких графиках представлять эту информацию.

Эта работа более творческая, требующая большей самоотдачи.

По уровню заработной платы оба типа должностей сопоставимы.

Но с позиции аналитика талантливые специалисты зачастую могут вырасти в менеджеров и ответственных за какой-то большой объем задач.

Надо помнить, что это разделение не всегда видно из названий должностей, т.к.

«аналитиком» можно назвать и человека, который не анализирует данные самостоятельно, а лишь готовит их для других людей (в виде отчетов и графиков).

.

Кстати, должности специалистов, занимающихся статистическим анализом, еще называют «аналитиками», а есть и совсем другой вид должностей – «бизнес-аналитики».

Поэтому из описания вакансии «аналитик» необходимо понять, что под ней подразумевается.

Рекомендуемый набор знаний для аналитика:

  • SQL + Эксель
  • Таблица/PowerBI
  • Когортный анализ (принципы)
  • Понимать Парадокс Симпсона чтобы не совершать ошибок, к которым это приводит
  • Вам необходимо знать основы теории вероятностей:
    • вероятности зависимых и независимых событий, условные вероятности
    • различная статистика: среднее значение, медиана, мода, стандартное отклонение.

  • знать, что такое AV-тесты: понимать принципы, калькуляторы доступны онлайн
  • знать основы регулярного выражения.

    Например, в веб-аналитике он используется в таких инструментах, как Google Analytics.

Аналитики нужны везде.

Ниже представлены типы аналитиков, востребованные в изначально «цифровом» бизнесе (связанном с интернет-продуктами и услугами)

Маркетинг/веб-аналитика

Анализ и визуализация данных о продажах — это огромная область.

Большая часть таких вакансий с интересными и более творческими задачами находится в онлайн-компаниях.

Знания, специфичные для веб-маркетинга (помимо общих аналитических):

  • Понимание того, как работает контекстная реклама (основные метрики и схемы оплаты).

  • Знание принципов работы UTM-тегов.

  • Понимание основных принципов юнит-экономики.

  • Базовые знания HTML желательны
  • Популярные инструменты: Google Analytics, Яндекс.

    Метрика (эти инструменты можно изучить уже после начала первой работы)



Аналитика продукта

Это близко к маркетинговой аналитике.

Пример задачи: понять закономерности взаимодействия пользователей с каким-либо онлайн-продуктом (например, приложением онлайн-банкинга).

На самом деле здесь может быть достаточно лишь базовых знаний, стандартных для любого аналитика.



Дата-инженер - брат специалиста по данным

Огромная часть задач по анализу данных, особенно более сложных (статистический анализ, машинное обучение), требуют хорошо организованных данных.

Задачи по организации данных занимают более половины всех усилий по обработке данных.

Некоторые из этих задач являются традиционными и решаются специалистами по базам данных.

Другая часть требует подготовки данных для обеспечения большего удобства и скорости анализа данных.

Эти задачи выполняются инженерами данных.

Т.

к.

часто эта часть проблемы ими не решается полностью — квалифицированный специалист по данным должен уметь решать такие проблемы.

Но потенциально дата-инженер — это не урезанный специалист по данным.

От инженеров все чаще требуется полная автоматизация процесса, обеспечение высокого качества данных (без недостающих фрагментов), высокая скорость подготовки и доступности данных, настройка систем, способных обрабатывать данные о миллионах транзакций, продуктах и клиентах за считанные секунды/минуты.

.

По сути, это должность программиста с упором на технологии и инструменты, позволяющие разрабатывать системы данных.

И вместо создания интерфейса (как у фронтенд-разработчиков, или разработчиков под Android/iOS) или какой-то бизнес-логики (бэкенд), их продукт — это система, которая автоматически подготавливает данные для анализа.

И поддерживать эту систему для работы коллег, занимающихся анализом данных.

Спектр знаний в этой области сильно варьируется.

Наверное, самые популярные навыки выглядят так:

  • SQL
  • Питон (Ява, Котлин)
  • бить
  • Докер, Кубернет
Это направление отлично подходит для людей, которые заинтересованы в написании систем обработки больших данных и менее заинтересованы в том, чтобы выяснить, как повысить эффективность бизнеса, пытаясь убедить в этом некоторых коллег.



Ищете работу, которая вам подходит

Цель этого поста — показать, что вариантов интересной работы море.

Многие люди, которые хотят заняться наукой о данных, будут заинтересованы в работе аналитиками и инженерами данных.

Найти такую работу может быть проще, а финансовое вознаграждение в конечном итоге может оказаться на том же или очень близком уровне.

Заниматься наукой о данных без опыта работы в ИТ — это все равно, что хотеть стать нейрохирургом без опыта в медицине.

Разумнее приобрести хотя бы некоторые более простые сопутствующие навыки, начать работать в этой области, а затем расти в ней «естественным путем», получая соответствующий опыт не только из теории, но и из регулярной трудовой практики.

Теги: #Машинное обучение #Карьера в ИТ-индустрии #Большие данные #самообразование #переподготовка

Вместе с данным постом часто просматривают:

Автор Статьи


Зарегистрирован: 2019-12-10 15:07:06
Баллов опыта: 0
Всего постов на сайте: 0
Всего комментарий на сайте: 0
Dima Manisha

Dima Manisha

Эксперт Wmlog. Профессиональный веб-мастер, SEO-специалист, дизайнер, маркетолог и интернет-предприниматель.