Как Бы Я Изучал Науку О Данных, Если Бы Начал Пару Лет Назад, Или Руководство По Эффективному Изучению Науки О Данных

Когда я впервые начал свой путь в области науки о данных, я потратил много времени, выясняя, с чего начать, что мне следует изучить в первую очередь и какие ресурсы мне следует использовать.

За последние два года я узнал несколько вещей, которые хотел знать раньше, например, на чем сосредоточиться в первую очередь на программировании или статистике, какие ресурсы мне следует использовать для изучения новых навыков, как мне следует подходить к изучению этих навыков и т. д. на.

Поэтому эта статья написана для того, чтобы дать направление и идеи для тех, кто изучает Наука о данных .



Как бы я изучал науку о данных, если бы начал пару лет назад, или Руководство по эффективному изучению науки о данных






Оглавление:

Введение 1. Математика и статистика 2. Основы программирования 3. Алгоритмы и концепции машинного обучения 4. Проекты в области науки о данных

Введение

Я предполагаю, что как начинающий специалист по данным, вы захотите полностью понять концепции и детали различных алгоритмов машинного обучения, концепций науки о данных и так далее.

Поэтому я рекомендую вам начать с базы, прежде чем даже рассматривать алгоритмы машинного обучения или приложения для анализа данных.

Если у вас нет базового понимания исчисления и интегралов, линейной алгебры и статистики, вам будет трудно понять основную механику различных алгоритмов.

Аналогично, если у вас нет базового понимания Python, вам будет сложно применить свои знания в реальных приложениях.

Ниже приведен порядок тем, которые я рекомендую изучить:

  1. Математика и статистика.

  2. Основы программирования.

  3. Алгоритмы и концепции машинного обучения.






1. Математика и статистика

Как и во всем остальном, вам придется изучить основы, прежде чем приступить к интересным вещам.

Поверьте, мне было бы намного проще, если бы я начал с изучения математики и статистики, прежде чем приступать к алгоритмам машинного обучения.

Три общие темы, которые я рекомендую изучить, — это исчисление/интегралы, статистика и линейная алгебра (в произвольном порядке).



Интегралы

Интегралы важны, когда речь идет о распределениях вероятностей и проверке гипотез.

Хотя вам не обязательно быть экспертом, в ваших интересах изучить основы интегралов.

Первые две статьи предназначены для тех, кто хочет получить представление о том, что такое интегралы, или для тех, кому просто нужно освежить знания.

Если вы абсолютно ничего не знаете об интегралах, я рекомендую вам пройти курс Академии Хана.

Наконец, вот ссылки на ряд практических задач, которые помогут отточить ваши навыки:



Статистика

Если есть одна тема, на которой вам следует сосредоточиться, так это статистика.

В конце концов, специалист по данным — это действительно современный статистик, а машинное обучение — это современный термин для статистики.

Если у вас есть время, я рекомендую вам пройти курс Технологического института Джорджии под названием « Статистические методы », который охватывает основы вероятности, случайных величин, вероятностных распределений, проверки гипотез и многого другого.

Если у вас нет времени посвятить себя этому курсу, настоятельно рекомендую посмотреть Видео статистики Академии Хана .



Линейная алгебра

Линейная алгебра особенно важна, если вы хотите погрузиться в глубокое обучение, но даже в этом случае полезно знать другие фундаментальные концепции машинного обучения, такие как анализ главных компонентов и рекомендательные системы.

Для освоения линейной алгебры я также рекомендую Ханская Академия !




2. Основы программирования

Точно так же, как важно фундаментальное понимание математики и статистики, фундаментальное понимание программирования значительно облегчит вашу жизнь, особенно когда дело доходит до реализации.

Поэтому я рекомендую вам потратить время на изучение основных языков — SQL и Python — прежде чем погружаться в алгоритмы машинного обучения.



SQL

Неважно, с чего начать, но я бы начал с SQL. Почему? Легче учиться и полезно знать, если вы работаете в компании, которая работает с данными, даже если вы не специалист по данным.

Если вы новичок в SQL, я рекомендую проверить с учебными пособиями Mode по SQL , так как они очень краткие и подробные.

Если вы хотите изучить более сложные концепции, ознакомьтесь с список ресурсов, где вы можете изучить расширенный SQL .

Ниже приведены несколько ресурсов, которые вы можете использовать для практики SQL:



Питон

Я начал с Python и, вероятно, останусь с этим языком до конца своей жизни.

Он далеко впереди с точки зрения вклада открытого исходного кода, и его легко освоить.

Если хотите, можете попробовать R, но у меня нет никаких мнений или советов относительно R. Я обнаружил, что изучение Python на практике гораздо полезнее.

Однако, пройдя несколько ускоренных курсов Python, я пришел к выводу, что этот курс является наиболее полным (и бесплатным!).



Панды

Возможно, самая важная библиотека, которую нужно знать, — это Pandas, которая специально разработана для манипулирования и анализа данных.

Ниже приведены два ресурса, которые должны ускорить ваше обучение.

Первая ссылка представляет собой руководство по использованию Pandas, а вторая ссылка содержит множество практических задач, которые вы можете решить, чтобы закрепить свои знания!






3. Алгоритмы и концепции машинного обучения

Если вы дошли до этой части статьи, значит, вы заложили свой фундамент и готовы узнавать интересные вещи.

Эта часть разделена на две другие: алгоритмы машинного обучения и концепции машинного обучения.



Алгоритмы машинного обучения

Следующий шаг — изучить различные алгоритмы машинного обучения, как они работают и когда их использовать.

Ниже приведен неполный список различных алгоритмов машинного обучения и ресурсов, которые вы можете использовать для изучения каждого из них.



Концепции машинного обучения

Кроме того, существует несколько фундаментальных концепций машинного обучения, которые вам также стоит изучить.

Ниже приведен (неполный) список концепций, которые я настоятельно рекомендую изучить.

Многие вопросы на собеседовании основаны на этих темах!






4. Проекты в области науки о данных

К этому моменту вы не только заложите прочную основу, но и получите четкое понимание основ машинного обучения.

Теперь пришло время работать над личными побочными проектами.

Если вы хотите увидеть несколько простых примеров проектов по науке о данных, ознакомьтесь с некоторыми из моих проектов:

  • Прогнозирование качества вина с использованием методов классификации ( статья , Гитхаб ).

  • Визуализируйте данные о коронавирусе с помощью Plotly ( статья , Гитхаб ).

  • Система рекомендаций фильмов с фильтрами, работающими вместе ( Гитхаб ).

Здесь список проектов в области Data Science , на который вы можете посмотреть, чтобы придумать интересный побочный проект. Я надеюсь, что этот пост даст вам направление и поможет в вашей карьере в области науки о данных.

Серебряной пули не существует, поэтому не стесняйтесь относиться к этому посту с недоверием, но я искренне верю, что изучение основ принесет дивиденды в будущем.

И промокод ХАБР — добавит 10% к скидке на обучение, указанной на баннере.



Как бы я изучал науку о данных, если бы начал пару лет назад, или Руководство по эффективному изучению науки о данных

Больше курсов Теги: #Машинное обучение #математика #Алгоритмы #Карьера в ИТ-индустрии #карьера #образование #наука о данных #Инженерия данных #SkillFactory
Вместе с данным постом часто просматривают:

Автор Статьи


Зарегистрирован: 2019-12-10 15:07:06
Баллов опыта: 0
Всего постов на сайте: 0
Всего комментарий на сайте: 0
Dima Manisha

Dima Manisha

Эксперт Wmlog. Профессиональный веб-мастер, SEO-специалист, дизайнер, маркетолог и интернет-предприниматель.