Когда я впервые начал свой путь в области науки о данных, я потратил много времени, выясняя, с чего начать, что мне следует изучить в первую очередь и какие ресурсы мне следует использовать.
За последние два года я узнал несколько вещей, которые хотел знать раньше, например, на чем сосредоточиться в первую очередь на программировании или статистике, какие ресурсы мне следует использовать для изучения новых навыков, как мне следует подходить к изучению этих навыков и т. д. на.
Поэтому эта статья написана для того, чтобы дать направление и идеи для тех, кто изучает Наука о данных .
Оглавление:
Введение 1. Математика и статистика 2. Основы программирования 3. Алгоритмы и концепции машинного обучения 4. Проекты в области науки о данныхВведение
Я предполагаю, что как начинающий специалист по данным, вы захотите полностью понять концепции и детали различных алгоритмов машинного обучения, концепций науки о данных и так далее.Поэтому я рекомендую вам начать с базы, прежде чем даже рассматривать алгоритмы машинного обучения или приложения для анализа данных.
Если у вас нет базового понимания исчисления и интегралов, линейной алгебры и статистики, вам будет трудно понять основную механику различных алгоритмов.
Аналогично, если у вас нет базового понимания Python, вам будет сложно применить свои знания в реальных приложениях.
Ниже приведен порядок тем, которые я рекомендую изучить:
- Математика и статистика.
- Основы программирования.
- Алгоритмы и концепции машинного обучения.
1. Математика и статистика
Как и во всем остальном, вам придется изучить основы, прежде чем приступить к интересным вещам.Поверьте, мне было бы намного проще, если бы я начал с изучения математики и статистики, прежде чем приступать к алгоритмам машинного обучения.
Три общие темы, которые я рекомендую изучить, — это исчисление/интегралы, статистика и линейная алгебра (в произвольном порядке).
Интегралы
Интегралы важны, когда речь идет о распределениях вероятностей и проверке гипотез.Хотя вам не обязательно быть экспертом, в ваших интересах изучить основы интегралов.
Первые две статьи предназначены для тех, кто хочет получить представление о том, что такое интегралы, или для тех, кому просто нужно освежить знания.
Если вы абсолютно ничего не знаете об интегралах, я рекомендую вам пройти курс Академии Хана.
Наконец, вот ссылки на ряд практических задач, которые помогут отточить ваши навыки:
- Введение в интегралы (статья).
- Ускоренный курс интегралов (статья).
- Академия Хана: интегральное исчисление (хорошо).
- Практические вопросы (начнём с блока 6).
Статистика
Если есть одна тема, на которой вам следует сосредоточиться, так это статистика.В конце концов, специалист по данным — это действительно современный статистик, а машинное обучение — это современный термин для статистики.
Если у вас есть время, я рекомендую вам пройти курс Технологического института Джорджии под названием « Статистические методы », который охватывает основы вероятности, случайных величин, вероятностных распределений, проверки гипотез и многого другого.
Если у вас нет времени посвятить себя этому курсу, настоятельно рекомендую посмотреть Видео статистики Академии Хана .
Линейная алгебра
Линейная алгебра особенно важна, если вы хотите погрузиться в глубокое обучение, но даже в этом случае полезно знать другие фундаментальные концепции машинного обучения, такие как анализ главных компонентов и рекомендательные системы.
Для освоения линейной алгебры я также рекомендую Ханская Академия !
2. Основы программирования
Точно так же, как важно фундаментальное понимание математики и статистики, фундаментальное понимание программирования значительно облегчит вашу жизнь, особенно когда дело доходит до реализации.Поэтому я рекомендую вам потратить время на изучение основных языков — SQL и Python — прежде чем погружаться в алгоритмы машинного обучения.
SQL
Неважно, с чего начать, но я бы начал с SQL. Почему? Легче учиться и полезно знать, если вы работаете в компании, которая работает с данными, даже если вы не специалист по данным.Если вы новичок в SQL, я рекомендую проверить с учебными пособиями Mode по SQL , так как они очень краткие и подробные.
Если вы хотите изучить более сложные концепции, ознакомьтесь с список ресурсов, где вы можете изучить расширенный SQL .
Ниже приведены несколько ресурсов, которые вы можете использовать для практики SQL:
Питон
Я начал с Python и, вероятно, останусь с этим языком до конца своей жизни.Он далеко впереди с точки зрения вклада открытого исходного кода, и его легко освоить.
Если хотите, можете попробовать R, но у меня нет никаких мнений или советов относительно R. Я обнаружил, что изучение Python на практике гораздо полезнее.
Однако, пройдя несколько ускоренных курсов Python, я пришел к выводу, что этот курс является наиболее полным (и бесплатным!).
Панды
Возможно, самая важная библиотека, которую нужно знать, — это Pandas, которая специально разработана для манипулирования и анализа данных.Ниже приведены два ресурса, которые должны ускорить ваше обучение.
Первая ссылка представляет собой руководство по использованию Pandas, а вторая ссылка содержит множество практических задач, которые вы можете решить, чтобы закрепить свои знания!
3. Алгоритмы и концепции машинного обучения
Если вы дошли до этой части статьи, значит, вы заложили свой фундамент и готовы узнавать интересные вещи.Эта часть разделена на две другие: алгоритмы машинного обучения и концепции машинного обучения.
Алгоритмы машинного обучения
Следующий шаг — изучить различные алгоритмы машинного обучения, как они работают и когда их использовать.Ниже приведен неполный список различных алгоритмов машинного обучения и ресурсов, которые вы можете использовать для изучения каждого из них.
- Линейная регрессия ( Технологический институт Джорджии , СтатКвест ).
- Логистическая регрессия ( СтатКвест ).
- K ближайших соседей ( Массачусетский технологический институт ).
- Деревья решений ( СтатКвест ).
- Наивный Байес ( Теренс Шин , Луис Серрано ).
- Машина опорных векторов ( Учебное пособие по SVM , Элис Чжао ).
- Нейронные сети ( Теренс Шин ).
- Случайные леса ( СтатКвест ).
- АдаБуст ( Теренс Шин , СтатКвест ).
- Повышение градиента ( СтатКвест ).
- XGBoost( СтатКвест ).
- Метод главных компонент ( СтатКвест ).
Концепции машинного обучения
Кроме того, существует несколько фундаментальных концепций машинного обучения, которые вам также стоит изучить.Ниже приведен (неполный) список концепций, которые я настоятельно рекомендую изучить.
Многие вопросы на собеседовании основаны на этих темах!
- Регуляризация .
- Дилемма перемещения — отклонения .
- Матрица путаницы и связанные с ней показатели .
- Площадь под ROC и ROC-кривой (видео) .
- Начальная выборка .
- Обучение ансамблю, сбор и повышение квалификации .
- Нормализация и стандартизация .
4. Проекты в области науки о данных
К этому моменту вы не только заложите прочную основу, но и получите четкое понимание основ машинного обучения.Теперь пришло время работать над личными побочными проектами.
Если вы хотите увидеть несколько простых примеров проектов по науке о данных, ознакомьтесь с некоторыми из моих проектов:
- Прогнозирование качества вина с использованием методов классификации ( статья , Гитхаб ).
- Визуализируйте данные о коронавирусе с помощью Plotly ( статья , Гитхаб ).
- Система рекомендаций фильмов с фильтрами, работающими вместе ( Гитхаб ).
Серебряной пули не существует, поэтому не стесняйтесь относиться к этому посту с недоверием, но я искренне верю, что изучение основ принесет дивиденды в будущем.
И промокод ХАБР — добавит 10% к скидке на обучение, указанной на баннере.
Больше курсов- Фронтенд-разработчик
- Профессия Веб-разработчик
- Курс «Python для веб-разработки»
- Продвинутый курс «Машинное обучение Pro + Deep Learning»
- Курс машинного обучения
- Курс «Математика и машинное обучение для науки о данных»
- Профессия: технический хакер
- Разработчик игр на Unity
- Курс JavaScript
- Профессия Java-разработчик
- разработчик С++
- Курс анализа данных
- Курс DevOps
- Профессия iOS-разработчик с нуля
- Профессия Android-разработчик с нуля
-
Драйверы Ati 8500 — Видеокарта Wonder
19 Oct, 24 -
Непрочитанные Комментарии
19 Oct, 24 -
Стейблкоины: Краткое Руководство
19 Oct, 24 -
Ieee 802.11N — Сколько Весит В Граммах?
19 Oct, 24 -
Компиляция Змейки В Браузере
19 Oct, 24