Жаль, что я не получил такое письмо три года назад, когда я только начинал учиться.
Наука о данных (ДС).
Чтобы были необходимые ссылки на полезные материалы.
Статья не претендует на полное освещение обширной области ДС.
Однако начинающему специалисту будет полезно.
Наиболее часто используемые технологии в DS:
- свободное владение английским языком;
- Операционная система Убунту Linux (исторически);
- язык программирования Питон (но лучше Анаконда Питон );
- интегрированная среда разработки (IDE) Пичарм (Community Edition бесплатна);
- инфраструктура для машинного обучения (ML Machine Learning), глубокого обучения (DL deep Learning) и создания нейронных сетей ( PyTorch , Тензорфлоу И десятки других );
- если у тебя нет своего мощная видеокарта (графический процессор GPU), то следует использовать бесплатные облачные технологии, основанные на Блокнот Юпитера ;
- умение использовать распределенную систему контроля версий Гит ( GitHub , GitLab , Битбакет и т. д.);
- иметь учетную запись на StackOverflow и все его филиалы .
Их десятки.
Для меня самое полезное( Обработка изображения ) в порядке убывания важности:
- Виртуальная среда — виртуальная среда разработки для различных проектов, инкапсулирующая разные версии библиотек и инструментов.
- NumPy – работа с матрицами, линейная алгебра.
- OpenCV — множество различных алгоритмов работы с изображениями.
- Блокнот Юпитера — это веб-приложение для разработки и запуска программ Python в браузере и в облаке.
- Tensorflow-GPU — настройка нейронных сетей и расчеты на видеокартах.
- iПитон — более удобная консольная работа с командами Python, советую использовать ее вместо консоли по умолчанию.
- Матплотлиб – рисование графиков и диаграмм.
- Подушка – работа со всеми популярными форматами изображений.
- Панды – работа с данными.
- SciPy — расширенная работа с алгоритмами, бесплатная альтернатива программе MatLab.
- Scikit-обучение – алгоритмы машинного обучения.
- Scikit-изображение – расширенная обработка изображений.
- К3Д – работа с 3D-графикой и изображениями в Jupyter Notebook.
Необходимые базы данных (наборы данных) можно найти через сервис Поиск набора данных Google или среди 25 тысяч наборов данных Kaggle .
Что у меня есть:
- Различные программы Python .
Начните с простые скрипты и продолжаем с более сложными.
- Набор инструкций по настройке Ubuntu Linux .
Из них наиболее важные инструкции по установке и настройке.
- Брошюра " Введение в машинное обучение и искусственные нейронные сети » Те самые основы, которые собраны со всего интернета, но в моем «уникальном» исполнении.
- Курсы и видео для начинающих , где и стоит начать изучение нейросетей.
- Полезные инструменты , где каждый найдет что-то интересное для себя.
- Общий список курсов который я прошел и который хотел бы пройти.
Вместе с данным постом часто просматривают:
-
Интернет Будущего Внутри Отдельной Услуги
19 Oct, 24 -
Не Используйте Lockstep В Стратегиях Rts.
19 Oct, 24 -
Эрланг/Отп R13B03
19 Oct, 24