Комментарии, вопросы, пожелания приветствуются.
Буду рад ответить на ваши вопросы: alimbekovr@hotmail.com.

3 заметки с тегом

Data Scientist

Курсы для Data Scientist — часть 2

В продолжение первой части поста про курсы для Data Scientist публикую вторую подборку. Надеюсь будет полезной начинающим знакомиться с Machine Learning и Data Science.

Материалы от tproger

Подборка материалов для изучения машинного обучения
Бесплатные книги по Pythonдля программистов любого уровня: разработка игр, анализ данных, машинное обучение
18 полезных библиотек для анализа данных в Python
9 полезных бесплатных книг по машинному обучению
Изучаем нейронные сети: с чего начать
10 полезных ресурсов для обучения Python
Простой классификатор изображений на Python с помощью библиотеки TensorFlow: пошаговое руководство
Курс «Язык Python»

Python

7 обязательных к прочтению книг по Python

Python Pandas

Введение в pandas: анализ данных на Python
Введение в структуры данных в pandas
Анализ данных с Python и Pandas Туториал
Туториал Pandas — Часть 1
Туториал Pandas — Часть 2
Pandas Cheat Sheet for Data Science in Python
Открытый курс машинного обучения. Тема 1. Первичный анализ данных с Pandas

R

R введение

Интересные интернет ресурсы

Сайт с огромным количеством туториалов по DS/ML
Репозиторий с огромным количеством туториалов по  Python по теме Data Science, NLP и Machine Learning
Репозиторий с неменьшим количество туторивлов: Deep learning (TensorFlow, Theano, Caffe, Keras), scikit-learn, Kaggle, big data (Spark, Hadoop MapReduce, HDFS), matplotlib, pandas, NumPy, SciPy

Прочее

Как использовать нейронную сеть для классификации изображений
Онлайн курс «Программирование глубоких нейронных сетей на Python»
Классификация изображений
Туториалы tensorflow

Полезняшки

Data Analysis with Pandas Cheat Sheet
Python for Data Science
NumPy Basics
NumPy Cheat Sheet
NumPy Data Science Cheat Sheet
NumPy Data Science Cheat Sheet
Как стать Data Scientist'ом
Как быстро выучить Python для анализа данных
Чтобы стать Data Scientist'ом, сконцентрируйтесь на программировании


  • Telegram канал c конспектами книг @fresh_brain

Курсы для Data Scientist

Начинаю усиленно готовится к тому, что бы стать Data Scientist. Кто такой Data Scientist можете почитать тут. Основным языком программирования я выбрал Python, но не забуду и про R. Поэтому как следствие я для обучения я подобрал для себя ряд курсов и других учебным материалов, ссылками на которые с вами охотно поделюсь. Сразу хотелось бы сказать, что мои познания в этой области крайне малы, как следствие выбирал курсы и для совсем новичков.

Материалы от tproger

Материалы для изучения Python
Всё для изучения Python: 181 бесплатный материал + бонус

Курсы от coursera

Специализация «Наука о данных»
Курс «Введение в машинное обучение». ВШЭ
Курс «Машинное обучение»
Специализация «Машинное обучение»
Специализация «Машинное обучение и анализ данных». Московский физико-технический институт

Python

Python3 для начинающих
Учите Питон
Введение в программирование на Python
Язык программирования Python
Практикум по алгоритмизации и программированию на Python
DataCamp
DataQuest
Общий взгляд на машинное обучение: классификация текста с помощью нейронных сетей и TensorFlow
Машинное обучение и Python, часть 1
Big Data и кластерный анализ: разбираемся в понятиях и изучаем тему
Несколько интересных докладов по Python
Много полезностей по Python
Несколько интересных видео по Python
Несколько видеоуроков по Python
Подборка разъясняющих материалов для тех, кто начал изучение Python

Data Mining и Machine Learning

Практические видеоматериалы по машинному обучению
9 бесплатных книг по машинному обучению
Data Mining
Алгоритмы интеллектуальной обработки больших объемов данных
Машинное обучение
Подборка материалов для тех, кто уже познакомился с Python и хочет двигаться в сторону машинного обучения
Большая подборка материалов по машинному обучению: книги, видеокурсы, онлайн-курсы
Полезные видеоматериалы по машинному обучению
Несколько видеоуроков по машинному обучению

PHP

Машинное обучение и нейронные сети на PHP это просто


  • Telegram канал c конспектами книг @fresh_brain

Профессия Data Scientist

Сейчас в мире все больше говорят про Big Data. И все больше становится понятно, что для создания проектов в этой области вам понадобится специалист Data Scientist.
Кто же он? Что он должен уметь? Какими знаниями обладать?

Кто такие Data Scientists?

Data Scientist:

  • Любит данные
  • Исследовательский склад ума
  • Цель работы — нахождение закономерностей в данных
  • Практик, не теоретик
  • Умеет и любит работать руками
  • Эксперт в прикладной области
  • Работает в команде

Предпочтительное образование:

  • Computer Science
  • Статистика, математика
  • Точные науки: Физика, Инженерия, итд
  • Магистры и кандидаты наук

Рабочие инструменты Data Scientists

  1. Операционные системы:
    • Linux + shell tools
  2. Big data инструменты:
    • Hadoop (MapReduce) + hadoop tools
    • Hive, Pig
    • NoSQL (Hbase, MongoDB, Cassandra, Neo4J)
  3. Базы данных:
    • SQL
  4. Программирование:
    • Python
    • Java
    • Scala
  5. Machine Learning:
    • R
    • Matlab
    • Python libraries (NumPy, SciPy, Nltk,…)
    • Java libraries (Mahaut)

Data Scientist или Аналитик — сравнение
Data Scientist:

  • Используют Hadoop, MapReduce, Hive, R
  • Создают специализированные системыи инструменты
  • Работают со структурированными и не структурированными данными
  • Рабочие данные измеряются в TB, PB
  • Опыт научной работы, экспертиза в статистке, машинном обучении,программировании
  • Магистры и кандидаты наук (PhDs)
  • Разрабатывают предсказательными модели
  • Создают data products

Аналитик:

  • Используют Excel, SQL
  • Используют существующие инструменты и системы
  • Работают с табличными данными
  • Данные измеряются MB,GB
  • Профессиональное образование,нет формального научного
  • Бакалавры etc (BS, BA, MS, MBA)
  • Работают тесно с BI и маркетингом
  • Создают отчеты и описывают данные
  • Чаще всего данные о показателях работы бизнеса

Что почитать?

Профессия Data Scientist

  • Telegram канал c конспектами книг @fresh_brain