Комментарии, вопросы, пожелания приветствуются.
Буду рад ответить на ваши вопросы: alimbekovr@hotmail.com.

2 заметки с тегом

Data Scientist

Курсы для Data Scientist

Начинаю усиленно готовится к тому, что бы стать Data Scientist. Кто такой Data Scientist можете почитать тут. Основным языком программирования я выбрал Python, но не забуду и про R. Поэтому как следствие я для обучения я подобрал для себя ряд курсов и других учебным материалов, ссылками на которые с вами охотно поделюсь. Сразу хотелось бы сказать, что мои познания в этой области крайне малы, как следствие выбирал курсы и для совсем новичков.

Материалы от tproger

Материалы для изучения Python
Всё для изучения Python: 181 бесплатный материал + бонус

Курсы от coursera

Специализация «Наука о данных»
Курс «Введение в машинное обучение». ВШЭ
Курс «Машинное обучение»
Специализация «Машинное обучение»
Специализация «Машинное обучение и анализ данных». Московский физико-технический институт

Pyhton

Python 3 для начинающих
Учите Питон
Введение в программирование на Python
Язык программирования Python
Практикум по алгоритмизации и программированию на Python
DataCamp
DataQuest
Общий взгляд на машинное обучение: классификация текста с помощью нейронных сетей и TensorFlow
Машинное обучение и Python, часть 1
Big Data и кластерный анализ: разбираемся в понятиях и изучаем тему
Несколько интересных докладов по Python
Много полезностей по Python
Несколько интересных видео по Python
Несколько видеоуроков по Python
Подборка разъясняющих материалов для тех, кто начал изучение Python

Data Mining и Machine Learning

Практические видеоматериалы по машинному обучению
9 бесплатных книг по машинному обучению
Data Mining
Алгоритмы интеллектуальной обработки больших объемов данных
Машинное обучение
Подборка материалов для тех, кто уже познакомился с Python и хочет двигаться в сторону машинного обучения
Большая подборка материалов по машинному обучению: книги, видеокурсы, онлайн-курсы
Полезные видеоматериалы по машинному обучению
Несколько видеоуроков по машинному обучению

PHP

Машинное обучение и нейронные сети на PHP это просто

Профессия Data Scientist

Сейчас в мире все больше говорят про Big Data. И все больше становится понятно, что для создания проектов в этой области вам понадобится специалист Data Scientist.
Кто же он? Что он должен уметь? Какими знаниями обладать?

Кто такие Data Scientists?

Data Scientist:

  • Любит данные
  • Исследовательский склад ума
  • Цель работы — нахождение закономерностей в данных
  • Практик, не теоретик
  • Умеет и любит работать руками
  • Эксперт в прикладной области
  • Работает в команде

Предпочтительное образование:

  • Computer Science
  • Статистика, математика
  • Точные науки: Физика, Инженерия, итд
  • Магистры и кандидаты наук

Рабочие инструменты Data Scientists

  1. Операционные системы:
    • Linux + shell tools
  2. Big data инструменты:
    • Hadoop (MapReduce) + hadoop tools
    • Hive, Pig
    • NoSQL (Hbase, MongoDB, Cassandra, Neo4J)
  3. Базы данных:
    • SQL
  4. Программирование:
    • Python
    • Java
    • Scala
  5. Machine Learning:
    • R
    • Matlab
    • Python libraries (NumPy, SciPy, Nltk,…)
    • Java libraries (Mahaut)

Data Scientist или Аналитик — сравнение
Data Scientist:

  • Используют Hadoop, MapReduce, Hive, R
  • Создают специализированные системыи инструменты
  • Работают со структурированными и не структурированными данными
  • Рабочие данные измеряются в TB, PB
  • Опыт научной работы, экспертиза в статистке, машинном обучении,программировании
  • Магистры и кандидаты наук (PhDs)
  • Разрабатывают предсказательными модели
  • Создают data products

Аналитик:

  • Используют Excel, SQL
  • Используют существующие инструменты и системы
  • Работают с табличными данными
  • Данные измеряются MB,GB
  • Профессиональное образование,нет формального научного
  • Бакалавры etc (BS, BA, MS, MBA)
  • Работают тесно с BI и маркетингом
  • Создают отчеты и описывают данные
  • Чаще всего данные о показателях работы бизнеса

Что почитать?

Профессия Data Scientist