Открытый курс OpenDataScience по машинному обучению

❗ Новая сессия стартовала 6 сентября 2017 г. Тут подробное описание активностей в течение курса ❗

Статья про курс на Хабре. Youtube-канал c онлайн-трансляциями и записями лекций. Курс обсуждается в Slack OpenDataScience в канале mlcourse_open. Заявка на вступление.

В статьях курса даются теоретические основы машинного обучения. Навыки практического анализа данных и построения прогнозных моделей можно получить через выполнение домашних заданий и индивидуального проекта, а также за счет участия в 2 соревнованиях по анализу данных. Требуются начальные навыки программирования на Python и знание математики (математический анализ, линейная алгебра, теория вероятностей, математическая статистика) на уровне 2 курса технического ВУЗа.

Статьи на Хабрахабре

Первичный анализ данных с Pandas
Визуальный анализ данных с Python
Классификация, деревья решений и метод ближайших соседей
Линейные модели классификации и регрессии
Композиции: бэггинг, случайный лес
Построение и отбор признаков
Обучение без учителя: PCA и кластеризация
Обучаемся на гигабайтах с Vowpal Wabbit
Анализ временных рядов с помощью Python
Градиентный бустинг. Часть 1
Градиентный бустинг. Часть 2. Скоро...

Видеолекции

Первичный анализ данных с Pandas
Визуальный анализ данных с Seaborn и Matplotlib
Классификация. Деревья решений
Логистическая регрессия + обсуждения соревнования Kaggle

Прочее

Беседа с А.Г. Дьяконовым

Домашние задания

Анализ данных по сердечно-сосудистым заболеваниям (ML Boot Camp V), ipynb
Визуальный анализ данных по сердечно-сосудистым заболеваниям (ML Boot Camp V). ipynb
Деревья решений для классификации и регрессии, ipynb. Реализация дерева решений (опционально, не в зачет рейтинга), ipynb
Логистическая регрессия в задаче тегирования вопросов StackOverflow, ipynb

Соревнования

Идентификация пользователя по последовательности посещенных сайтов ("Элис"). Kaggle Inclass
Прогноз популярности статьи на medium.com. Скоро...

Проекты

Идентификация пользователей по последовательности посещенных сайтов ("Элис"). Описание. Тетрадки.
Индивидуальные проекты. Описаны на Wiki.

Рейтинг

На рейтинг участников влияют домашки, соревнования, проекты, тьюториалы и мини-конкурсы по визуализации данных.

Wiki-страницы этого репозитория:

Все активности по втором запуске курса. Домашки, соревнования, проекты, тьюториалы и мини-конкурсы и все, за что еще можно получить баллы и, главное, опыт.
Prerequisites: Python, математика, DevOps. О том, как лучше подготовиться к прохождению курса, если навыков программирования или знаний математики не хватает.
Домашние задания 1-ой сессии курса. С решениями. На текущий рейтинг не влияют.
Авторы статей и лекторы. Вкратце представляем всех, кто поработал над курсом.
ПО для прохождения курса и Docker – как настроить все ПО для прохождения курса. В частности, описывается, как запустить у себя Docker-контейнер, в котором уже все установлено.
Топ-100 1-ой сессии курса. 1 сессия курса прошла с 28 февраля по 10 июня 2017 года – с домашними заданими, соревнованиями, тьюториалами, конкурсами по визуализации и общим рейтингом. Более 500 участников, было весело 😀. Увековечим имена тех, кто попал в топ-100 финального рейтинга.
Тьюториалы. Одним из заданий в курсе было написать тьюториал на одну из тем вокруг машинного обучения и анализа данных.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

Открытый курс OpenDataScience по машинному обучению

Статьи на Хабрахабре

Видеолекции

Прочее

Домашние задания

Соревнования

Проекты

Рейтинг

Wiki-страницы этого репозитория:

Files

README.md

Latest commit

History

README.md

File metadata and controls

Открытый курс OpenDataScience по машинному обучению

Статьи на Хабрахабре

Видеолекции

Прочее

Домашние задания

Соревнования

Проекты

Рейтинг

Wiki-страницы этого репозитория: