- Таблица с вашими оценками
- Репозиторий прошлого года
- Youtube-каналы с записями семинаров: канал фила
- Материалы для каждого семинара лежат в папках
/sem*
- Если вы хотите скачать из репозитория конкретную папку, просто вставьте ссылку на неё в сервис для скачки.
- Любые вопросы можно задавать в общий чат. Там можно найти поддержку и пофлудить. Относитесь друг к другу уважительным и сделайте этот чат таким же приятным как аналогичный чат на ИАДе
- Канал с основными объявлениями
- Репозиторий с материалами курса по python из прошлого семестра (там же инструкция по установки анаконды и тп)
Добро пожаловать на курс по анализу данных. Основная цель этого курса - научить вас работе с данными. Мы научимся анализировать таблицы, строить красивый визуал, проверять гипотезы, симулировать случайные величины, а также посмотрим на базовые концепции машинного обучения.
На семинарах мы будем активно использовать различные понятия из теории вероятностей и математической статистики. Лекции и семинары по ним лучше не прогуливать ;)
- sem01 Вспоминаем питон на задачах про симуляции! Говорим про распределения. Вводимся в scipy и matplotlib.
- sem02 Вводимся в numpy
- sem03 Вводимся в pandas и визуализацию
- sem04 Больше EDA и разной визуализации!
- sem05 Парсеры
- sem06 Базовое машинное обучение. Вводим основные понятия ML. Говорим про KNN.
- sem07 Разбираемся с линейной регрессией и как её обучить.
- sem08 Обсуждаем регуляризацию и подбор гиперпараметров
- sem09 Что такое классификация и логистическая регрессия?
- sem10 Метрики классификации. Roc-auc.
- sem11 Метод моментов, ЦПТ, доверительные интервалы.
- sem12 АБ-тестирование, гипотезы, критерии.
- sem13 Больше гипотез и критериев! Непараметрические тесты.
- sem14 Семинар про бустрап.
- sem15 Метод максимального правдоподобия.
Вы получаете две оценки. Одну за курс, вторую за независимый экзамен. Оценка за курс ставится по формуле:
Итог = MIN(8, Округление(0.1 * МСР + 0.4 * ДЗ + 0.3 * П + 0.2 * КР))
- МСР — мини-тесты на парах
- ДЗ — домашние работы (их будет 4 штуки, по каждой логической части курса)
- П — свой проект длинной в модуль (расскажем детали позже)
- КР — контрольная в виде демо-варианта независимого экзамена
Обратите внимание, что отдельная оценка будет ставиться за независимый экзамен. Чтобы его сдать придётся заботать не только питон, но ещё и матстат с тревером. Получить оценку выше 8 по правилам ВШЭ нельзя. Если хочется больше, надо сдать НЭ и перезачесть его.
Весь контент, созданный для этого курса распространяются на правах лицензии MIT License либо на правах лицензии WTFPL на ваш выбор. Материалы публикуются как общественное достояние.