Skip to content

hse-econ-data-science/andan2024

Repository files navigation

Анализ данных на python (коллекция весна 2024)

Полезные ссылки

Идеология курса

Добро пожаловать на курс по анализу данных. Основная цель этого курса - научить вас работе с данными. Мы научимся анализировать таблицы, строить красивый визуал, проверять гипотезы, симулировать случайные величины, а также посмотрим на базовые концепции машинного обучения.

На семинарах мы будем активно использовать различные понятия из теории вероятностей и математической статистики. Лекции и семинары по ним лучше не прогуливать ;)

Большой план маленьких побед

  • sem01 Вспоминаем питон на задачах про симуляции! Говорим про распределения. Вводимся в scipy и matplotlib.
  • sem02 Вводимся в numpy
  • sem03 Вводимся в pandas и визуализацию
  • sem04 Больше EDA и разной визуализации!
  • sem05 Парсеры
  • sem06 Базовое машинное обучение. Вводим основные понятия ML. Говорим про KNN.
  • sem07 Разбираемся с линейной регрессией и как её обучить.
  • sem08 Обсуждаем регуляризацию и подбор гиперпараметров
  • sem09 Что такое классификация и логистическая регрессия?
  • sem10 Метрики классификации. Roc-auc.
  • sem11 Метод моментов, ЦПТ, доверительные интервалы.
  • sem12 АБ-тестирование, гипотезы, критерии.
  • sem13 Больше гипотез и критериев! Непараметрические тесты.
  • sem14 Семинар про бустрап.
  • sem15 Метод максимального правдоподобия.

Самый важный раздел

Вы получаете две оценки. Одну за курс, вторую за независимый экзамен. Оценка за курс ставится по формуле:

Итог = MIN(8, Округление(0.1 * МСР + 0.4 * ДЗ + 0.3 * П + 0.2 * КР))
  • МСР — мини-тесты на парах
  • ДЗ — домашние работы (их будет 4 штуки, по каждой логической части курса)
  • П — свой проект длинной в модуль (расскажем детали позже)
  • КР — контрольная в виде демо-варианта независимого экзамена

Обратите внимание, что отдельная оценка будет ставиться за независимый экзамен. Чтобы его сдать придётся заботать не только питон, но ещё и матстат с тревером. Получить оценку выше 8 по правилам ВШЭ нельзя. Если хочется больше, надо сдать НЭ и перезачесть его.

Лицензия

Весь контент, созданный для этого курса распространяются на правах лицензии MIT License либо на правах лицензии WTFPL на ваш выбор. Материалы публикуются как общественное достояние.

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published