Тестовое задание
Руководство компании обратило внимание на то, что сотрудники старше 35 лет болеют чаще, чем более молодые сотрудники. Кроме этого, среди мужчин количество пропусков рабочих дней в связи с больничным выше, чем среди женщин. В связи с этой ситуацией, руководство организации планирует ввести дополнительные медицинские осмотры среди групп риска.
Вам необходимо проверить следующие гипотезы:
-
Мужчины пропускают в течение года более 2 рабочих дней (work_days) по болезни значимо чаще женщин.
-
Работники старше 35 лет (age) пропускают в течение года более 2 рабочих дней (work_days) по болезни значимо чаще своих более молодых коллег. Все необходимые данные содержатся в файле «М.Тех_Данные_к_ТЗ_DS».
Решение необходимо предоставить:
-
В виде jupyter notebook (с аккуратно оформленным кодом, графиками и описанной логикой решения).
-
В виде дашборда на Streamlit с простым функционалом:
a. должна быть возможность загрузить .csv, в формате аналогично файлу «Статистика»
b. должна быть возможность задать параметры age и work_days
c. указан результат проверки гипотез
d. указана логика получения результата (должны быть отрисованы графики распределений, указаны критерии проверки (стат. тесты, статистики, уровень значимости т.п.)
Код проекта должен быть обернут в docker выложен в Gitlab/Github репозиторий предоставлена ссылка на него, сохраненная в файл формата .doc, .docx, .pdf, tss. Файл назови по следующему принципу: Фамилия_Имя_Название_вакансии. Будет обращаться внимание на качество кода, код стайл, оформление ноутбука, кода и репозитория. Будет плюсом, если дашборд будет поднят на сервере и на него будет предоставлена ссылка