Хакатон: Битва Titанов, кейс: Система прогнозирования отказов и инцидентов на объектах железнодорожной инфраструктуры, заказчик: РЖД
- Python
- UMAPP
- CatBoost
- После анализа датасета, мы выявили в нем очень большое количество признаков, не имеющих корреляцию между собой и целевой переменной.
- Мы решили снизить размерность датасета с помощь технологии UMAPP, он отображает данные на n-размерном измерении. После правильного отображение можно заметить отчетливое разделение признаков
- Дальше мы приступили к обучению модели, и предсказанию. Для обучения мы взяли два классификатора Catboost и SVC. В итоге Catboost дал нам больше точности, f1-score(macro) = 0.9849 График предсказаний и реальных отказов
- Создание рекомендательной системы