- Загрузите датасет с резюме программистов и проведите предварительный анализ данных. Включите в анализ следующие шаги:
a. Ознакомьтесь с общей структурой и содержанием данных.
b. Проверьте наличие пропущенных значений и решите, как с ними работать.
c. Изучите распределение данных в различных атрибутах (например, опыт работы, образование и т.д.)
- Проведите предобработку данных:
a. Примените необходимые методы для обработки пропущенных значений.
b. Создайте новые признаки (при необходимости).
-
Прогнозирование: Создайте модель прогнозирования, которая будет предсказать уровень желаемой зарплаты (столбец salary в датасет).
-
Проведите анализ полученных результатов:
a. Оцените качество модели машинного обучения по выбранным метрикам.
b. Сделайте выводы о том какие факторы обладают наибольшим влиянием на уровень зарплаты.
- Подготовьте отчет или Jupyter Notebook, демонстрирующий ваш код, результаты и выводы.