Skip to content

Repositorio que contiene los scripts y explicaciones en R para elaborar un estudio del data set Titanic por medio de un proceso de preprocesado de datos, regresión logística para la selección de variables y árboles de decisión. Prácticas de la asignatura Tratamiento Inteligente de Datos.

License

Notifications You must be signed in to change notification settings

joseangeldiazg/DataScience-Titanic

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

33 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Titanic: Machine Learning

Repositorio que contiene los scripts y explicaciones en R sobre el dataset Titanic de una de las competiciones activas en Kaggle.

  • First Approach: Encontramos scripts para implementar ingenieria de caracteristias, una regresión logística para estudiar las características más relevantes y por último predicción basada en Random Forest y un intento de XGBOOST.

  • Final Approach: En este proyecto en R encontramos los scripts y explicaciones para implementar un modelo más avanzado que el anterior. Está basado en el tutorial de Marcio Gualtieri y con el podremos obtener 0.82 de acc en test.

About

Repositorio que contiene los scripts y explicaciones en R para elaborar un estudio del data set Titanic por medio de un proceso de preprocesado de datos, regresión logística para la selección de variables y árboles de decisión. Prácticas de la asignatura Tratamiento Inteligente de Datos.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages