Repositorio que contiene los scripts y explicaciones en R sobre el dataset Titanic de una de las competiciones activas en Kaggle.
-
First Approach: Encontramos scripts para implementar ingenieria de caracteristias, una regresión logística para estudiar las características más relevantes y por último predicción basada en Random Forest y un intento de XGBOOST.
-
Final Approach: En este proyecto en R encontramos los scripts y explicaciones para implementar un modelo más avanzado que el anterior. Está basado en el tutorial de Marcio Gualtieri y con el podremos obtener 0.82 de acc en test.