Este proyecto analiza el dataset del Titanic para predecir la sobrevivencia de los pasajeros utilizando técnicas de Machine Learning.
El dataset del Titanic es uno de los conjuntos de datos más conocidos y ampliamente utilizados en ciencia de datos y aprendizaje automático. Este dataset contiene información sobre los pasajeros del Titanic, el famoso transatlántico que se hundió en su viaje inaugural en 1912.
env/
: Ambiente virtual (añadir a .gitignore)dash_app/
: Carpeta que contiene la app inicial de predicciondata/
: Carpeta para datasetsimg/
: Imagenes necesariasmodels/
: Modelos creados a partir de los cuadernosnoteboos/
: Carpeta para Jupyter Notebooks.gitignore
: Archivo para ignorar carpetas/archivosrequirements.txt
: Lista de dependenciasREADME.md
: Descripción del proyecto
-
Clonar el repositorio:
git clone https://github.com/JorgeHdzRiv/TitanicProjectCienciaDatos cd titanic_project
-
Crear y activar un ambiente virtual MAC y Windows respectivamente:
python -m venv env source env/bin/activate .\env\Scripts\activate
-
Instalar dependencias:
pip install -r requirements.txt
-
Ejecutar Jupyter Notebook:
jupyter notebook
-
Abrir y ejecutar las celdas en
notebooks
Exploracion_Datos.ipynb
: Exploración de datos inicialesLimpieza_Datos.ipynb
: Limpieza de datosAnalisis_Visualizacion_Caracteristicas.ipynb
: Analisis de caracteristicas por visualizacionesModelado_Predictivo.ipynb
: Modelo de prediccion para la supervivencia