El objetivo de este proyecto fue realizar un análisis de datos para el Observatorio de Movilidad y Seguridad Vial (OMSV) con el propósito de generar un Informe sobre la situación actual e histórica de los siniestros y victimas fatales en la Cuidad de Buenos Aires para el período 2016 a 2021, que le permita a las autoridades locales tomar medidas para disminuir la cantidad de víctimas fatales de los siniestros viales. .
El producto de este análisis fue la creación de:
- Un Dashboard para el seguimiento y gestión de los objetivos principales del Plan de Seguridad Vial 2020-2030
- Recomendaciones para la implementación de medidas dentro del Plan de Seguridad Vial 2020-2030
En Argentina se registra un promedio de 4.798 víctimas fatales por siniestros viales al año, lo que equivale a una tasa de mortalidad de 10,73 cada 100.000 habitantes.
Mientras que en la Ciudad Autónoma de Buenos Aires se registra un promedio de 119 víctimas fatales anuales, lo que representa una tasa de mortalidad de 3,87 cada 100.000 habitantes. En conjunto, para el periodo 2016-2021 la Ciudad registró un total de 717 víctimas fatales por siniestros viales.
El 82% de las víctimas fatales fueron usuarios vulnerables de la vía (42% motociclistas, 37% peatones y 3% ciclistas)
El Dataset del proyecto se extrajo de la página de Secretaría de Transporte y Obras Públicas de la Cuidad de Buenos Aires. Consiste en un archivo .xls con varias hojas.
Para el desarrollo del proyecto nos centramos en la hoja homicidios y complementamos la información con la hoja de víctimas.
Durante el ETL procuramos explorar cada una de las variables del Dataset para eliminar valores duplicados, erroneos, o vacíos y preparar la data para el proceso de EDA.
Para ver el paso a paso de este proceso en detalle se puede consultar:
ETL y EDA de homicidios En este notebook encontrarán el proceso completo con sus paso, transformaciones y al tiempo que se desarrollan descripciones y conclusiones de lo analizado y hallado para cada variable.
En el notebook ETL Victimas pueden encontrar el paso a paso detallado de las transformaciones realizadas al dataset homicidios en la hoja victimas.
Este dataframe es luego guardado en victimas_etl.csv para ser utilizado en el EDA de Homicidios.hechos como complementario a hechos_df.
En este dataset encontramos de manera complementaria toda la información demográfica referente a las victimas:
- Edad
- Género
Con esta información complementamos el Dataframe de homicidios, pudiendo realizar análisis mas completos sobre la demografía de las victimas, para caracterizar su perfil.
3.2 EDA - Resumen del Análisis Exploratorio de Datos (EDA) sobre Siniestros Viales en la Ciudad de Buenos Aires
Durante el Análisis Exploratorio de Datos (EDA) del proyecto se realizó un análisis detallado de las variables disponibles, sus relaciones y sus tendencias. En el notebook ETL_EDA_homicidios se encuentra el paso a paso, detalle, desarrollo, hallazgos y conclusiones de todo lo trabajado durante el desarrollo del EDA.
A continuación, resumo los hallazgos más importantes del EDA:
- Análisis Univariable de Homicidios Se realizó un análisis univariable para cada variable del dataset, destacando los siguientes puntos:
- Analisis de la distribución de siniestros por año, mes y día.
- Observaciones de una tendencia a la baja en la cantidad de siniestros, con fluctuaciones debido a eventos como la pandemia de COVID-19.
- No se encontraron patrones claros en la distribución de siniestros por mes o día de la semana.
- Análisis Multivariable de Homicidios Se exploró la relación entre variables y cómo afectan a la cantidad de siniestros:
- Se observó que el 75% de los siniestros ocurrieron en intersecciones de calles.
- Las Avenidas fueron el tipo de calle con más siniestros, 70% de las muertes.
- Los motociclistas (42% de las fatalidades) y peatones (37% de las fatalidades) fueron las víctimas más comunes en los siniestros, seguidos por los conductores de autos.
- Hubo una ligera tendencia a un mayor número de muertes durante los fines de semana en comparación con los días laborables.
- Evolución de la Cantidad de Siniestros
- Se analizó la evolución de la cantidad de siniestros por año y por tipo de calle.
- Observando una tendencia a la baja en la cantidad de siniestros en general, aunque con fluctuaciones debido a eventos externos como la pandemia.
- Nuevamente se volvió a evidenciar que Las muertes de motociclistas representaron la mayoría de las muertes a lo largo de los años, siendo este el grupo mas vulnerable de manera constante.
- Los peatones se ubican en segundo lugar y finalmente los conductores de autos.
- Distribución de Muertes por Edad y Género
- Se observa que el rango etario de 30-49 años representan el 30% de las muertes, siendo el Rango Etario mas vulnerable.
- Las personas entre los 18-29 años representan el segundo grupo mas vulnerable, con el 23% de las muertes
- Las fatalidad en los hombres es significativamente mayor que en las mujeres para todos los años y combinaciones analizados.
- El 75% de las victimas fatales son hombres.
- Se realizó un análisis detallado de la distribución de muertes por edad y género, destacando diferencias significativas entre grupos de edad y género.
- El 32% de las victimas son hombres de entre de 30-49 años representan
- El 27% de las victimas fueron hombres en 18-29 años.
- Ocurrencia de Muertes por Franja Horaria
- Se realizó un análisis detallado de la incidencia del horario en la ocurrencia del siniestro, pero no se encontraron patrones concluyentes.
Igualmente, se identificaron momentos del día con mayor frecuencia de muertes, tanto para motociclistas como para peatones:
- Las tardes de miércoles y viernes son periodos críticos con una alta incidencia de muertes.
Nuestro análisis proporciona una comprensión detallada de los siniestros viales en la Ciudad de Buenos Aires, destacando patrones, tendencias y factores de riesgo asociados. Estos hallazgos pueden ser utilizados para informar políticas públicas, campañas de seguridad vial y medidas de prevención para reducir la incidencia de siniestros y salvar vidas.
Utilizamos la página de Estadísticas y Censo de la Cuidad de Buenos Aires para obtener información sobre la población, su distribución a lo largo de los años, el género y rango etario, para poder utilizarla luego en combinación con los dataset creados para la generación y construcción métricas, relaciones y desarrollo de KPIs y objetivos en el Dashboard.
Para ello, creamos las siguientes tablas a partir de los datos de Censo y Estadísticas:
- Población Total por Año desde 2016 y proyecciones hasta 2025
- Población Total por Género Año desde 2016 y proyecciones hasta 2025
- Población Total por Rango Etario y Año desde 2016 y proyecciones hasta 2025
Todas estos Dataframes también se exportaron a MySQL y forman parte de la Base de Datos creada para el Proyecto.
El proceso y pasos se encuentra a detalle en Data Adicional
Todo lo relativo a la creación de la base de Datos en MySQL desde Python y su posterior conexión con Power BI para la creación del Dashboard interactivo se encuentra detallado en : Creación de Database desde Python a MYSQL y Conexión de MySQL con Power BI
En resumen, primero se guardaron los Dataframe resultantes del proceso de ETL y EDA en formato .csv.
Estos son:
- homicidios_etl.csv : son los registros de los homicidios por número de siniestro y toda la información relevante, luego de la limpieza y transformacion de los datos.
- victimas_completo.csv: es el dataframe donde se vinculan las victimas cada una identificada y asociada a su id de siniestro con la informacion adicional del género, edad y rango etario definido como información más relevante y complementaria a homicidios.
Segundo, se creó en MySQL Workbench la Database, que llamamos proyecto_individual_02.
Tercero, se conectó Python con MySQL, para que desde Python, con la base de datos ya creada, pudieramos crear y migrar con tan sólo unas pocas líneas de código las Tablas que serían nuestra base de Datos y posterior recursos en Power Bi.
Ultimo, tocó conectar la Base de Datos de MySQL con Power BI, en el notebook Connection_mysql se encuentra el instructivo para replicar lo que es la creación y la conexión en caso de que quisieran utilizarla o explorarla.
Con esto quedamos listos para comenzar a crear el Dashboard y todas las visualizaciones.
Dashboard_Siniestros_Viales_2021
En el marco del Plan de Seguridad Vial 2020-2023, La Ciudad de Buenos Aires propone en una reducción del 50% en las víctimas fatales para el año 2030. Como se presenta en el Informe, el principal desafío que se presenta para alcanzar este objetivo es reducir la tasa de mortalidad, o la cantidad de muertes de los dos principales grupos más vulnerables detectados durante el desarrollo del proyecto:
- Hombres de entre de 30-49 años que representan el 32% de las victimas
- Los Hombre entre 18-29 años, 27%.
Esta es el eje principal en la selección de los indicadores para el Dashboard.
Presentamos cada uno de ellos y el propósito para su implementación:
La tasa de mortalidad muestra una tendencia a la baja en los últimos cuatro años, incluso considerando el impacto de la pandemia de COVID-19.
Este indicador proporciona la frecuencia promedio de muertes en un período de tiempo dado, permitiendo comparaciones y análisis temporales.
Muestra cómo el número de muertes en un período específico difiere de la tendencia promedio observada en un período más largo.
Destaca que el 47% de las muertes en siniestros viales involucran a motociclistas, justificando un enfoque específico en este grupo.
Con el 34% de las muertes, los peatones son el segundo grupo más vulnerable, lo que subraya la importancia de considerar medidas de seguridad para ellos.
En el año 2020, se lanzó un Segundo Plan de Seguridad Vial en la Cuidad de Buenos Aires, manteniendo el anterior objetivo de reducir un 20% las víctimas fatales por siniestros viales en la Ciudad para 2023
Alineado con este objetivo, se dispusieron los siguientes 3 objetivos de plazo intermedio, para el seguimiento del Plan:
1. Reducir un 10% la tasa de muertes en siniestros viales de los últimos seis meses contra el semestre anterior
2. Reducir un 7% la cantidad de accidentes mortales de motocilistas en el último año versus el año anterior
3. Alcanzar una reducción del 10% en la cantidad de muertes de peatones en la vía póblica respecto del último año.
Acompaña a este Dashboard el Informe donde se presenta el Proyecto.
En suma, ocho de cada diez personas fallecidas (80%) en siniestros viales fueron usuario/as vulnerables de la vía, motociclistas o peatones.
Respecto a 2019, para excluir el 2020 que tiene la particularidad del cierre por la pandemia, se observa una reducción de las víctimas fatales peatonales, ocupantes de automóvil y motociclistas, permaneciendo sin cambios la cantidad de ciclistas fallecidos en siniestros viales. |
Resumiendo los hallazgos, pudimos identificar al grupo mas vulnerable:
- Alto Riesgo para Hombres: Los datos destacan que los hombres entre 18 y 49 años son particularmente vulnerables a los accidentes de motocicleta. Este grupo demográfico debería ser el foco de campañas de seguridad y programas de concientización.
- Patrones de Colisión: La prevalencia de accidentes que involucran autos y vehículos de carga sugiere la necesidad de mejorar las medidas de seguridad vial, especialmente en intersecciones y áreas con tráfico pesado.
- Medidas de Seguridad: Fomentar el uso de casco, licencias adecuadas y técnicas de conducción defensiva puede reducir significativamente las muertes y lesiones.
En resumen, abordar las necesidades específicas de los conductores masculinos en el grupo de edad de 18 a 49 años, promover prácticas de conducción seguras y mejorar la infraestructura vial pueden contribuir a reducir las víctimas de accidentes de motocicleta en la Ciudad de Buenos Aires.
Funciones para el ETL En este link se encuentran las funciones que escribí para realizar varias de las operaciones de limpieza, análisis y transformación del dataset homicidios y victimas utilizados en el proyecto.
Estadística y Censos | Buenos Aires Ciudad
Proyección de población por sexo y edad simple
Informe del proyecto Salud Urbana en América Latina (Salurbal)
red de bicicletas de la ciudad de Buenos Aires
Secretaría de Transporte y Obras Públicas