En este notebook se encuentra a detalle el desarrollo de todo el presente proyecto con la descripción paso a paso de lo trabajado, sus hallazgos y conclusiones.
La Ciudad Autónoma de Buenos Aires (CABA) es el centro administrativo y comercial del país. Tiene 3 millones de habitantes y cada día se producen cerca de 8,8 millones de viajes. Durante 2019, casi el 50% de esos viajes se realizaron en transporte público, el 22% se hicieron en vehículos particulares y el 4% en bicicleta.
Comenzamos por entender la estructura de los datos, su forma, contenido:
El Dataset del proyecto se extrajo de la página de Secretaría de Transporte y Obras Públicas de la Cuidad de Buenos Aires.
Consiste en un archivo .xls con varias hojas, acá se encuentra resumida su estructura y forma:
Nombre_Columna | Rename | Descripcion del dato y caracteristicas | Datatype |
---|---|---|---|
ID | id_hecho | es el identificador único del evento (siniestro) | str |
N_VICTIMAS | cant_victimas | cantidad de víctimas | int |
FECHA | fecha | fecha en formato dd/mm/aaaa | datetime |
AAAA | año | es el año de ocurrencia del siniestro | int |
MM | mes | es el mes de ocurrencia del siniestro | int |
DD | dia | es nro del dia de ocurrencia del siniestro (siniestro) | int |
HORA | hora | es la hora de ocurrencia del siniestro (siniestro) | HH:MM:SS |
HH | hora_int | es la hora entero de ocurrencia del siniestro (siniestro) | int |
LUGAR_DEL_HECHO | dir | es la direccion donde ocurrió del evento (siniestro) | string |
TIPO_DE_CALLE | tipo_calle | Clasificación: calle, Avenida, Autopista | string |
Calle | calle | es el nombre de la calle donde ocurrió el evento (siniestro) | string |
Altura | alt | es nro de la calle, altura en que ocurrió el evento (siniestro) | string |
Cruce | cruce | es el nombre de la calle que cruza la calle donde ocurrió el siniestro | string |
Dirección Normalizada | dir_Norm | direccion en formato normalizado USIG | string |
COMUNA | comuna | Comuna de la ciudad (1 a 15) | string |
XY (CABA) | location | geocodificación plana | string |
pos x | longitud | longitud con separador punto. WGS84 | string |
pos y | latitud | latitud con separador punto. WGS84 | string |
PARTICIPANTES | participantes | conjunción de víctima y acusado | string |
VICTIMA | victima | Vehículo que ocupaba quien haya fallecido a se haya lastimado a raíz del hecho, o bien peatón/a | string |
ACUSADO | acusado | Vehículo que ocupaba quien resultó acusado/a del hecho | string |
Nombre_Columna | Rename | Descripcion del dato y caracteristicas | Datatype |
---|---|---|---|
ID_hecho | id_hecho | es el identificador único del evento (siniestro) | str |
FECHA | fecha | fecha en formato dd/mm/aaaa | datetime |
AAAA | año | es el año de ocurrencia del siniestro | int |
MM | mes | es el mes de ocurrencia del siniestro | int |
DD | id_hecho | es nro del dia de ocurrencia del siniestro (siniestro) | int |
HORA | hora | es la hora de ocurrencia del siniestro (siniestro) | HH:MM:SS |
ROL | rol | Posición relativa al vehículo que presentaba la víctima en el momento del siniestro | int |
VICTIMA | victima | Vehículo que ocupaba quien haya fallecido a se haya lastimado a raíz del hecho, o bien peatón/a | string |
SEXO | sexo | Sexo informado por fuente policial de la víctima | string |
EDAD | edad | es nro de la calle, altura en que ocurrió el evento (siniestro) | string |
FECHA_FALLECIMIENTO | fecha_fallecimiento | Fecha de fallecimiento de la víctima | string |
Durante el ETL procuramos explorar cada una de las variables del Dataset para eliminar valores duplicados, erroneos, o vacíos y preparar la data para el proceso de EDA.
Para ver en detalle el paso a paso de este proceso se puede consultar:
ETL_EDA_homicidios En este notebook encontraran el proceso completo con sus paso y transformaciones, al tiempo que se desarrollan descripciones y conclusiones de lo analizado y hallado para cada variable.
En el notebook ETL Victimas pueden encontrar el paso a paso detallado de las transformaciones realizadas al dataset homicidios en la hoja victimas.
Este dataframe es luego guardado en victimas_etl.csv para ser utilizado en el EDA de Homicidios.hechos como complementario a hechos_df.
Durante el Analisis Exploratorio de los Datos, nos dedicamos a profundizar el entendimiento de las variables del Proyecto, sus relaciones y
Comenzamos por realizar para todas las variables un:
Vamos a repasar todas las variables del Dataframe homicidios, cargado como hechos_df, para conocer mas a detalle las variables que se presentan y su distribución y potencial de información. Vamos realizar el analisis Univariable de las variables:
Esta variable la descomoponemos en Anio, Mes y Dia. Por lo que su análisis se realiza en las variables individuales.
Vamos a saltearnos la columna fecha y comenzamos directamente con Año.
Cuantos siniestros por año ocurren, cual es la distribución.
Hallazgos: La tendencia de la distribución de siniestros aparenta ir a la baja, siendo la comparativa promedio 2016-2019 versus 2020 y 2021, la caída en 2020 está afectada por el cierre de la pandemia covid-19, con lo cual la tasa real de caida en la cantidad de muertes sería mas asertiva considerar la del 2021, aunque esta también se vería afectada por la misma razón ya que no fue hasta finales del 2021 que realmente se puede considerar la actividad como normal.
Vemos la distribución de los siniestros por mes y por año para detectar patrones o ciclos
Aunque ambos gráficos son confusos, y no permiten ver el detalle, sirven su propósito que es demostrar que no hay patrones o meses con mayor distribución, no sigue una estacionalidad ni una tendencia
También podemos acompañar la visualización del gráfico de arriba, con las estadísticas para esta columna:
- El valor promedio de muertes por mes es de 3.5 muertes, el máximo 12 y el mínimo 1 muerte. Pero para el promedio por año por mes:
- el promedio de muertes por mes disminuye consistentemente desde 2018 a 2021. de 12 muertes por mes a menos de 9 muertes por mes
Vemos la distribución de los siniestros por dia y por año para detectar patrones o ciclos
Buscamos encontrar patrones en la cantidad de accidentes a lo largo de la semana o del mes
Hallazgos: Las conclusiones que se pueden definir de este gráfico son la variabilidad en el total de víctimas por día del mes y la ausencia de una tendencia clara o patrón específico. Es decir, que no hay un día específico del mes que tenga consistentemente un número alto o bajo de víctimas, indicando una distribución bastante aleatoria. Teniendo en cuenta todos los registros, los accidentes tienden a ocurrir principalmente entre los días viernes y lunes, alcanzando su punto máximo los sábados y su mínimo los jueves.
Sin embargo, la diferencia entre la cantidad mínima y máxima registrada durante la semana es solo del 11.5%.
Indagamos mas en profundidad para definir si hay una mayor incidencia real de un aumento en la tasa de siniestros durante el finde semana, viernes a domingo, contra la tasa de muertes durante los dias de semana.
Para esto, calculamos para los dias de semana, el promedio de accidentes diario y para los dias viernes a domingo el promedio de accidentes diario. Y comparamos los mismos.
Conclusiones
- Durante los días de semana, el promedio total de muertes es de 1.02.
- Durante los fines de semana, el promedio total de muertes es de 1.05.
- Esto sugiere que hay una ligera tendencia a un mayor número de muertes durante los fines de semana en comparación con los días laborables.
- Porcentaje de Muertes:
- El 56.28% de las muertes ocurren durante los días de semana.
- El 43.72% de las muertes ocurren durante los fines de semana.
Aunque la diferencia no es significativa, muestra que los fines de semana tienen una proporción ligeramente menor de muertes en comparación con los días laborables.
Vamos a trabajar con la distribución de accidentes por hora para detectar si hay un pico de ocurrencia o picos de ocurrencia de accidentes, es decir si hay alguna hora a la que haya más cantidad de accidentes.
Analizando el gráfico, se observa que la mayor cantidad de accidentes ocurre a las 6 de la mañana con 41 incidentes registrados.
Hay un aumento significativo en los accidentes desde la 1 de la mañana hasta alcanzar este pico a las 6 am. Posteriormente, los números disminuyen pero se mantienen relativamente altos durante el resto del día.
- A las 8 y a las 9 de la mañana hay una disminución notable en los accidentes.
- A partir de las 10 am hasta las 3 pm, los accidentes se mantienen constantes, oscilando entre los 31 y los 36 casos.
- Hay una caída significativa a las 14 horas con solo 17 accidentes.
- Desde las 15 horas en adelante, los números vuelven a ser constantes, manteniéndose alrededor de los 30 casos por hora.
En resumen, es crucial prestar atención adicional durante las primeras horas de la mañana cuando ocurren más accidentes. También es esencial mantenerse alerta durante todo el día ya que no hay una disminución significativa después del pico matutino.
Para esta columna la vamos a trabajar en conjunto con cruce, ya que lo importante será revisar si hay una ocurrencia mayor o incidencia a que los accidentes ocurran en la mitad de la calle o en la intersección de las calles.
Para ello vamos a transformar estas columnas en una sola columna cruce, con un valor booleano:
True: Cuando el siniestro ocurre en la intersección de dos calles
False: Cuando el siniestro ocurre sobre la calle a una altura determinada que no es la intersección entre dos calles
Conclusiones Se pueden ver que la mayor cantidad de muertes ocurren en la intersección de dos calles:
- El 75% de las muertes son en intersecciones
- El 25% ocurren sobre las calles y Avenidas o Autopistas sin cruces de calles.
Conclusiones
El 70% de los accidentes ocurren en Avenidas, luego en calles 20% y por último en Autopistas
Conclusiones La mayor cantidad de muertes involucran a los motociclistas y los peatones, seguidos por autos.
Conclusiones La mayor cantidad de muertes son provocadas por conductores de autos, siendo los de mayor tasa de mortalidad.
Ya habiendo explorado el dataset y cada una de sus variables, ganamos conocimiento en profundidad de las relaciones entre variables y del potencial de información que se presenta en el mismo.Ahora continuaremos con un analisis multivariable, es decir, agruparemos y mostraremos la variables e información para su mejor visualización y entendimiento. Es decir, que comenzaremos con la transformación de la data en información y conclusiones.
Comenzamos por la evolución de los siniestros, esto es por año:
Podemos observar la evolución en la cantidad de muertes por año a partir del 2016, se evidencia un descenso en la cantidad de muertes, igualmente esta cantidad se ve afectada por la pandemia del covid-19 donde en Argentina se declaró un cierre total y casi completo de actividades que influyó de manera directa e importante en los valores del 2020 y 2021, como se puede ver, al realizarse la apertura parcial en 2021 se fue incrementando. Pero ambos años se ven claramente afectados. No se los puede considerar un descenso real en la cantidad, deberíamos poder contar con esta data para el 2023 para poder concluir si se trata efectivamente de una tendencia real.
Ahora conjugamos la cantidad de muertes agregando a lo anterior la variable por tipo de calle (Avenida, Autopista o calle)
Las tasas de muertes por tipo_calle permanecen constantes a lo largo de los años, con una distribución similar:
- 13% de las muertes ocurren en la Autopista.
- 70% de las muertes ocurren en Avenidas.
- y el restante 17% en calles.
Conclusiones: De observar la tabla y gráficos presentados podemos decir:
- Avenida la mayor cantidad de muertes ocurren en Avenidas, el 70% de las muertes y que la cantidad de muertes cae a partir de 2020 a causa de las restricciones de la pandemia. Pero igualmente, se puede decir que se registra una tendencia a la baja, aunque la proporción se mantiene constante
- Calle Le siguen en magnitud, las muertes en la calle, 17% de las muertes, cercanas a la cantidad de muertes en Autopista. Las muertes en la calle se mantienen constantes en proporción y magnitud
- Autopista Las muertes en Autopista son las de menor ocurrencia pero la tendencia también es constante. Con un 13% del total, no se registra una tendencia a la baja
Volvemos a ver las cantidades distorsionadas por la pandemia covid-19 y el aislamiento que hizo disminuir al mínimo la circulación y por ende los siniestros
Para completar nuestro análisis de la evolución de muertes por categoria nos restarian dos categorias muy importantes a considerar:
- Rango de edades
- Sexo
- Rango de Edades y Sexo
Para poder realizar el mismo procederemos a combinar ambas tablas:
- homicidios (informacion general sobre los siniestros)
- victimas (información particular sobre cada una de las 717 muertes, sexo y edades, categorias de victimas)
Vamos a crear un Dataframe combinando ambos, victimas con homicidios, para obtener un dataframe combinando todos los campos e información necesaria para nuestro análisis
Ahora conjugamos la cantidad de muertes agregando a lo anterior la variable por victima, que representa una clasificación agregada del tipo de vehículos. Categorias para tipo de Vehiculo (victima) = ['peaton', 'moto', 'auto', 'cargas', 'bicicleta', 'pasajeros', 'movil', 'otro', 'sd']
- Moto: Podemos observar que es el tipo predominante de muerte por vehiculo (victima). Si lo conjugamos con la información de la tabla anterior, vemos que las muertes de motociclistas representan el 42% del total de las muertes. Y si tomamos su evolución, van con una marcada tendencia a la baja.
- Peatones le siguen en orden de magnitud, con el 37% de las muertes. Desde el 2016 vienen descendiendo la cantidad de muertes de peatones, con una reducción del 50% si comparamos el 2018 contra 2021.
- Auto: es el tercer tipo de vehiculo, con un 13% del total de las muertes, unas 92 muertes desde el 2016 al 2021. también se observa que la tendencia es muy leve, pero a la baja.
Del gráfico, observamos que el número de muertes masculinas fue significativamente mayor que las femeninas durante todos los años representados.
- En 2020, hubo una disminución drástica en el número de muertes registradas para ambos géneros, lo cual es coherente con la restricción de circulación debido a la pandemia de COVID-19 en Argentina.
- A partir de 2021, se observa un aumento en las muertes, pero aún no ha alcanzado los niveles anteriores a la pandemia.
- Número de Muertes por Género a lo Largo de los Años:
- El gráfico muestra el número de muertes por género desde 2016 hasta 2021.
- La línea amarilla representa las muertes masculinas, y la línea azul representa las muertes femeninas.
- A partir de 2021, se observa un aumento en las muertes, aunque aún no han alcanzado los niveles previos a la pandemia.
- Comparación de Géneros:
- Las muertes masculinas superan consistentemente a las femeninas en todos los años.
- La disminución en 2020 se explica por las restricciones de circulación y el impacto de la pandemia.
Distribución de Muertes por Edad: El gráfico representa la cantidad de muertes por rango etario.
- Los grupos de edad se dividen en cinco categorías: 0-17, 18-29, 30-49, 50-65 y 66+.
- Observamos que las personas entre 30-49 años presentan la mayor cantidad de muertes, seguido por el grupo 18-29.
- Los grupos 0-17 y 66+ tienen las cantidades más bajas de muertes. Conclusión:
- Las personas en sus años intermedios (30-49) parecen estar en mayor riesgo según este gráfico.
- La disminución en 2020 se explica por las restricciones de circulación debido a la pandemia de COVID-19.
- Podemos ver que esta distribución de cantidad de muertes por rango etario se mantiene estable, las tasas por rango, a lo largo del tiempo.
El gráfico representa la cantidad de muertes en diferentes grupos de edad y géneros.
- Por cada rango de edad hay dos barras, una para hombres (color azul) y otra para mujeres (color amarillo).
- El grupo de edad con la mayor cantidad total de muertes es el rango de 30–59 años.
- Dentro de este grupo, se observa una diferencia significativa entre géneros: hay más muertes en hombres que en mujeres.
- En los demás grupos de edad, las cifras son relativamente similares entre ambos géneros.
- El grupo de edad con menos muertes es el rango infantil/juvenil (0–17 años). Conclusiones:
- La mayoría de las muertes ocurren en adultos jóvenes y de mediana edad (30–59 años).
- Es importante destacar las diferencias de género.
Vamos a ahora analizar el porcentaje de muertes por tipo de victima El gráfico representa el porcentaje de muertes por tipo (como “Auto”, “Moto”, “Peatones”, etc.) y año. Los tipos de muertes incluidos son: Auto, Bicicleta, Cargas, Moto, Movil, Pasajeros y Peatones.
- A lo largo de los años, se observan cambios en la distribución de muertes en diferentes categorías. Evolución Específica:
- Moto: En 2016, la categoría “Moto” tenía un porcentaje significativo de muertes. Sin embargo, desde el 2016 al 2020 ha disminuido constantemente cada año. Para luego en 2021, crecer nuevamente al 47% que es el valor de origne.
- Peatones: Las muertes de peatones también disminuyen desde el 2016 al 2020, pero a partir del 2021 vuelve a escalar la cantidad de muertes porcentuales de peatones frente al total, aunque no tan drásticamente como las de motociclistas.
Vamos a ahora analizar si hay una franja horaria o momento del dia en que ocurran mas muertes y luego sumaremos a este análisis la segmentación por tipo de victima, en particular para los peatones y motociclistas que representan el 87% de las victimas fatales
- Observaciones: Intensidad de Color:
- La intensidad de color en el gráfico representa la frecuencia de muertes durante diferentes horas del día.
- Tonos más oscuros indican frecuencias más altas, mientras que tonos más claros corresponden a frecuencias más bajas.
- Conclusiones Días de Semana vs. Fin de Semana:
- En días de semana (lunes a viernes):
- El gráfico muestra un patrón consistente con frecuencias de muerte más altas durante las horas de la mañana (alrededor de las 8:00 a.m. a las 10:00 a.m.) y las horas de la tarde (alrededor de las 6:00 p.m. a las 8:00 p.m.).
- Este patrón se alinea con las horas típicas de viaje, sugiriendo que los accidentes o incidentes pueden ocurrir con más frecuencia durante estos momentos.
- En fin de semana (sábado y domingo):
- El patrón es diferente:
- Sábado:
- Los tonos más oscuros se extienden desde la tarde (alrededor de las 2:00 p.m.) hasta la noche (alrededor de las 8:00 p.m.).
- Esto podría estar relacionado con actividades de ocio, eventos al aire libre o vida nocturna.
- Domingo:
- Los tonos más oscuros están distribuidos a lo largo del día, sin horas pico distintas.
- Esto sugiere una distribución más uniforme de muertes los domingos.
- Sábado:
- El patrón es diferente:
-
Descripción:
- Se visualizan datos relacionados con la frecuencia de muertes basada en la hora del día y el día de la semana.
- Cada celda en el mapa de calor representa una hora específica (eje y) en un día específico de la semana (eje x).
- La intensidad del color dentro de cada celda indica la frecuencia de muertes durante esa hora y día.
-
Observaciones Clave:
- Días con Frecuencias Más Altas:
- Sábado:
- Las celdas azules más oscuras están concentradas alrededor del rango de 18:00-19:00 horas.
- Esto sugiere que las tardes de sábado tienen una alta incidencia de muertes.
- Posibles razones podrían incluir actividades nocturnas, reuniones o accidentes durante horas de ocio.
- Domingo:
- Similar al sábado, las celdas azules oscuras aparecen alrededor del rango de 17:00-18:00 horas.
- Las tardes de domingo también experimentan una mayor frecuencia de muertes.
- Nuevamente, esto podría estar relacionado con diversos factores como accidentes de tráfico, actividades al aire libre o emergencias de salud.
- Sábado:
- Días con Frecuencias Más Altas:
-
Conclusiones:
- Horas Pico:
- Sábado por la noche y Domingo por la noche son las franjas horarias con mayor cantidad de accidentes fatales.
- Las campañas de seguridad dirigidas pueden enfocarse en educar al público sobre los riesgos durante franjas horarias específicas.
- Por ejemplo, promover prácticas de conducción segura durante las noches de fin de semana.
- Horas Pico:
-
Descripción:
- Se visualizan datos relacionados con la frecuencia de muertes de peatones según la hora del día y el día de la semana.
- Cada celda en el mapa de calor representa una hora específica (eje y) en un día específico de la semana (eje x).
- La intensidad del color dentro de cada celda indica la frecuencia de muertes de peatones durante esa hora y día.
-
Observaciones Clave:
- Días con Mayores Frecuencias:
- Miércoles:
- Las celdas de color azul más oscuro aparecen alrededor del rango de 18:00 a 19:00 horas.
- Esto sugiere que las tardes de miércoles tienen una alta incidencia de muertes de peatones.
- Miércoles:
- Viernes:
- Otro pico ocurre entre las 14:00 y las 15:00 horas.
- Las tardes de viernes también experimentan una mayor frecuencia de muertes de peatones.
- Días con Mayores Frecuencias:
-
Conclusiones:
- Las tardes de miércoles y los viernes por la tarde son periodos críticos.
Utilizamos la página de Estadísticas y Censo de la Cuidad de Buenos Aires para obtener información sobre la población, su distribución a lo largo de los años, el género y rango etario, para poder utilizarla luego en combinación con los dataset creados para la generación y construcción de KPIs en el Dashboard. Todo este proceso se encuentra a detalle en Data Adicional
Todo lo relativo a la creación de la base de Datos en MySQL desde Python y su posterior conexión con Power BI para la creación del Dashboard interactivo se encuentra detallado en : Creación de Database desde Python a MYSQL y Conexión de MySQL con Power BI
Primero guardamos, luego del proceso de ETL y EDA detallado, los Dataframe resultantes en formato .csv.
Estos son:
- homicidios_etl.csv : son los registros de los homicidios por número de siniestro y toda la información relevante, luego de la limpieza y transformacion de los datos.
- victimas_completo.csv: es el dataframe donde se vinculan las victimas cada una identificada y asociada a su id de siniestro con la informacion adicional del género, edad y rango etario definido como información más relevante y complementaria a homicidios.
Segundo, creamos en MySQL Workbench la Database, que llamamos proyecto_individual_02.
El tercer paso fue conectar Python con MySQL, para que desde Python, con la base de datos ya creada, pudieramos crear y migrar con tan sólo unas pocas líneas de codigo las Tablas que serían nuestra base de Datos y posterior recursos en Power Bi.
Luego, tocó conectar la Base de Datos de MySQL con Power BI, en el notebook Connection_mysql se encuentra el instructivo para replicar lo que es la creación y la conexión en caso de que quisieran utilizarla o explorarla. Con esto quedamos listos para comenzar a crear el Dashboard y todas las visualizaciones.
Dashboard_Siniestros_Viales_2021
Acompaña a este Dashboard el Informe donde se presenta el Proyecto: Dashboard_Siniestros_Viales_2021
En el marco del Plan de Seguridad Vial 2020-2023, La Ciudad de Buenos Aires propone en una reducción del 50% en las víctimas fatales para el año 2030. Como se presenta en el Informe, el principal desafío que se presenta para alcanzar este objetivo es reducir la tasa de mortalidad, o la cantidad de muertes de los dos principales grupos más vulnerables detectados durante el desarrollo del proyecto:
- Hombres de entre de 30-49 años que representan el 32% de las victimas
- Los Hombre entre 18-29 años, 27%.
Esta es el eje principal en la selección de los indicadores para el Dashboard.
Presentamos cada uno de ellos y el propósito para su implementación:
La tasa de mortalidad muestra una tendencia a la baja en los últimos cuatro años, incluso considerando el impacto de la pandemia de COVID-19.
Este indicador proporciona la frecuencia promedio de muertes en un período de tiempo dado, permitiendo comparaciones y análisis temporales.
Muestra cómo el número de muertes en un período específico difiere de la tendencia promedio observada en un período más largo.
Destaca que el 47% de las muertes en siniestros viales involucran a motociclistas, justificando un enfoque específico en este grupo.
Con el 34% de las muertes, los peatones son el segundo grupo más vulnerable, lo que subraya la importancia de considerar medidas de seguridad para ellos.
En suma, ocho de cada diez personas fallecidas (80%) en siniestros viales fueron usuario/as vulnerables de la vía, motociclistas o peatones.
Respecto a 2019, para excluir el 2020 que tiene la particularidad del cierre por la pandemia, se observa una reducción de las víctimas fatales peatonales, ocupantes de automóvil y motociclistas, permaneciendo sin cambios la cantidad de ciclistas fallecidos en siniestros viales. |
Resumiendo los hallazgos, pudimos identificar al grupo mas vulnerable:
- Alto Riesgo para Hombres: Los datos destacan que los hombres entre 18 y 49 años son particularmente vulnerables a los accidentes de motocicleta. Este grupo demográfico debería ser el foco de campañas de seguridad y programas de concientización.
- Patrones de Colisión: La prevalencia de accidentes que involucran autos y vehículos de carga sugiere la necesidad de mejorar las medidas de seguridad vial, especialmente en intersecciones y áreas con tráfico pesado.
- Medidas de Seguridad: Fomentar el uso de casco, licencias adecuadas y técnicas de conducción defensiva puede reducir significativamente las muertes y lesiones.
En resumen, abordar las necesidades específicas de los conductores masculinos en el grupo de edad de 18 a 49 años, promover prácticas de conducción seguras y mejorar la infraestructura vial pueden contribuir a reducir las víctimas de accidentes de motocicleta en la Ciudad de Buenos Aires.
Funciones para el ETL En este link se encuentran las funciones que escribí para realizar varias de las operaciones de limpieza, análisis y transformación del dataset homicidios y victimas utilizados en el proyecto.
Estadística y Censos | Buenos Aires Ciudad
Proyección de población por sexo y edad simple
Road Safety Annual Report 2023
Road Safety Annual Report 2022
Informe movilidad ciclistas
red de bicicletas de la ciudad de Buenos Aires
Secretaría de Transporte y Obras Públicas
Beyond Defaults: Using Custom Fonts in Power BI
Informe del proyecto Salud Urbana en América Latina (Salurbal)