Skip to content

Latest commit

 

History

History
479 lines (315 loc) · 34.6 KB

04. Desarrollo detallado.md

File metadata and controls

479 lines (315 loc) · 34.6 KB

En este notebook se encuentra a detalle el desarrollo de todo el presente proyecto con la descripción paso a paso de lo trabajado, sus hallazgos y conclusiones.

Introducción:

La Ciudad Autónoma de Buenos Aires (CABA) es el centro administrativo y comercial del país. Tiene 3 millones de habitantes y cada día se producen cerca de 8,8 millones de viajes. Durante 2019, casi el 50% de esos viajes se realizaron en transporte público, el 22% se hicieron en vehículos particulares y el 4% en bicicleta.

Comenzamos por entender la estructura de los datos, su forma, contenido:

1. Dataset del Proyecto

El Dataset del proyecto se extrajo de la página de Secretaría de Transporte y Obras Públicas de la Cuidad de Buenos Aires.

Consiste en un archivo .xls con varias hojas, acá se encuentra resumida su estructura y forma:

hechos

Nombre_Columna Rename Descripcion del dato y caracteristicas Datatype
ID id_hecho es el identificador único del evento (siniestro) str
N_VICTIMAS cant_victimas cantidad de víctimas int
FECHA fecha fecha en formato dd/mm/aaaa datetime
AAAA año es el año de ocurrencia del siniestro int
MM mes es el mes de ocurrencia del siniestro int
DD dia es nro del dia de ocurrencia del siniestro (siniestro) int
HORA hora es la hora de ocurrencia del siniestro (siniestro) HH:MM:SS
HH hora_int es la hora entero de ocurrencia del siniestro (siniestro) int
LUGAR_DEL_HECHO dir es la direccion donde ocurrió del evento (siniestro) string
TIPO_DE_CALLE tipo_calle Clasificación: calle, Avenida, Autopista string
Calle calle es el nombre de la calle donde ocurrió el evento (siniestro) string
Altura alt es nro de la calle, altura en que ocurrió el evento (siniestro) string
Cruce cruce es el nombre de la calle que cruza la calle donde ocurrió el siniestro string
Dirección Normalizada dir_Norm direccion en formato normalizado USIG string
COMUNA comuna Comuna de la ciudad (1 a 15) string
XY (CABA) location geocodificación plana string
pos x longitud longitud con separador punto. WGS84 string
pos y latitud latitud con separador punto. WGS84 string
PARTICIPANTES participantes conjunción de víctima y acusado string
VICTIMA victima Vehículo que ocupaba quien haya fallecido a se haya lastimado a raíz del hecho, o bien peatón/a string
ACUSADO acusado Vehículo que ocupaba quien resultó acusado/a del hecho string

victimas

Nombre_Columna Rename Descripcion del dato y caracteristicas Datatype
ID_hecho id_hecho es el identificador único del evento (siniestro) str
FECHA fecha fecha en formato dd/mm/aaaa datetime
AAAA año es el año de ocurrencia del siniestro int
MM mes es el mes de ocurrencia del siniestro int
DD id_hecho es nro del dia de ocurrencia del siniestro (siniestro) int
HORA hora es la hora de ocurrencia del siniestro (siniestro) HH:MM:SS
ROL rol Posición relativa al vehículo que presentaba la víctima en el momento del siniestro int
VICTIMA victima Vehículo que ocupaba quien haya fallecido a se haya lastimado a raíz del hecho, o bien peatón/a string
SEXO sexo Sexo informado por fuente policial de la víctima string
EDAD edad es nro de la calle, altura en que ocurrió el evento (siniestro) string
FECHA_FALLECIMIENTO fecha_fallecimiento Fecha de fallecimiento de la víctima string

2. ETL

2.1 ETL Homicidios

Durante el ETL procuramos explorar cada una de las variables del Dataset para eliminar valores duplicados, erroneos, o vacíos y preparar la data para el proceso de EDA.

Para ver en detalle el paso a paso de este proceso se puede consultar:

ETL_EDA_homicidios En este notebook encontraran el proceso completo con sus paso y transformaciones, al tiempo que se desarrollan descripciones y conclusiones de lo analizado y hallado para cada variable.

2.2 ETL Victimas

En el notebook ETL Victimas pueden encontrar el paso a paso detallado de las transformaciones realizadas al dataset homicidios en la hoja victimas.
Este dataframe es luego guardado en victimas_etl.csv para ser utilizado en el EDA de Homicidios.hechos como complementario a hechos_df.

3. EDA

Durante el Analisis Exploratorio de los Datos, nos dedicamos a profundizar el entendimiento de las variables del Proyecto, sus relaciones y

Comenzamos por realizar para todas las variables un:

3.1 Análisis Univariable de homicidios

Vamos a repasar todas las variables del Dataframe homicidios, cargado como hechos_df, para conocer mas a detalle las variables que se presentan y su distribución y potencial de información. Vamos realizar el analisis Univariable de las variables:

3.1.1. fecha

Esta variable la descomoponemos en Anio, Mes y Dia. Por lo que su análisis se realiza en las variables individuales.

3.1.2. Anio

Vamos a saltearnos la columna fecha y comenzamos directamente con Año.
Cuantos siniestros por año ocurren, cual es la distribución.

Hallazgos: La tendencia de la distribución de siniestros aparenta ir a la baja, siendo la comparativa promedio 2016-2019 versus 2020 y 2021, la caída en 2020 está afectada por el cierre de la pandemia covid-19, con lo cual la tasa real de caida en la cantidad de muertes sería mas asertiva considerar la del 2021, aunque esta también se vería afectada por la misma razón ya que no fue hasta finales del 2021 que realmente se puede considerar la actividad como normal.

3.1.3. Mes

Vemos la distribución de los siniestros por mes y por año para detectar patrones o ciclos

Aunque ambos gráficos son confusos, y no permiten ver el detalle, sirven su propósito que es demostrar que no hay patrones o meses con mayor distribución, no sigue una estacionalidad ni una tendencia
También podemos acompañar la visualización del gráfico de arriba, con las estadísticas para esta columna:

  • El valor promedio de muertes por mes es de 3.5 muertes, el máximo 12 y el mínimo 1 muerte. Pero para el promedio por año por mes:
  • el promedio de muertes por mes disminuye consistentemente desde 2018 a 2021. de 12 muertes por mes a menos de 9 muertes por mes

3.1.4. Dia

Vemos la distribución de los siniestros por dia y por año para detectar patrones o ciclos
Buscamos encontrar patrones en la cantidad de accidentes a lo largo de la semana o del mes

Hallazgos: Las conclusiones que se pueden definir de este gráfico son la variabilidad en el total de víctimas por día del mes y la ausencia de una tendencia clara o patrón específico. Es decir, que no hay un día específico del mes que tenga consistentemente un número alto o bajo de víctimas, indicando una distribución bastante aleatoria. Teniendo en cuenta todos los registros, los accidentes tienden a ocurrir principalmente entre los días viernes y lunes, alcanzando su punto máximo los sábados y su mínimo los jueves.
Sin embargo, la diferencia entre la cantidad mínima y máxima registrada durante la semana es solo del 11.5%.

Indagamos mas en profundidad para definir si hay una mayor incidencia real de un aumento en la tasa de siniestros durante el finde semana, viernes a domingo, contra la tasa de muertes durante los dias de semana.

Para esto, calculamos para los dias de semana, el promedio de accidentes diario y para los dias viernes a domingo el promedio de accidentes diario. Y comparamos los mismos.

Conclusiones

Distribución de Muertes por día:
  • Durante los días de semana, el promedio total de muertes es de 1.02.
  • Durante los fines de semana, el promedio total de muertes es de 1.05.
  • Esto sugiere que hay una ligera tendencia a un mayor número de muertes durante los fines de semana en comparación con los días laborables.
  • Porcentaje de Muertes:
  • El 56.28% de las muertes ocurren durante los días de semana.
  • El 43.72% de las muertes ocurren durante los fines de semana.

Aunque la diferencia no es significativa, muestra que los fines de semana tienen una proporción ligeramente menor de muertes en comparación con los días laborables.

3.1.5. Hora

Vamos a trabajar con la distribución de accidentes por hora para detectar si hay un pico de ocurrencia o picos de ocurrencia de accidentes, es decir si hay alguna hora a la que haya más cantidad de accidentes.

Analizando el gráfico, se observa que la mayor cantidad de accidentes ocurre a las 6 de la mañana con 41 incidentes registrados.
Hay un aumento significativo en los accidentes desde la 1 de la mañana hasta alcanzar este pico a las 6 am. Posteriormente, los números disminuyen pero se mantienen relativamente altos durante el resto del día.

  • A las 8 y a las 9 de la mañana hay una disminución notable en los accidentes.
  • A partir de las 10 am hasta las 3 pm, los accidentes se mantienen constantes, oscilando entre los 31 y los 36 casos.
  • Hay una caída significativa a las 14 horas con solo 17 accidentes.
  • Desde las 15 horas en adelante, los números vuelven a ser constantes, manteniéndose alrededor de los 30 casos por hora.

En resumen, es crucial prestar atención adicional durante las primeras horas de la mañana cuando ocurren más accidentes. También es esencial mantenerse alerta durante todo el día ya que no hay una disminución significativa después del pico matutino.

3.1.6. Alt y Cruce

Para esta columna la vamos a trabajar en conjunto con cruce, ya que lo importante será revisar si hay una ocurrencia mayor o incidencia a que los accidentes ocurran en la mitad de la calle o en la intersección de las calles.
Para ello vamos a transformar estas columnas en una sola columna cruce, con un valor booleano:

True: Cuando el siniestro ocurre en la intersección de dos calles
False: Cuando el siniestro ocurre sobre la calle a una altura determinada que no es la intersección entre dos calles

Conclusiones Se pueden ver que la mayor cantidad de muertes ocurren en la intersección de dos calles:

  • El 75% de las muertes son en intersecciones
  • El 25% ocurren sobre las calles y Avenidas o Autopistas sin cruces de calles.

3.1.7. Tipo_Calle

Conclusiones El 70% de los accidentes ocurren en Avenidas, luego en calles 20% y por último en Autopistas

3.1.8. Victima

Conclusiones La mayor cantidad de muertes involucran a los motociclistas y los peatones, seguidos por autos.

3.1.9. Acusado

Conclusiones La mayor cantidad de muertes son provocadas por conductores de autos, siendo los de mayor tasa de mortalidad.

Ya habiendo explorado el dataset y cada una de sus variables, ganamos conocimiento en profundidad de las relaciones entre variables y del potencial de información que se presenta en el mismo.Ahora continuaremos con un analisis multivariable, es decir, agruparemos y mostraremos la variables e información para su mejor visualización y entendimiento. Es decir, que comenzaremos con la transformación de la data en información y conclusiones.

3.2 Cantidad de siniestros por año

Comenzamos por la evolución de los siniestros, esto es por año:


3.2.1. Evolución de la cantidad de siniestros por año.

Conclusiones Evolución de muertes por año en siniestros en la Ciudad de Buenos Aires


Podemos observar la evolución en la cantidad de muertes por año a partir del 2016, se evidencia un descenso en la cantidad de muertes, igualmente esta cantidad se ve afectada por la pandemia del covid-19 donde en Argentina se declaró un cierre total y casi completo de actividades que influyó de manera directa e importante en los valores del 2020 y 2021, como se puede ver, al realizarse la apertura parcial en 2021 se fue incrementando. Pero ambos años se ven claramente afectados. No se los puede considerar un descenso real en la cantidad, deberíamos poder contar con esta data para el 2023 para poder concluir si se trata efectivamente de una tendencia real.

3.2.2. Evolución de muertes por año en siniestros en la Ciudad de Buenos Aires por tipo_calle

Ahora conjugamos la cantidad de muertes agregando a lo anterior la variable por tipo de calle (Avenida, Autopista o calle)

Conclusiones Evolución de muertes por año en siniestros en la Ciudad de Buenos Aires por tipo_calle


Las tasas de muertes por tipo_calle permanecen constantes a lo largo de los años, con una distribución similar:
  • 13% de las muertes ocurren en la Autopista.
  • 70% de las muertes ocurren en Avenidas.
  • y el restante 17% en calles.

Conclusiones Evolución de muertes por año en siniestros en la Ciudad de Buenos Aires por tipo_calle


Conclusiones: De observar la tabla y gráficos presentados podemos decir:

  • Avenida la mayor cantidad de muertes ocurren en Avenidas, el 70% de las muertes y que la cantidad de muertes cae a partir de 2020 a causa de las restricciones de la pandemia. Pero igualmente, se puede decir que se registra una tendencia a la baja, aunque la proporción se mantiene constante
  • Calle Le siguen en magnitud, las muertes en la calle, 17% de las muertes, cercanas a la cantidad de muertes en Autopista. Las muertes en la calle se mantienen constantes en proporción y magnitud
  • Autopista Las muertes en Autopista son las de menor ocurrencia pero la tendencia también es constante. Con un 13% del total, no se registra una tendencia a la baja

Volvemos a ver las cantidades distorsionadas por la pandemia covid-19 y el aislamiento que hizo disminuir al mínimo la circulación y por ende los siniestros

Para completar nuestro análisis de la evolución de muertes por categoria nos restarian dos categorias muy importantes a considerar:

  • Rango de edades
  • Sexo
  • Rango de Edades y Sexo
    Para poder realizar el mismo procederemos a combinar ambas tablas:
  • homicidios (informacion general sobre los siniestros)
  • victimas (información particular sobre cada una de las 717 muertes, sexo y edades, categorias de victimas)
    Vamos a crear un Dataframe combinando ambos, victimas con homicidios, para obtener un dataframe combinando todos los campos e información necesaria para nuestro análisis

3.3.3. Muertes por año en siniestros en la Ciudad de Buenos Aires por tipo de vehiculo

Ahora conjugamos la cantidad de muertes agregando a lo anterior la variable por victima, que representa una clasificación agregada del tipo de vehículos. Categorias para tipo de Vehiculo (victima) = ['peaton', 'moto', 'auto', 'cargas', 'bicicleta', 'pasajeros', 'movil', 'otro', 'sd']

Conclusiones Muertes por año en siniestros en la Ciudad de Buenos Aires por tipo de vehículo


  • Moto: Podemos observar que es el tipo predominante de muerte por vehiculo (victima). Si lo conjugamos con la información de la tabla anterior, vemos que las muertes de motociclistas representan el 42% del total de las muertes. Y si tomamos su evolución, van con una marcada tendencia a la baja.
  • Peatones le siguen en orden de magnitud, con el 37% de las muertes. Desde el 2016 vienen descendiendo la cantidad de muertes de peatones, con una reducción del 50% si comparamos el 2018 contra 2021.
  • Auto: es el tercer tipo de vehiculo, con un 13% del total de las muertes, unas 92 muertes desde el 2016 al 2021. también se observa que la tendencia es muy leve, pero a la baja.

3.3.4. Evolución de la cantidad de muertes por Género

Del gráfico, observamos que el número de muertes masculinas fue significativamente mayor que las femeninas durante todos los años representados.

  • En 2020, hubo una disminución drástica en el número de muertes registradas para ambos géneros, lo cual es coherente con la restricción de circulación debido a la pandemia de COVID-19 en Argentina.
  • A partir de 2021, se observa un aumento en las muertes, pero aún no ha alcanzado los niveles anteriores a la pandemia.
  1. Número de Muertes por Género a lo Largo de los Años:
  • El gráfico muestra el número de muertes por género desde 2016 hasta 2021.
  • La línea amarilla representa las muertes masculinas, y la línea azul representa las muertes femeninas.
  • A partir de 2021, se observa un aumento en las muertes, aunque aún no han alcanzado los niveles previos a la pandemia.

  1. Comparación de Géneros:
  • Las muertes masculinas superan consistentemente a las femeninas en todos los años.
  • La disminución en 2020 se explica por las restricciones de circulación y el impacto de la pandemia.

3.3.5. Evolución de la cantidad de muertes por Edad

Distribución de Muertes por Edad: El gráfico representa la cantidad de muertes por rango etario.

  • Los grupos de edad se dividen en cinco categorías: 0-17, 18-29, 30-49, 50-65 y 66+.
  • Observamos que las personas entre 30-49 años presentan la mayor cantidad de muertes, seguido por el grupo 18-29.
  • Los grupos 0-17 y 66+ tienen las cantidades más bajas de muertes. Conclusión:
  • Las personas en sus años intermedios (30-49) parecen estar en mayor riesgo según este gráfico.
  • La disminución en 2020 se explica por las restricciones de circulación debido a la pandemia de COVID-19.
  • Podemos ver que esta distribución de cantidad de muertes por rango etario se mantiene estable, las tasas por rango, a lo largo del tiempo.

Podemos combinar ambos análisis para visualizar las muertes por rango etario y por género

El gráfico representa la cantidad de muertes en diferentes grupos de edad y géneros.

  • Por cada rango de edad hay dos barras, una para hombres (color azul) y otra para mujeres (color amarillo).
  • El grupo de edad con la mayor cantidad total de muertes es el rango de 30–59 años.
  • Dentro de este grupo, se observa una diferencia significativa entre géneros: hay más muertes en hombres que en mujeres.
  • En los demás grupos de edad, las cifras son relativamente similares entre ambos géneros.
  • El grupo de edad con menos muertes es el rango infantil/juvenil (0–17 años). Conclusiones:
  • La mayoría de las muertes ocurren en adultos jóvenes y de mediana edad (30–59 años).
  • Es importante destacar las diferencias de género.

3.3.6. Evolución del porcentaje de muertes por victima.victima

Vamos a ahora analizar el porcentaje de muertes por tipo de victima El gráfico representa el porcentaje de muertes por tipo (como “Auto”, “Moto”, “Peatones”, etc.) y año. Los tipos de muertes incluidos son: Auto, Bicicleta, Cargas, Moto, Movil, Pasajeros y Peatones.

  • A lo largo de los años, se observan cambios en la distribución de muertes en diferentes categorías. Evolución Específica:
  • Moto: En 2016, la categoría “Moto” tenía un porcentaje significativo de muertes. Sin embargo, desde el 2016 al 2020 ha disminuido constantemente cada año. Para luego en 2021, crecer nuevamente al 47% que es el valor de origne.
  • Peatones: Las muertes de peatones también disminuyen desde el 2016 al 2020, pero a partir del 2021 vuelve a escalar la cantidad de muertes porcentuales de peatones frente al total, aunque no tan drásticamente como las de motociclistas.

3.3.7. Ocurrencia de muertes por franja horaria

Vamos a ahora analizar si hay una franja horaria o momento del dia en que ocurran mas muertes y luego sumaremos a este análisis la segmentación por tipo de victima, en particular para los peatones y motociclistas que representan el 87% de las victimas fatales

  1. Observaciones: Intensidad de Color:
  • La intensidad de color en el gráfico representa la frecuencia de muertes durante diferentes horas del día.
  • Tonos más oscuros indican frecuencias más altas, mientras que tonos más claros corresponden a frecuencias más bajas.
  1. Conclusiones Días de Semana vs. Fin de Semana:
  • En días de semana (lunes a viernes):
    • El gráfico muestra un patrón consistente con frecuencias de muerte más altas durante las horas de la mañana (alrededor de las 8:00 a.m. a las 10:00 a.m.) y las horas de la tarde (alrededor de las 6:00 p.m. a las 8:00 p.m.).
    • Este patrón se alinea con las horas típicas de viaje, sugiriendo que los accidentes o incidentes pueden ocurrir con más frecuencia durante estos momentos.
  • En fin de semana (sábado y domingo):
    • El patrón es diferente:
      • Sábado:
        • Los tonos más oscuros se extienden desde la tarde (alrededor de las 2:00 p.m.) hasta la noche (alrededor de las 8:00 p.m.).
        • Esto podría estar relacionado con actividades de ocio, eventos al aire libre o vida nocturna.
      • Domingo:
        • Los tonos más oscuros están distribuidos a lo largo del día, sin horas pico distintas.
        • Esto sugiere una distribución más uniforme de muertes los domingos.

Frecuencia Horaria de Muertes de Motociclistas por Día de la Semana :

  1. Descripción:

    • Se visualizan datos relacionados con la frecuencia de muertes basada en la hora del día y el día de la semana.
    • Cada celda en el mapa de calor representa una hora específica (eje y) en un día específico de la semana (eje x).
    • La intensidad del color dentro de cada celda indica la frecuencia de muertes durante esa hora y día.
  2. Observaciones Clave:

    • Días con Frecuencias Más Altas:
      • Sábado:
        • Las celdas azules más oscuras están concentradas alrededor del rango de 18:00-19:00 horas.
        • Esto sugiere que las tardes de sábado tienen una alta incidencia de muertes.
        • Posibles razones podrían incluir actividades nocturnas, reuniones o accidentes durante horas de ocio.
      • Domingo:
        • Similar al sábado, las celdas azules oscuras aparecen alrededor del rango de 17:00-18:00 horas.
        • Las tardes de domingo también experimentan una mayor frecuencia de muertes.
        • Nuevamente, esto podría estar relacionado con diversos factores como accidentes de tráfico, actividades al aire libre o emergencias de salud.
  3. Conclusiones:

    • Horas Pico:
      • Sábado por la noche y Domingo por la noche son las franjas horarias con mayor cantidad de accidentes fatales.
    • Las campañas de seguridad dirigidas pueden enfocarse en educar al público sobre los riesgos durante franjas horarias específicas.
    • Por ejemplo, promover prácticas de conducción segura durante las noches de fin de semana.

Frecuencia Horaria de Muertes de Peatones por Día de la Semana :

  1. Descripción:

    • Se visualizan datos relacionados con la frecuencia de muertes de peatones según la hora del día y el día de la semana.
    • Cada celda en el mapa de calor representa una hora específica (eje y) en un día específico de la semana (eje x).
    • La intensidad del color dentro de cada celda indica la frecuencia de muertes de peatones durante esa hora y día.
  2. Observaciones Clave:

    • Días con Mayores Frecuencias:
      • Miércoles:
        • Las celdas de color azul más oscuro aparecen alrededor del rango de 18:00 a 19:00 horas.
        • Esto sugiere que las tardes de miércoles tienen una alta incidencia de muertes de peatones.
    • Viernes:
      • Otro pico ocurre entre las 14:00 y las 15:00 horas.
      • Las tardes de viernes también experimentan una mayor frecuencia de muertes de peatones.
  3. Conclusiones:

    • Las tardes de miércoles y los viernes por la tarde son periodos críticos.

5. Datasets Complementarios:

Utilizamos la página de Estadísticas y Censo de la Cuidad de Buenos Aires para obtener información sobre la población, su distribución a lo largo de los años, el género y rango etario, para poder utilizarla luego en combinación con los dataset creados para la generación y construcción de KPIs en el Dashboard. Todo este proceso se encuentra a detalle en Data Adicional

6. Creación de la base de Datos en MySQL para conectar con Power BI.

Todo lo relativo a la creación de la base de Datos en MySQL desde Python y su posterior conexión con Power BI para la creación del Dashboard interactivo se encuentra detallado en : Creación de Database desde Python a MYSQL y Conexión de MySQL con Power BI

Primero guardamos, luego del proceso de ETL y EDA detallado, los Dataframe resultantes en formato .csv.

Estos son:

  1. homicidios_etl.csv : son los registros de los homicidios por número de siniestro y toda la información relevante, luego de la limpieza y transformacion de los datos.
  2. victimas_completo.csv: es el dataframe donde se vinculan las victimas cada una identificada y asociada a su id de siniestro con la informacion adicional del género, edad y rango etario definido como información más relevante y complementaria a homicidios.

Segundo, creamos en MySQL Workbench la Database, que llamamos proyecto_individual_02.

El tercer paso fue conectar Python con MySQL, para que desde Python, con la base de datos ya creada, pudieramos crear y migrar con tan sólo unas pocas líneas de codigo las Tablas que serían nuestra base de Datos y posterior recursos en Power Bi.

Luego, tocó conectar la Base de Datos de MySQL con Power BI, en el notebook Connection_mysql se encuentra el instructivo para replicar lo que es la creación y la conexión en caso de que quisieran utilizarla o explorarla. Con esto quedamos listos para comenzar a crear el Dashboard y todas las visualizaciones.

7. Creación del Dashboard en Power BI

Dashboard_Siniestros_Viales_2021

Acompaña a este Dashboard el Informe donde se presenta el Proyecto: Dashboard_Siniestros_Viales_2021

Dashboard

Selección y Presentación de Indicadores

En el marco del Plan de Seguridad Vial 2020-2023, La Ciudad de Buenos Aires propone en una reducción del 50% en las víctimas fatales para el año 2030. Como se presenta en el Informe, el principal desafío que se presenta para alcanzar este objetivo es reducir la tasa de mortalidad, o la cantidad de muertes de los dos principales grupos más vulnerables detectados durante el desarrollo del proyecto:

  • Hombres de entre de 30-49 años que representan el 32% de las victimas
  • Los Hombre entre 18-29 años, 27%.

Esta es el eje principal en la selección de los indicadores para el Dashboard.

Presentamos cada uno de ellos y el propósito para su implementación:

1. Tasa de Mortalidad

La tasa de mortalidad muestra una tendencia a la baja en los últimos cuatro años, incluso considerando el impacto de la pandemia de COVID-19.

2. Años Promedio entre Muertes

Este indicador proporciona la frecuencia promedio de muertes en un período de tiempo dado, permitiendo comparaciones y análisis temporales.

3. Variación Porcentual Promedio 4 Años

Muestra cómo el número de muertes en un período específico difiere de la tendencia promedio observada en un período más largo.

4. Porcentaje de Muertes Motociclistas

Destaca que el 47% de las muertes en siniestros viales involucran a motociclistas, justificando un enfoque específico en este grupo.

5. Porcentaje de Muertes Peatones

Con el 34% de las muertes, los peatones son el segundo grupo más vulnerable, lo que subraya la importancia de considerar medidas de seguridad para ellos.

8. Conclusiones:

Conclusiones
Obelisco Según el informe estadístico del Observatorio de Movilidad y Seguridad Vial de la Ciudad de Buenos Aires, durante el año 2021 se registraron 96 víctimas fatales en 96 hechos. Más de tres cuartas partes de las víctimas fatales fueron de sexo masculino (76%) y el 59% tenían entre 18 y 49 años de edad. En relación al tipo de usuario/a de la vía fallecido, casi la mitad fueron motociclistas (42%) seguidos por los peatones (37%) y ocupantes de automóvil (11%).

En suma, ocho de cada diez personas fallecidas (80%) en siniestros viales fueron usuario/as vulnerables de la vía, motociclistas o peatones.

Respecto a 2019, para excluir el 2020 que tiene la particularidad del cierre por la pandemia, se observa una reducción de las víctimas fatales peatonales, ocupantes de automóvil y motociclistas, permaneciendo sin cambios la cantidad de ciclistas fallecidos en siniestros viales. |

Resumiendo los hallazgos, pudimos identificar al grupo mas vulnerable:

Perfil del Motociclista:

  • Alto Riesgo para Hombres: Los datos destacan que los hombres entre 18 y 49 años son particularmente vulnerables a los accidentes de motocicleta. Este grupo demográfico debería ser el foco de campañas de seguridad y programas de concientización.
  • Patrones de Colisión: La prevalencia de accidentes que involucran autos y vehículos de carga sugiere la necesidad de mejorar las medidas de seguridad vial, especialmente en intersecciones y áreas con tráfico pesado.
  • Medidas de Seguridad: Fomentar el uso de casco, licencias adecuadas y técnicas de conducción defensiva puede reducir significativamente las muertes y lesiones.

En resumen, abordar las necesidades específicas de los conductores masculinos en el grupo de edad de 18 a 49 años, promover prácticas de conducción seguras y mejorar la infraestructura vial pueden contribuir a reducir las víctimas de accidentes de motocicleta en la Ciudad de Buenos Aires.

Funciones para el ETL En este link se encuentran las funciones que escribí para realizar varias de las operaciones de limpieza, análisis y transformación del dataset homicidios y victimas utilizados en el proyecto.

Estadística y Censos | Buenos Aires Ciudad

Proyección de población por sexo y edad simple

Road Safety Annual Report 2023

Road Safety Annual Report 2022
Informe movilidad ciclistas

red de bicicletas de la ciudad de Buenos Aires

Secretaría de Transporte y Obras Públicas

Bastrap 7.1

Beyond Defaults: Using Custom Fonts in Power BI

Informe del proyecto Salud Urbana en América Latina (Salurbal)