Note
Este es un proyecto que pretende analizar datos oficiales y realizar ingishts para aprender sobre lo que dejó la pandemia.
Caution
Utilizar con fines educativos
Una entidad gubernamental responsable de la gestión de la salud en Argentina y en Colombia enfrenta el desafío de comprender y analizar la propagación del COVID-19 para tomar decisiones informadas y eficaces en la gestión de la pandemia.
Como científicos de datos, nuestra tarea es analizar los datos relacionados con el COVID-19 y presentar insights a través de visualizaciones que respondan a las siguientes cuestiones: 1. La propagación del Covid-19 en Argentina y en Colombia en comparación con el resto del mundo 2. Cómo fué el avance de los reporte de nuevos casos diarios lo largo de estos últimos 4 años en Argentina y Colombia. 3. La evolución del índice de letatidad del Covid-19 en Colombia y en Argentina comparado con los paises con mayores índices de letalidad históricos. 4. Las características mas relevantes a nivel global en el impacto del índice de letalidad desde una perspectiva demográfica. |
World Health Organization (WHO): Nos proveerá información sobre la propagación del covid a nivel mundial. Link a la web oficial .
United Nations (population): Nos proveeran información demográfica a nivel pais y a nivel mundial. Link a la web oficial .
Definiremos los Dataframes y la información que contiene:
df_covid: contendrá información de la propagación del covid a nivel mundial respaldada por la WHO.
df_population: contendrá información demográfica de todos los paises a nivel mundial, respadalda por UN.
Hacemos un filtro por las columnas de interés:
> df_population_limpio = df_population[ ['ISO2 Alpha-code', 'Total Population, as of 1 July (thousands)', 'Male Population, as of 1 July (thousands)', 'Female Population, as of 1 July (thousands)', 'Population Density, as of 1 July (persons per square km)', 'Life Expectancy at Birth, both sexes (years)'] ].copy() |
Caution
Encontramos unos valores extraños en la columna que nos brinda información del rate de letalidad
Vamos a hacer un gráfico de boxplot a ver si nos ayuda a comprender éste fenómeno
- Observación: Detectamos valores muy grandes y excepcionales cuando analizamos el rate de letalidad del covid. Por lo que procederemos a hacer una limpieza y nos quedaremos con los valores de los quantiles del 0 al 99.
- Resultado: de la limpieza previamente aplicada al rate de letalidad lo que nos permitirá trabajar con ésta variable y obtener conclusiones más precisas.
También aplicamos otras técnicas de EDA. Por lo extenso del código los invitamos a revisarlo en detalle en el archivo COVID19_Analysis.ipynb
Sin embargo listaremos en análisis y las técnicas de tratamiento aplicadas en nuestro código:
- Tratamiento de NaNs y nulos.
- Tratamiento de errores tipográficos
- Conversión de estructuras de datos de las columnas
- Eliminación de outliers
- Otros
Insight 1: ¿Cómo ha evolucionado el Covid-19 en Argentina y Colombia en comparación con el impacto observado a nivel global?
- Conclusión: Apreciamos que la evolución del covid-19 en Argentina y Colombia fué bastante controlada en comparación a los 10 paises con mayor índice de evolución. Sin embargo, comparando Argentina y Colombia entre sí podemos apreciar que Colombia pudo mitigar mucho más la evolución de los contagios en época de pandemia en comparación a Argentina.
- Conclusión: En cuanto a la evolución de contagios desde el día 0 hasta 4 años después observamos que Argentina y Colombia fueron los paises con menores casos confirmados comparándolos con los TOP 5 paises a nivel mundial
Como científicos y profesionales de los datos también tenemos la responsabilidad de validar si nuestras conclusiones hasta el momento coinciden con fuentes oficiales
Link de la fuente oficial: https://www.who.int/countries/arg/
Link de la fuente oficial: https://www.who.int/countries/col/
-
Conclusión: ¡Hasta aquí vamos bien! En términos absolutos vemos efectivamente que para Argentina y Colombia nuestros datos coinciden con fuentes oficiales por lo que en términos relativos (en porcentajes) y en comparación a otros paises asumimos que el resultado también es verídico ya que utilizamos la misma fuente de información y el mismo método de análisis.
-
Recomendación: Argentina podría considerar analizar el procotolo de Colombia e implementar algunas medidas sugeridas por parte de su organizmo de salud.
Insight 2: ¿Cuál ha sido la evolución de los nuevos casos diarios reportados de Covid-19 en Argentina y Colombia a lo largo del tiempo?
- Conclusión: En la gráfica de Colombia se puede observar un aumento notable de nuevos casos en agosto del 2020, reportando un pico de 80 mil, empezando el 2021 superó los 100 mil casos, posteriormente en el mes de marzo hubo una disminución notable de casos, por debajo de los 50 mil, para julio se reporta un pico de más de 200 mil contagios, entre el mes de septiembre de 2021 y enero de 2022 podemos observar otra disminución muy notable por debajo de los 20 mil casos. El pico más alto de contagios diarios se tiene en febrero del 2022 donde superó los 210 mil casos, posterior a esas fechas no hubo un aumento notable de casos, estuvieron por debajo de los 30 mil.
- Conclusión: En la gráfica de Argentina se puede observar un pico de 100 mil contagios en octubre de 2020, para junio de 2021 produce un pico de 240 mil. El mayor registro de contagios diarios es entre enero y febrero de 2022 reportando un pico de 775 mil
Insight 3: ¿Cuál es la evolución del índice de letalidad del Covid-19 en Colombia y Argentina comparado con los paises con los índices históricos más elevados?
- Conclusión: En mayo de 2020 se reportó un pico en el lethality rate de 4.61 % para Colombia, y 7.79 % en Argentina, teniendo una diferencia entre ambos paises de 3.28 %
Insight 4: Desde una perspectiva demográdica ¿cuáles son las características que tienen un mayor impacto en el índice de letalidad de un país?
- Conclusión: Según nuestro análisis de importancia, la densidad de la población destaca como más influyente, seguida de la población femenina con un 25% y 24% respectivamente. Esto sugiere que densidad de la población y el número de la población femenina son características relevantes en la incidencia de la letalidad de un país cuando evaluamos el covid-19.
- Recomendaciones: Con ésta información podemos predecir el índice de letalidad y tomar medidas preventivas en aquellos paises cuya densidad de población y cantidad de población femenina sea más elevado.