No momento que atingimos a triste marca de meio milhão de mortos pela Covid-19 só no Brasil, cabe a nós uma reflexão sobre esse cenário que estamos vivenciando. Cabe a nós buscar alguma "luz no fim do túnel", luz essa em formato de vacina e também de impeachment.
Nesse contexto, busco trazer uma breve análise sobre as curvas de novos casos e novos óbitos por Covid-19 no Ceará. Além disso, são trazidas previsões que podem nos ajudar a entender para onde esses números estão tendendo. Números não, vidas!
Ciência de Dados na Pandemia de Covid-19 no Ceará?!
Em 2020 e em 2021 a Secretaria de Saúde do Estado do Ceará realizou diversas ações convidando a própria comunidade de ciência de dados a ajudar nos esforços contra a doença, fornecendo análises e previsões acerca dos dados abertos fornecidos pelo próprio SUS. Esse concurso é bem explicado no link a seguir. Vale a pena a leitura, pois também fornece um enorme contexto para o uso de ciência de dados na saúde.
Com isso também foi lançado o IntegraSUS Analytics, plataforma do Governo do Ceará de Ciência de Dados relacionada à Covid-19.
Nesse projeto foram obtidos os dados de casos e óbitos por Covid-19 no Ceará no site do Brasil.io, um excelente repositório de dados públicos do nosso país.
Foi selecionado o dataset principal sobre a doença, disponível em: Covid-19 - Brasil.io
O próprio site nos diz que:
Essa tabela possui os casos confirmados e óbitos obtidos dos boletins das Secretarias Estaduais de Saúde (SES). Os dados foram enriquecidos, de forma que a partir do momento em que um município confirma um caso, ele sempre aparecerá nessa tabela (mesmo que para uma determinada data a SES não tenha liberado o boletim - nesse caso é repetido o dado do dia anterior). Caso queira ver a tabela original (sem repetição e com datas faltantes), visite caso.
O dataset utilizado nesse notebook possui sua última atualização no dia 29/06/2021 e uma cópia desse dataset encontra-se no repositório do projeto.
Também foi feita uma breve análise sobre a vacinação contra a doença. Os dados foram extraídos de:
Como os dados são sobre cada aplicação individual da vacina, os arquivos são muito grandes. Por isso, adaptei os datasets para termos os dados da contagem de quantas doses de vacina foram aplicadas por dia, obtendo assim um arquivo bem menor que pode ser encontrado aqui. Última atualização desses dados: 29/06/2021.
O escopo desse projeto é limitado. Tratei apenas dos dados sobre a Covid no Estado do Ceará, sem entrar em nenhum município específico. Buscamos analisar como anda o crescimento da doença no Estado desde o primeiro caso registrado e tentar obter previsões para as séries temporais de casos e óbitos utilizando a Biblioteca Prophet.
Prophet é uma poderosa biblioteca de previsão de séries temporais criada pelo time de Ciência de Dados do Facebook. Presente em Python e em R, essa biblioteca trabalha muito bem (e rapidamente) com séries temporais com muita sazonalidade (como é o nosso caso). Além disso, existe a possibilidade de utilizá-lo para séries temporais multivariadas.
Ademais, fizemos uma breve análise sobre a aplicação de vacinas contra a Covid-19 no Estado do Ceará.
Das previsões realizadas com o Prophet para o número de novos casos e para o número de novos óbitos no Estado do Ceará, vemos que os números não parecem estar diminuindo, o que não é uma boa notícia para todos.
Sobre a vacinação, ainda é cedo para podermos afirmar que certa diminuição nos números são causa direta da vacinação, pois ela ainda está caminhando lentamente.
Por último, vimos que foram vacinadas mais de 500.000 mulheres a mais que homens no Estado do Ceará.
- Melhorar os hiperparâmetros do Prophet para uma melhor previsão;
- Escalar os dados para usar o método
".add_regressor()"
do Prophet; - Levar a análise para novos dados, como a taxa de mortalidade, por exemplo;
- Dividir a análise da vacinação por faixa etária.
- Secretaria de Saúde do Estado do Ceará
- Sesa busca propostas de ferramentas para prever curva da Covid-19
- IntegraSUS Analytics
- Secretaria da Saúde do Ceará lança plataforma de dados IntegraSUS Analytics
- Brasil.io
- Covid-19 - Brasil.io
- OpenDataSUS: Registros de Vacinação COVID-19
- Why Is There Such A Gender Gap In COVID-19 Vaccination Rates?
Esse projeto é parte do Módulo 3 do Bootcamp Data Science Aplicada da Alura.
Agradecimentos aos instrutores do módulo, Karoline Penteado e Allan Spadini.
E um agradecimento especial aos meu amigos "bootcampers" Junior Torres e Valquíria Alencar que trouxeram bom-humor para os momentos mais cansativos do projeto.
🟢 Um outro projeto bem mais aprofundado que utiliza previsões de séries temporais, mas em um contexto de prever o consumo de energia pode ser encontrado aqui.
Dúvidas? Dicas? Sugestões? Ficarei feliz em recebê-las!
- E-mail: carolinadiasw@gmail.com
- Linkedin: https://www.linkedin.com/in/carodias/
- Github: https://github.com/diascarolina
- Discord: Carolina Dias#6164