APLICAÇÃO DE TÉCNICAS DE CADEIAS DE MARKOV PARA MAXIMIZAR A ACURACIDADE DE MÉTODO DE MÉDIAS PARA PREVISÃO DE COVID-19 NO RS
Autor(es): Andressa Daiane Ferrazza
Orientador: Leandro Luís Corso
Quantidade de visulizações: 549
O Brasil é um dos países mais impactados pela Coronavirus Disease 2019 (COVID-19), ocupando o segundo lugar na classificação dos países com maior número total de casos e de mortes pela doença. No país, o Rio Grande do Sul (RS) encontra-se na 4ª e 5ª posição em relação ao maior número de casos e óbitos por COVID-19, respectivamente. Ademais, devido à imprevisibilidade do comportamento da nova doença na população, os modelos matemáticos, especialmente Cadeias de Markov (CM), estão gradativamente sendo mais aplicados na área da saúde como auxílio para o controle e previsão de dados associados à nova infecção. O modelo de CM consiste num processo estatístico, no qual busca a previsão do próximo estado levando em consideração unicamente o estado atual, sem interferência de estados anteriores que possam levar a vieses. Todavia, para a aplicação desse método, é necessário uma base de dados prévia sólida a fim de obter previsões precisas. Assim, constatou-se que a falta de uniformidade na liberação dos dados pelo sistema de saúde gera grandes oscilações na coleta total de dados, prejudicando posteriormente o aprendizado de máquina para a previsão de dados futuros. Logo, o estudo tem por objetivo utilizar o modelo de CM para avaliar o período mais estável para o cálculo da previsão de casos e de óbitos por COVID-19, também feito pelo mesmo modelo matemático de Cadeias de Markov, sendo possível prever as novas taxas da infecção de forma contínua e acurada. Metodologia: foi realizada uma análise das variações do número de casos e de óbitos por COVID-19 no RS entre janeiro e junho de 2021. Os dados foram fundamentados pelo Brasil.io Datasets, com respaldo do Instituto Brasileiro de Geografia e Estatística (IBGE), totalizando 160 dados. As CM foram aplicadas três vezes com diferentes intervalos de dias (3, 5 e 7 dias) sobre os dados prévios. Posteriormente, foram avaliados os resultados de forma quantitativa e gráfica. Resultados: A análise comparativa, entre as CM feitas com 3, 5 e 7 dias de intervalo entre a atualização com os novos dados demonstraram que o modelo matemático é mais eficiente nas previsões quando aplicado o intervalo de 7 dias, com acerto de 100%. Por fim, os resultados demonstraram substancialmente eficazes para gerar dados confiáveis do curso da COVID-19 no RS, sendo um potencial modelo para assessorar o sistema de saúde estadual.
Palavras-chave: COVID-19 no RS, previsão de casos Coronavírus, Cadeias de Markov