A pandemia do Covid-19 gerou uma crise mundial ainda imensurável, mudou vidas, alterou rotinas, afetou a economia, a educação e outras diversas áreas, gerando impactos a curto, médio e longo prazo.
O que todo mundo espera é saber quando isso tudo vai acabar. Modelos matemáticos e estatísticos baseados em dados estão sendo construídos para entender qual vai ser o comportamento do número de infectados pelo Covid-19. Com isso, pode-se ter uma expectativa de quando tudo poderá voltar ao normal.
Porém, a maioria dos cientistas envolvidos têm se deparado com o problema de subnotificações, que ocorre quando o número real de infectados é desconhecido.
Mas o que são subnotificações e como isso pode atrapalhar as previsões envolvendo o número de casos do Covid-19?
Primeiro, vamos entender em que esses estudos para modelagem e previsão do Covid-19 se baseiam.
O número de infectados pelo Covid-19 se organiza em uma série temporal, uma vez que são dados estruturados no tempo e sua estrutura de correlação não pode ser negligenciada. Uma vez considerado isso, todas as modelagens e previsões feitas se baseiam na análise de séries temporais. Para mais detalhes, você pode acessar o artigo “Séries temporais – definições e características”.
Entretanto, o que tudo indica é que o número de infectados pelo Covid-19 seja bem maior do que os números oficiais apresentados e usados para estudos, embora diferentes artigos evitem estimá-lo ou discordem no número. Por exemplo, enquanto um estudo estima entre 4 e 16 vezes maior, outro sugere cerca de 14 vezes maior. A razão disso é que a maioria dos casos são subnotificados. Especialistas acreditam que o número real de infectados podem ser entre 10 a 15 vezes maior que o número apresentado nas estatísticas oficiais.
A causa desse maior impacto maior causado pelas subnotificações é uma falsa sensação de relaxamento, uma vez que os números estão mais baixos, levando até mesmo a tomadas de decisões errôneas. Tais decisões poderiam ser, por exemplo, o afrouxamento do isolamento ou a desativação de hospitais que ainda são necessários.
Existem alguns fatores que explicam o questionamento do número de casos notificados de Covid-19:
- Uma boa parte das pessoas infectadas apresentam sintomas leves, logo não procuram centros de saúdes e, por isso, não são testadas. O que já implica, de início, em uma quantidade de contaminados muito maior que os números apresentados.
- Mesmo que um paciente contaminado tenha procurado um centro de saúde apresentando sintomas leves, ou até mesmo algum caso tenha chegado a óbito, ele pode não ter sido testado. Pelo menos no Brasil, o problema reside na escassez de testes e equipamentos para lidar com pacientes sintomáticos.
- Os testes têm uma defasagem no tempo, chamado delay, entre o dia em ue foi feito e dia que o resultado foi confirmado. Portanto, esse delay também faz com que o número de casos em determinado dia fique subnotificado. Sem dúvida, isso impacta os números semanais, mensais e anuais.
Como diminuir o impacto das subnotificações nas modelagens e previsões do Covid-19, minimizando o impacto de tomadas de decisões errôneas?
Para que sejam tomadas decisões adequadas, o ideal é que consigamos estimar, através de modelos matemáticos e estatísticos, o número real de infectados pelo Covid-19, Isso evita que decisões sejam baseadas em um número distante da realidade e minimiza os erros que as subnotificações podem trazer.
Como exemplo, podemos partir da premissa de que, se um paciente morreu por consequências da COVID-19, ele pode ter sido diagnosticado com Síndrome Respiratória Aguda grave (SRAG), ou no laudo pode constar que o paciente faleceu de falência respiratória (FR). Portanto, uma estimativa inicial poderia ser feita baseando-se nos número de mortes registradas em cartório em 2019 e 2020 dessas 3 doenças (Covid-19, SRAG e FR). Considerando que os maiores casos de morte por Rf e SRAG no Brasil são no inverno, uma estimativa de subnotificação de Covid-19 seria a diferença entre o número de mortes de 2020 e 2019, e o excedente assumimos como casos de Covid-19 subnotificados. A Figura 1 mostra esses resultados.
Figura 1 – Casos registrados em cartório de SRAG e FR para 2020 e 2019 dos estados do Pará, Sergipe e Santa Catarina.
Portanto, os casos excedentes seriam calculados pela subtração da curva de 2019 e da curva de 2020.
Figura 2 – Resultado da subtração das curvas de registro de cartório de 2019 das curvas de 2020.
Notamos que na Figura 2 são apresentadas três curvas distintas. O estado do Pará apresenta um comportamento errático para as notificações de falência respiratória e existem períodos com algum excesso, e outros com subnotificação, em comparação a 2020. Ainda no estado do Pará, até o presente momento o número de casos de mortes por SRAG em 2020 é menor que em 2019, o que pode representar que todos os casos foram tratados como Covid-19. Podemos atribuir a diferença ao fato de este ano ter sido mais quente que o ano de 2019, o que significa uma melhoria das condições para as pessoas com problemas respiratórios. Para o estado de Sergipe, notamos que as mortes por falência respiratória são inferiores ao ano de 2019, enquanto as mortes por SRAG se mantém em relação a 2019 agora em 2020. No entanto, quanto ao estado de Santa Catarina, notamos na Figura 1 que existe um boom de mortes tanto por, SRAG quanto por Falência Respiratória no período do mês de abril, mais ou menos no dia 80 desde o início da pandemia.
Como Covid-19 é uma doença do ano 2020, a Figura 3 mostra o número de mortes por Covid-19, SRAG e RF.
Figura 3 – mortes por SRAG, FR e Covid – 19 no ano de 2020 nos estados do Pará, Sergipe e Santa Catarina.
Consideramos que a Figura 3 representa três estados que podem representar o que ocorre ao longo do brasil em relação aos registros de mortes que podem exemplificar as subnotificações. Na sequência, vamos presumir, que os excessos dos registros em relação ao ano de 2019 sejam casos de Covid-19. Dentre inúmeras possibilidades, algumas razões para os excessos podem ser: 1) por algum motivo, os casos não foram registrados como Covid-19; 2) a morte ocorreu antes do possibilidade do teste; 3) o indivíduo não conseguiu chegar ao hospital para ser testado.
Figura 4 – Números de mortes registradas por Covid-19 em comparação com o número de mortes, considerando a existência de registro de cartórios excedentes em SRAG e FR que podem ser na realidade Covid-19
Na Figura 4, podemos notar que o comportamento, mesmo que errático dos registros no Pará, indica uma alta significativa no número de mortes. Já Sergipe, que apresentou pouca oscilação, tem um desvio pequeno no número de mortes, ainda superior ao registrado. Por fim, Santa Catarina apresenta uma grande discrepância em relação aos números de morte por Covid-19 oficiais e entre as que imaginamos serem subnotificadas. Para Santa Catarina, mesmo que somente metade dos excedentes identificassem como mortes por Covid-19, ainda assim as curvas seriam muito distintas.
Por fim, podemos estimar a taxa de mortalidade do vírus como sendo o número de mortos dividido pelo número de infectados (ambos os dados oficiais, ou seja, testadas).
taxa de letalidade = número de mortes número de infectados
Essa taxa é, portanto, facilmente calculada. Agora que sabemos a taxa de letalidade do vírus, vamos estimar agora que se calculado o número de mortes pelo número de infectados oficiais (dos indivíduos testados), essa taxa se mantém. Ou seja, se existe uma estimativa do aumento de mortes, o número de infectados também aumentou. Assim, pode-se considerar que o número do aumento de mortes é o que acabamos de estimar. Portanto o número de infectados será dado por:
Infectados estimados = Número de mortes estimadas taxa de letalidade
Figura 5 – Número estimados de infectados.
Portanto, notamos que para alguns estados a diferença entre o número de infectados reais (casos testados) e dos infectados subnotificados é pequena, porém, para alguns estados do Brasil, esse número é muito grande. Se considerarmos a média geral do Brasil, a estimativa de 14 vezes mais não é irreal.
O problema de subnotificações não é uma exclusividade brasileira, apesar de que, no Brasil sejamos afetados de uma forma diferente que em outros países. Existem países, como a Tailândia, com dificuldades na produção de testes e outros, com os Estados Unidos, com uma estrutura de testagem mais bem estabelecidas que são menos impactados com esse problema. Por exemplo, no caso da Tailândia, quando o número de casos explodiu, três hospitais ficaram sem material suficiente para produzir testes, e no caso dos Estados unidos, na semana do dia 13 de julho de 2020, foram feitos diariamente entre 520.000 e 823.000 testes, com intenção de aumento por meio do programa RADx. Esse programa tem 4 fases: identificação, aceleração do desenvolvimento, escalonamento e implementação de tecnologias de exames-in-loco (point-of-care technologies), como exames de glicose, de HIV e de gravidez ainda até o fim de 2020.
Existem muitas frentes com estudos já publicados que tentam entender qual o padrão de subnotificações ao redor do mundo. Em cada país, esse quadro é diferente. Por exemplo, o caso do Centro de Modelagem Matemática para Doenças Infecciosas (CMMID). O CMMID, da Escola de Higiene e Medicina Tropical de Londres, LSHTM, que desenvolveu uma forma de estimar a porcentagem de casos sintomáticos reportados do Covid-19 usando a taxa de mortalidade registrada em diversos países, incluindo o Brasil. Para esse fim, esse centro contou com a expertise de um grupo multidisciplinar de epidemiologistas, matemáticos, economistas, estatísticos e clínicos, cada um trabalhando na sua área.
Com base na metodologia desenvolvida por essa equipe do CMMID, é possível comparar o número estimado de infectados pela doença com o número real de infectados. É essa diferença que pode revelar mais informações sobre o real número de casos subnotificados.
A metodologia criada por eles consiste basicamente em:
- Criar uma taxa, chamada CFR, que consiste na divisão do total óbitos confirmados até o momento pelo total de casos confirmados até o momento.
- Considerar a distribuição do atraso entre a hospitalização até a morte, para casos fatais, a fim de estimar quantos casos até o momento devem ter resultados conhecidos.
- Como o CFR não leva em conta as subnotificações, considera-se um valor base de CFR de acordo com resultados obtidos em outros países. Estudos na China e Coréia do Sul, por exemplo, estimaram um CFR igual a 1,38%.
Além de publicarem o estudo, o grupo de pesquisadores disponibilizou a implementação dos resultados obtidos para replicação com outros dados. Seu propósito foi permitir que outros pesquisadores testem essa metodologia e obtenham novos resultados.
Por fim, considerando que lidamos com problemas de subnotificação, estudos como esse citado, em que o número de casos reais pode ser estimado, se mostram importantes porque permitem conhecer verdadeiramente a situação de um determinado país. Baseado na estimativa sobre o número real de infectados pelo Covid-19, torna-se possível tomar decisões que evitem grandes danos a sociedade, como o mal planejamento dos recursos dos hospitais.
DataSprints é um consultoria de inteligência de dados que utiliza estatística e ciência de dados em conjunto com Inteligência Artificial para responder essas questões para sua empresa.
1 – https://agenciabrasil.ebc.com.br/saude/noticia/2020-07/medicos-veem-subnotificacao-em-casos-e-mortes-por-coronavirus
2 – https://noticias.uol.com.br/saude/ultimas-noticias/redacao/2020/05/13/mg-ha-165-casos-da-covid-19-para-cada-caso-confirmado-diz-estudo-da-ufmg.htm
3 – https://saude.abril.com.br/medicina/coronavirus-estimativa-aponta-numero-de-casos-14x-maior-do-que-o-oficial/
4 – https://www.nature.com/articles/d41586-020-02140-8
5 – https://www.nejm.org/doi/full/10.1056/NEJMsr2022263
6 – https://cmmid.github.io/topics/covid19/global_cfr_estimates.html
7 – https://www.em.com.br/app/noticia/nacional/2020/03/23/interna_nacional,1131702/brasil-teria-11-vezes-mais-casos-de-coronavirus-do-que-o-registrado-d.shtml
Autor(a): Jéssica Assunção, MSc – Estatística na DataSprints
Revisores(as):
Luis Martins – CEO na DataSprints
Danilo Costa – Cientista de Dados Líder na DataSprints
Rodrigo Araújo, PhD – Redator Técnico e Cientista de Dados na DataSprints