A precisão nos dados demográficos é crucial para a correta estimativa de mortalidade e expectativa de vida, parâmetros essenciais para o planejamento de políticas públicas de saúde. No entanto, omissões e erros nos registros de óbitos, na enumeração censitária e na declaração de idade podem introduzir vieses significativos nessas estimativas, especialmente em países com sistemas de coleta de dados menos robustos. Um estudo recente conduzido por Marcos Roberto Gonzaga, professor do Programa de Pós-Graduação em Demografia da Universidade Federal do Rio Grande do Norte (PPGDem/UFRN), lança luz sobre como esses diferentes tipos de erros interagem e afetam as taxas de mortalidade e expectativa de vida por faixa etária no Brasil.
A pesquisa de Gonzaga, realizada em colaboração com os pesquisadores Bernardo Lanza Queiroz, da Universidade Federal de Minas Gerais (UFMG), e Carl Schmertmann, da Universidade Estadual da Flórida (EUA) foi publicada na revista Demographic Research. O estudo parte de um ponto inovador: enquanto a maioria dos estudos existentes tende a focar em um único tipo de erro de dados, seu trabalho propõe uma análise integrada que considera simultaneamente os três principais problemas — subregistro de óbitos, subenumeração do censo e declaração incorreta de idade em ambas as fontes de dados (registro de óbitos e censos demográficos). Ao construir uma estrutura analítica que combina o efeito desses tipos de erros, o estudo oferece uma visão mais abrangente sobre os vieses que podem distorcer as estimativas de mortalidade e expectativa de vida.
Um dos principais objetivos da pesquisa foi decompor os vieses causados por esses diferentes erros em um único modelo analítico, permitindo uma análise mais precisa dos impactos específicos de cada tipo de erro. Esse modelo não se limita à matemática pura; ele foi aplicado aos dados de mortalidade e população do Brasil, país que, segundo o autor, apresenta uma qualidade de dados intermediária, ou seja, não está entre os piores, mas também não atinge os níveis de precisão observados em países desenvolvidos.
A aplicação empírica do modelo a dados brasileiros revela que os vieses causados por erros de dados variam consideravelmente entre as idades. Por exemplo, a declaração incorreta de idade — embora seja um problema reconhecido, especialmente em países onde a idade pode ser subestimada por motivos culturais ou de baixa escolaridade — tem efeitos relativamente pequenos sobre os cálculos de expectativa de vida em idades avançadas. Isso contrasta com o impacto muito mais significativo dos erros de enumeração e subregistro de óbitos, que podem distorcer as estimativas de mortalidade de forma mais pronunciada.
Um dos achados mais intrigantes da pesquisa é a observação de um “crossover” nas taxas de mortalidade quando comparadas entre diferentes estados brasileiros. Em 2010, as taxas de mortalidade no Rio Grande do Norte tornaram-se inesperadamente mais baixas do que as de São Paulo após os 50 anos de idade, um fenômeno que se repete em outras comparações entre regiões do Norte/Nordeste e Sul/Sudeste do Brasil. Esse “crossover” — um termo que descreve a inversão de padrões esperados em dados comparativos — desafia explicações convencionais e sugere que outros fatores além dos erros de dados estão influenciando essas taxas.
Gonzaga e colegas argumentam que, para que esse crossover fosse explicado apenas pelos erros conhecidos, seria necessário que tais erros ocorressem em magnitudes improváveis. Essa constatação levanta a hipótese de que outros fatores, possivelmente ligados à seletividade pela mortalidade, possam estar contribuindo para essa inversão de padrões regionais. A seletividade pela mortalidade refere-se ao fenômeno em que grupos de indivíduos mais frágeis tendem a morrer mais cedo, deixando uma população relativamente mais saudável e, portanto, com taxas de mortalidade mais baixas em idades avançadas.
A importância dessa pesquisa reside não apenas em sua capacidade de identificar e quantificar os vieses nos dados demográficos, mas também em sua contribuição para a formulação de políticas de saúde mais eficazes. Erros nos dados podem levar a interpretações equivocadas sobre a saúde da população. Por exemplo, se os dados de mortalidade em uma cidade como Natal estiverem imprecisos, isso pode criar uma falsa percepção de que a saúde da população é melhor do que realmente é, enquanto em cidades com dados mais precisos, como São Paulo, as taxas de mortalidade podem parecer artificialmente mais altas.
Além de discutir os resultados específicos, o estudo de Gonzaga e colegas também sugere a necessidade de aprimorar os sistemas de coleta de dados no Brasil. Práticas como o “age heaping” — a tendência de relatar idades terminadas em zero ou cinco — e a subdeclaração da idade real, especialmente entre idosos, são problemas que afetam a precisão das estimativas de mortalidade. Esses vieses, somados à subenumeração da população e à incompletude dos censos, são desafios que precisam ser enfrentados para melhorar a qualidade dos registros vitais.
Embora existam métodos matemáticos para corrigir alguns desses vieses, os autores enfatizam que a solução ideal está na melhoria dos registros civis e das estatísticas vitais. Investir em sistemas robustos de coleta e registro de dados sobre mortalidade é crucial não apenas para melhorar as estimativas, mas também para identificar tendências de saúde pública e planejar intervenções eficazes. Ao oferecer uma análise detalhada das interações entre diferentes tipos de erros de dados, os resultados do estudo abrem novas agendas de pesquisa e destacam a necessidade de uma abordagem mais integrada e precisa na estimação de taxas demográficas, em especial nas idades mais avançadas.
Imagens: Divulgação
Fonte: Agecom/UFRN