Mapeamento viral: Pesquisadora desenvolve novo método de classificação da covid-19 utilizando inteligência artificial

A covid-19 surgiu há quatro anos, uma doença devastadora, com rápida capacidade de propagação e que afligiu a humanidade, deixando cicatrizes profundas. Desde então, a ccomunidade científica reúne esforços para desenvolver técnicas de classificação genômica, visando a formas de conter o vírus causador. O trabalho desenvolvido no mestrado da estudante Luísa Christina de Souza, do Programa de Pós-graduação em Engenharia Elétrica e de Computação (PPgEEC), propõe uma nova representação do genoma viral do SARS-CoV-2, utilizando aprendizagem profunda. A pesquisa concorre ao prêmio de melhor dissertação no 16º Congresso Brasileiro de Inteligência Computacional (CBIC).

Com orientação do professor Marcelo Fernandes, do Departamento de Engenharia de Computação e Automação (DCA/UFRN), o trabalho apresenta uma nova forma de representação de sequências genéticas aplicada a seis vírus da família Coronaviridae. “Na tentativa de desenvolver uma metodologia de análise viral com Machine Learning, observamos que uma das etapas importantes na classificação era o mapeamento, ou a representação, da informação gênica para informação numérica, o que impulsionou o desenvolvimento do trabalho”, explica Luísa.

Utilizando técnicas de Processamento de Sinais Genômicos e aplicada a uma arquitetura de aprendizagem profunda, a metodologia foi capaz de gerar resultados em menos tempo, com menos recursos de processamento e de memória de armazenamento, sem haver perda de performance. “O método obteve, com o mapeamento que apresenta apenas 256 valores, a capacidade de distinguir o SARS-CoV-2 de vírus muito semelhantes com até 99.4% de acurácia”, afirma a pesquisadora.

Resumo dos resultados da pesquisa, mostrando seu potencial na classificação viral

A nova técnica possui pouco custo computacional com bom desempenho para analisar o vírus da covid e suas variantes. Para a ciência, a proposta deve facilitar a observação, a classificação e a descrição dos vírus com base nas suas características genômicas. “Isso deve contribuir para o entendimento dos mecanismos de atuação viral, o que, consequentemente, influencia no desenvolvimento de medidas de combate ao vírus”, diz Luísa.

A classificação do vírus da covid-19, assim como suas variantes Alpha, Delta, Gamma, Beta e Omicron, é feita utilizando um algoritmo de Machine Learning chamado de Rede Neural Convolucional, um tipo de Inteligência Artificial. Essa ferramenta recebe amostras do SARS-CoV-2 e de outros cinco vírus similares. Após o mapeamento, o programa é treinado com as características intrínsecas dos dados. No fim, o algoritmo é capaz de classificar cada amostra em sua respectiva classe.

Com esse método, o algoritmo chega nos 99,4% de eficácia no mapeamento, com apenas 32 segundos de treinamento. “Para comparação, aplicamos outras três técnicas de mapeamento conhecidas, e os resultados variam entre 96 e 98,5% de acurácia, com um treinamento de 46 a 54 minutos”, mostra a pesquisadora. “O estudo foi conduzido visando facilitar a observação, classificação e descrição dos vírus, com base nas suas características genômicas, o que contribui para o entendimento da atuação viral, o que, consequentemente, influencia no desenvolvimento de medidas de combate”.

Luísa apresenta sua pesquisa e como o mapeamento viral é feito no SARS-CoV-2

Considerada inovadora, a pesquisa concorre na categoria de melhor dissertação de mestrado no XVI Congresso Brasileiro de Inteligência Computacional (CBIC), evento que premia projetos com resultados científicos significativos e com alto impacto social. “É um misto de felicidade e gratidão ter o trabalho selecionado, especialmente por saber que isso pode incentivar outras mulheres a ingressar na pesquisa, principalmente na área da engenharia, que ainda é ocupada predominantemente por homens”, declara Luísa.

Imagem: Luísa Christina

Fonte: Agecom/UFRN

Sair da versão mobile