Seleção Inteligente de Estirpes Vacinais de Influenza com Modelos de IA Evolutiva
A eficácia vacinal da gripe tem permanecido historicamente modesta, raramente superando, a título de exemplo, 40% entre 2012 e 2021 nos Estados Unidos. Esta limitação decorre da rápida evolução do vírus e da defasagem temporal entre a seleção das estirpes vacinais pela OMS e a circulação efetiva das variantes na época seguinte. Para superar essa limitação estrutural, recentemente foi desenvolvido o VaxSeer1, um modelo computacional que integra previsão evolutiva e antigenicidade, simulando in silico a correspondência entre estirpes vacinais e vírus circulantes. Esta abordagem representa um avanço significativo rumo à seleção preditiva e automatizada de vacinas, integrando dados genómicos e imunológicos numa estrutura matemática unificada.
O VaxSeer combina dois módulos principais: um preditor de dominância e um preditor de antigenicidade. O primeiro modela a probabilidade temporal de cada sequência de hemaglutinina (HA) emergir e dominar a população viral, resolvendo uma equação diferencial ordinária parametrizada por protein language models (PLMs). O segundo estima o resultado dos testes de inibição da hemaglutinação (HI) entre pares vacina-vírus, quantificando o grau de semelhança antigénica. O score de cobertura resultante reflete o grau médio de correspondência antigénica entre a vacina e os vírus circulantes, ponderado pela dominância prevista. Esta métrica substitui o paradigma empírico por uma métrica prospetiva de cobertura antigénica.
Numa validação retrospetiva de 10 anos (2012–2021) envolvendo os subtipos A/H1N1 e A/H3N2, o modelo foi treinado com 394 090 sequências de HA do GISAID e com mais de 130 000 pares vacina-vírus provenientes de testes HI realizados. A correlação entre o score predito e a eficácia vacinal observada nos dados do CDC atingiu r = 0.861 (p = 0.0014) e ρ = 0.891 (p = 0.0005), evidenciando uma forte associação entre a previsão computacional e o impacto clínico real. O VaxSeer superou as recomendações da OMS em nove de dez épocas para A/H3N2 e em seis de dez para A/H1N1, com melhoria estatisticamente significativa nos scores de cobertura empírica.
A robustez da previsão estendeu-se à correlação com desfechos populacionais: o score de cobertura predito correlacionou-se com a redução do número de consultas médicas e doenças sintomáticas evitadas (r = 0.699; p = 0.036). Em acréscimo, vacinas com eficácia ≥ 40% apresentaram scores de cobertura significativamente superiores (p = 0.026), confirmando a validade clínica do limiar antigénico previsto pelo modelo.
A arquitetura dual do VaxSeer é conceptualmente inovadora por capturar a dinâmica temporal da dominância viral, ausente nos modelos estáticos clássicos. Estes demonstram correlações substancialmente inferiores (r ≈ 0.49) e maior erro absoluto médio na previsão de cobertura. Ao incorporar a taxa de variação da dominância (R(x)) e a sua interação com a estrutura proteica completa, o modelo aproxima-se de uma descrição evolutiva contínua do ajuste viral, melhorando a antecipação de clades dominantes – por exemplo, identificando a estirpe A/Michigan/45/2015 um ano antes da sua seleção oficial pela OMS.
Do ponto de vista clínico e de saúde pública, a capacidade de prever a correspondência antigénica com base apenas em sequências de proteínas HA abre a possibilidade de selecionar virtualmente estirpes vacinais antes da sua circulação real. Tal abordagem pode reduzir o atraso na formulação vacinal em 6-9 meses, período crítico no ciclo de produção de vacinas inativadas. Em termos operacionais, o VaxSeer permite uma triagem computacional de milhares de variantes, priorizando aquelas com maior cobertura prevista para validação laboratorial, reduzindo o número de testes HI necessários em mais de 80%.
No entanto, devemos reconhecer limitações inerentes. As previsões dependem da qualidade e representatividade das sequências no GISAID, sujeitas a enviesamentos geográficos e de passagem em cultura. A utilização exclusiva da hemaglutinina ignora a contribuição da neuraminidase para a antigenicidade e o ajuste viral. Ainda, demoves referir que os testes HI baseados em antisoro não-humano não refletem totalmente a resposta imunitária humana. Mesmo assim, a correlação observada entre scores de cobertura e eficácia vacinal real (r > 0.85) demonstra que a modelação antigénica computacional pode substituir progressivamente abordagens experimentais lentas e dispendiosas.
Em síntese, o VaxSeer representa um novo paradigma para a previsão evolutiva e seleção racional de vacinas, demonstrando que a IA pode antecipar a eficácia clínica de uma formulação antes da sua produção. A aplicação deste modelo a vírus de rápida mutação (como SARS-CoV-2 ou RSV) poderá transformar o ciclo de resposta vacinal global, introduzindo uma era de vacinação preditiva baseada em modelação linguística de proteínas.
1 Shi W, Wohlwend J, Wu M, Barzilay R. Influenza vaccine strain selection with an AI-based evolutionary and antigenicity model. Nat Med. 2025.






