Agente Aletheia e sistema AlphaEvolve quebram recordes de décadas e marcam a transição da IA de "calculadora" para "criadora de conhecimento" autónoma Por Redação Infonews24hs | 19 de abril de 2026
A Google DeepMind alcançou um feito histórico na interseção entre inteligência artificial e matemática pura. Dois sistemas distintos, o agente de pesquisa Aletheia e o gerador de algoritmos AlphaEvolve, resolveram problemas que desafiavam matemáticos há décadas. As conquistas, publicadas em março e abril de 2026, representam um salto qualitativo: a IA deixou de ser uma mera calculadora avançada para se tornar uma criadora de conhecimento capaz de gerar provas matemáticas originais e publicáveis. Enquanto o AlphaEvolve utilizou grandes modelos de linguagem para evoluir algoritmos de busca e quebrar recordes em problemas combinatórios como os números de Ramsey, o Aletheia demonstrou capacidade de resolver problemas em aberto de nível de pesquisa de doutorado, gerando provas que impressionaram matemáticos de instituições como o Instituto de Estudos Avançados de Princeton . AlphaEvolve: a IA que escreve algoritmos para quebrar recordesO sistema AlphaEvolve, desenvolvido pela DeepMind, opera com um princípio revolucionário: em vez de tentar resolver um problema matemático diretamente, ele gera algoritmos de busca especializados para cada problema. O sistema mantém uma população de algoritmos e utiliza um grande modelo de linguagem (Gemini) para mutar seus códigos, introduzindo novas estratégias de busca e heurísticas . Os algoritmos gerados são então executados e avaliados por sua capacidade de encontrar soluções de alta qualidade. Os melhores algoritmos são selecionados e reproduzidos, gerando uma evolução darwiniana no espaço de algoritmos. O resultado final não é uma resposta para um problema específico, mas sim um algoritmo otimizado que pode ser utilizado por matemáticos e cientistas . Recordes quebrados: números de Ramsey e o "problema alienígena"O AlphaEvolve alcançou seu feito mais notável ao melhorar os limites inferiores de cinco números de Ramsey clássicos, problemas tão complexos que o lendário matemático Paul Erdős costumava dizer que, se alienígenas exigissem o cálculo de R(5,5) sob pena de destruir a Terra, a humanidade deveria simplesmente se render. Os recordes quebrados incluem:
Embora cada avanço pareça incremental (apenas uma unidade), na teoria de Ramsey, esses aumentos representam progressos significativos, muitas vezes exigindo a descoberta de estruturas combinatórias extremamente complexas com milhares de vértices . As quatro famílias de algoritmos descobertas por IAUma das descobertas mais fascinantes do AlphaEvolve é que ele não encontrou uma solução única, mas sim quatro famílias distintas de algoritmos, cada uma adequada a diferentes tipos de problemas. O sistema, de forma autónoma, classificou os problemas e selecionou a estratégia mais adequada para cada um :
Tabela 1. Comparação dos recordes quebrados pelo AlphaEvolve
Aletheia: o agente que diz "não sei" e resolve problemas de doutoradoEnquanto o AlphaEvolve foca em problemas combinatórios específicos, o agente Aletheia representa um avanço mais geral. Construído sobre o modelo Gemini Deep Think, o Aletheia é projetado para realizar pesquisa matemática de forma autónoma, com uma característica crucial: ele é programado para admitir sua própria falha. Se não consegue resolver um problema, ele simplesmente não produz resposta . A arquitetura do Aletheia é baseada em um ciclo iterativo de três componentes principais: um gerador que propõe soluções candidatas, um verificador que as avalia rigorosamente e um revisor que aprimora as soluções com base no feedback. Este sistema de autocrítica evita o problema de alucinação comum em grandes modelos de linguagem e garante que apenas resultados verificados sejam apresentados . O desempenho do Aletheia no desafio FirstProofO Aletheia foi submetido ao FirstProof, um conjunto de dez problemas matemáticos de nível de pesquisa, descritos pelos autores como lemas que surgem naturalmente no trabalho de matemáticos profissionais. As soluções oficiais foram mantidas em sigilo, e o agente teve um prazo para apresentar suas respostas . O resultado impressionou a comunidade: o Aletheia produziu soluções corretas para seis dos dez problemas (2, 5, 7, 8, 9 e 10), de acordo com a avaliação de especialistas. O problema 7, em particular, já havia sido descrito como um problema em aberto de interesse, e a prova do Aletheia foi validada pelo próprio matemático que formulou a conjectura . Tabela 2. Desempenho do Aletheia no desafio FirstProof
O segredo do sucesso: saber quando dizer "não sei"Um dos aspetos mais notáveis do Aletheia é sua capacidade de autofiltragem. Para quatro dos dez problemas do FirstProof, o agente simplesmente não produziu nenhuma solução, retornando "nenhuma solução encontrada" ou não retornando nada dentro do tempo limite . A confiabilidade é o principal gargalo para a adoção de IA na pesquisa matemática. Os pesquisadores da DeepMind observaram que, para ser útil, um sistema de IA precisa ser capaz de admitir sua ignorância. Quando o Aletheia afirma ter resolvido um problema, a probabilidade de a solução estar correta é de 98,3 por cento . A reação da comunidade matemáticaA comunidade matemática recebeu os resultados com entusiasmo. O matemático Terence Tao, medalhista Fields, descreveu a IA como sua coautora júnior, e o CEO da DeepMind, Demis Hassabis, Prémio Nobel de Química de 2024, classificou o feito como um marco importante para a IA na matemática . O professor Kim Sang-hyun, do Instituto de Estudos Avançados da Coreia, que colaborou com a DeepMind, declarou que a IA e os matemáticos trocaram ideias para produzir resultados no nível de pesquisadores, e que utilizar a IA com base na ordem da comunidade matemática, construída ao longo de milhares de anos, será uma direção benéfica para a humanidade . Aviso importante: Este artigo tem fins exclusivamente informativos. As descobertas descritas são baseadas em pesquisas académicas em andamento e podem estar sujeitas a revisão e validação pela comunidade científica. Referências completas
Leia também no INFONEWS24HS |
