Os seres humanos venceram os modelos de inteligência artificial generativa (IA) criados pela Google e pela OpenAI, num concurso internacional de matemática de topo, apesar de os programas terem atingido pela primeira vez a pontuação de ouro.
Corpo do artigo
Nenhum dos modelos obteve a pontuação máxima - ao contrário de cinco jovens na Olimpíada Internacional de Matemática (IMO), uma prestigiada competição anual para participantes com menos de 20 anos.
A Google disse na segunda-feira que uma versão avançada do seu chatbot Gemini tinha resolvido cinco dos seis problemas de matemática definidos na IMO, realizada em Queensland, na Austrália, este mês. "Podemos confirmar que o Google DeepMind alcançou o tão desejado marco, obtendo 35 dos 42 pontos possíveis - uma pontuação medalha de ouro", disse o gigante tecnológico norte-americano citando o presidente da IMO, Gregor Dolinar.
"As soluções foram surpreendentes em muitos aspetos. Os avaliadores da IMO consideraram-nas claras, precisas e, na sua maioria, fáceis de seguir".
No concurso, cerca de 10% dos concorrentes humanos ganharam medalhas de ouro e cinco receberam pontuações perfeitas de 42 pontos. O fabricante norte-americano de ChatGPT OpenAI afirmou que o seu modelo experimental de raciocínio obteve 35 pontos, nível ouro, no teste.
O resultado "permitiu vencer um grande desafio de longa data em matéria de IA" no "concurso de matemática mais prestigiado do mundo", escreveu Alexander Wei, investigador da OpenAI, nas redes sociais.
"Avaliámos os nossos modelos nos problemas da IMO de 2025 sob as mesmas regras que os concorrentes humanos", afirmou, sublinhando que, "para cada problema, três ex-medalhistas da IMO classificaram de forma independente a prova apresentada pelo modelo."
A Google obteve uma medalha de prata na IMO do ano passado, na cidade britânica de Bath, resolvendo quatro dos seis problemas, demorando dois a três dias de computação - muito mais tempo do que este ano, já que o modelo Gemini resolveu, neste ano, os problemas dentro do limite de tempo de 4,5 horas, disse.
O IMO afirmou que as empresas de tecnologia tinham "testado em privado modelos de IA de código fechado nos problemas deste ano", os mesmos enfrentados por 641 estudantes concorrentes de 112 países. "É muito emocionante ver o progresso nas capacidades matemáticas dos modelos de IA", disse o presidente da IMO, Dolinar.
Os organizadores do concurso não puderam verificar a quantidade de capacidade de computação utilizada pelos modelos de IA ou se houve envolvimento humano, advertiu.