Publicado originalmente por MIT Technology Review
Modelos de IA podem facilmente gerar ensaios e outros tipos de texto. No entanto, eles não são nem de longe tão bons em resolver problemas de matemática, que tendem a envolver raciocínio lógico — algo que está além das capacidades da maioria dos sistemas de IA atuais.
Mas isso pode finalmente estar mudando. O Google DeepMind diz que treinou dois sistemas de IA especializados para resolver problemas matemáticos complexos envolvendo raciocínio avançado. Os sistemas — chamados AlphaProof e AlphaGeometry 2 — trabalharam juntos para resolver com sucesso quatro dos seis problemas da Olimpíada Internacional de Matemática (IMO) deste ano, uma prestigiosa competição para estudantes do ensino médio. Eles ganharam o equivalente a uma medalha de prata.
É a primeira vez que um sistema de IA atinge uma taxa de sucesso tão alta nesses tipos de problemas. “Este é um grande progresso no campo do aprendizado de máquina e IA”, diz Pushmeet Kohli, vice-presidente de pesquisa do Google DeepMind, que trabalhou no projeto. “Nenhum sistema desse tipo foi desenvolvido até agora que pudesse resolver problemas com essa taxa de sucesso e com esse nível de generalidade.”
Há algumas razões pelas quais problemas matemáticos que envolvem raciocínio avançado são difíceis de resolver para sistemas de IA. Esses tipos de problemas geralmente exigem a formação e o uso de abstrações. Eles também envolvem planejamento hierárquico complexo, bem como definição de subobjetivos, retrocesso e tentativa de novos caminhos. Tudo isso é desafiador para a IA.
“É frequentemente mais fácil treinar um modelo para matemática se você tiver uma maneira de verificar suas respostas (por exemplo, em uma linguagem formal), mas há comparativamente menos dados matemáticos formais online em comparação com a linguagem natural de forma livre (linguagem informal)”, diz Katie Collins, pesquisadora da Universidade de Cambridge que é especialista em matemática e IA, mas não estava envolvida no projeto.
Preencher essa lacuna foi o objetivo do Google DeepMind ao criar o AlphaProof, um sistema baseado em aprendizado por reforço que se treina para provar afirmações matemáticas na linguagem de programação formal Lean. A chave é uma versão da IA Gemini da DeepMind que é ajustada para traduzir automaticamente problemas matemáticos formulados em linguagem natural e informal em afirmações formais, que são mais fáceis para a IA processar. Isso criou uma grande biblioteca de problemas matemáticos formais com vários graus de dificuldade.
Automatizar o processo de tradução de dados em linguagem formal é um grande passo à frente para a comunidade matemática, diz Wenda Li, professora de IA híbrida na Universidade de Edimburgo, que revisou a pesquisa por pares, mas não estava envolvida no projeto…
Veja o artigo completo no site MIT Technology Review