Publicado originalmente por MIT Technology Review
O pôquer requer uma habilidade que sempre pareceu exclusivamente humana: a capacidade de ser tortuoso. Para vencer, os jogadores devem analisar como seus oponentes estão jogando e então enganá-los para que entreguem suas fichas. Essa astúcia, é claro, é natural para as pessoas. Agora, um programa de IA demonstrou, pela primeira vez, ser capaz de enganar uma mesa inteira de profissionais de pôquer usando habilidades semelhantes.
Uma equipe da Carnegie Mellon University (CMU) e do Facebook usou uma combinação de técnicas de IA para superar as apostas e o blefe de jogadores humanos em um jogo de Texas Hold’em sem limite para seis jogadores. Cada um dos humanos envolvidos já havia ganhado mais de um milhão de dólares na mesa de pôquer – o que incluía Darren Elias, que detém o recorde de mais títulos do World Poker Tour, e Chris “Jesus” Ferguson, que ganhou seis títulos da World Series of Poker., bem como um bot de pôquer inferior.
A nova IA, Pluribus, jogou 5.000 mãos contra jogadores de pôquer e ganhou consistentemente mais do que seus oponentes. Em outro teste envolvendo 13 jogadores e 10.000 mãos, o bot saiu novamente vitorioso. A Pluribus adotou algumas estratégias surpreendentes, incluindo “donk bets”, ou terminar uma rodada com um call, mas depois iniciar a próxima rodada com uma aposta. Também blefou como um profissional experiente.
O algoritmo teve tanto sucesso que os pesquisadores decidiram não divulgar seu código por medo de que pudesse ser usado para esvaziar os cofres das empresas de pôquer online. “Pode ser muito perigoso para a comunidade do pôquer”, diz Noam Brown, pesquisador do Facebook e ex-aluno da CMU que ajudou a desenvolver o algoritmo. (Brown foi este ano nomeado um dos inovadores com menos de 35 anos da MIT Technology Review ).
“Normalmente, você descobre onde seu oponente é fraco, mas não há como encontrar pontos fracos”, diz Jason Les, um dos profissionais de pôquer do jogo. “Essa IA era tão forte que você não conseguia encontrar nada para explorar ou aproveitar.”
Les diz que se saiu bastante bem contra a IA, mas teve “basicamente sorte”, e relata que isso o pegou blefando diversas vezes. Ele também diz que o jogador de IA lhe ensinou alguns truques. “Algumas das coisas que vi a IA fazer abriram minha mente para como jogar potes ‘multi-way’ [multijogador]”, diz ele.
Jogos como o xadrez e o Go tornaram-se uma forma padrão de medir o progresso na inteligência artificial (embora cada jogo envolva apenas um aspecto limitado e estreito do que constitui a inteligência humana). Mas os jogos que a IA conquistou até agora envolvem principalmente apenas dois jogadores, e a maioria é jogada de forma que os movimentos do oponente sejam visíveis. As formas mais populares de pôquer, por outro lado, envolvem uma mesa com vários jogadores e muitas cartas escondidas.
“É alucinante”, diz Tuomas Sandholm, professor da Carnegie Mellon que ajudou a desenvolver o Pluribus. “Não pensei que estivéssemos perto – foi apenas há cerca de um ano que comecei a acreditar.”
Notavelmente, enquanto os algoritmos anteriores precisavam de um supercomputador, o Pluribus é executado em um único servidor. Detalhes da pesquisa e do jogo disputado contra especialistas em pôquer foram publicados hoje na revista Science .
“Com seis jogadores, é tão mais complicado que você não consegue pesquisar até o final do jogo”, diz Brown, que agora faz parte do grupo Facebook Artificial Intelligence Research (FAIR). “O algoritmo [de pesquisa] é a chave.”
A conquista é um marco importante para a inteligência artificial. Um programa de computador deve usar mais do que apenas computação bruta para vencer no pôquer. Também necessita de capacidade de negociação em circunstâncias incertas, utilizando os princípios da teoria dos jogos…
Veja o artigo completo no site MIT Technology Review