COMPARTILHAR
Bot Poker Online

Um robô, ou “bot”, pode superar os humanos no poker? Com tecnologias cada vez mais sofisticadas, os programas de Inteligência Artificial (IA) atingiram um novo patamar com o nascimento do Pluribus.

O programa foi desenvolvido pelo Facebook em parceria com a universidade Carnegie Mellon. A instituição é a mesma responsável pela criação do Libratus, bot que já havia superado profissionais em jogos heads-up.

VEJA MAIS: Spin & Go de US$ 1 milhão foi acertado ao vivo no Twitch de russo; confira a reação

A nova criação, o Pluribus, conseguiu pela primeira vez ser vencedor em um jogo 6-Max, que traz muito mais complexidade. Outra diferença é que enquanto o Libratus precisava de um supercomputador para rodar, o novo bot exige apenas cerca de US$ 150 em recursos na nuvem.

A competição foi qualificada. Participaram do desafio: Chris Ferguson, Linus Loeliger, Nick Petrangelo, Seth Davies, Darren Elias, Greg Merson, Dong Kim, Anthony Gregg, Jake Tooler, Jimmy Chou, Daniel McAulay, Trevor Savage, Jason Les, Michael Gagliano e Sean Ruane.

Interface do Pluribus
Interface do Pluribus

Foram dois tipos de partidas: com cinco humanos e uma inteligência artificial, e cinco inteligências artificiais e um humano. As mesas eram de cash game, com stacks de 100 big blinds em todas mãos, e os profissionais não sabiam quem eram os adversários.

VEJA MAIS: Satélite para o BSOP Gramado volta a dobrar premiação garantida no PokerStars

No primeiro formato, após 10.000 mãos jogadas, o Pluribus obteve um resultado de 5BB/100, ou seja, 5 big blinds de lucro a cada 100 mãos, em média. Importante ressaltar que os pesquisadores usaram um algoritmo que busca diminuir a variância da partida, calculando um resultado “teórico”.

No segundo experimento, apenas Ferguson, Elias e Loeliger participaram. Os três jogaram 5.000 mãos cada e saíram derrotados contra os cinco robôs. Elias perdeu 4BB/100, Ferguson 2,5BB/100, e Loeliger 0,5BB/100.

Diferentemente do Libratus, que usava o sistema de “árvore de decisões” para jogar, o Pluribus aprendeu o poker simplesmente jogando um número gigantesco de mãos contra si mesmo. Assim, a inteligência artificial foi aprendendo as estratégias mais lucrativas. Foi essa mudança que permitiu, também, a necessidade de uma capacidade de processamento muito menor.

Curva de aprendizado do Pluribus
Curva de aprendizado do Pluribus

Segundo os pesquisadores, após 7 horas de “treinamento”, o Pluribus já tinha uma performance melhor do que a média. Após 20 horas, passou a superar também os humanos de melhor performance no jogo. Curiosamente, após 60 horas de treinamento, o programa eliminou completamente o limp de sua estratégia.

O que isso significa para a situação do poker ainda é impossível saber. Mas o fato é que a entrada da inteligência artificial pode mudar a situação do jogo pra sempre.