Présentation

Une équipe de chercheurs de l'université d'Alberta s'est améliorée sur leur logiciel champion du monde de poker, et l'amène au prochain niveau. Le programme, Polaris ("étoile polaire" en français), a affronté deux des joueurs les plus reconnues dans le monde -- Phil « The Unabomber » Laak et Ali Eslami.

Le match à $50.000 a eu lieu à Vancouver, Canada, en même temps que la conférence annuelle de l'association pour l'avancement de l'intelligence artificielle (Association for the Advancement of Artificial Intelligence), les 23 et 24 juillet.

La compétition été composée de quatre matchs doubles de 500 mains. Dans chaque match double, la même série de cartes a été tirée en parallèle pour chaque match homme contre la machine, les équipiers jouant les mains opposées à chaque jeu. Il y a donc deux équipes : une humaine et une machine. À la fin du match, le nombre total de chips gagnés ou perdus par chaque équipe est ajouté ensemble pour déterminer l'équipe qui gagne. Ce format de jeu est utiliséé pour ramener l'élément de chance aléatoire au minimum, et donne bien meilleure une indication des différences de compétence.


Détails

Qui : Les professionnels de poker Phil Laak et Ali Eslami jouent contre l'ordinateur champion de poker, Polaris.

Quoi : Le premier championnat homme-machine de poker.

Où : L'hôtel de Hyatt Regency, Vancouver, Canada, pendant la conférence de l'association pour l'avancement de l'intelligence artificielle (AAAI).

Quand :

  • Session 1 : Lundi 23 juillet 2007. Midi. Dans la chambre Regency F
  • Session 2 : Lundi 23 juillet 2007. 6:00 P.M. Dans la chambre Regency F
  • Session 3 : Mardi 24 juillet 2007. Midi. Dans la plaza B de la chambre
  • Session 4 : Mardi 24 juillet 2007. 6:00 P.M. Dans la plaza B

Pourquoi : Pour examiner la force du dernier programme d'intelligence artificielle de poker contre les joueurs professionnels d'élite humains.

Le but général de cette recherche en Intelligence Artificielle est d'apprendre comment manipuler des problèmes informatiques impliquant l'incertitude et l'information imparfaite. Un but spécifique est de produire par la suite un programme de poker qui est plus fort que tous les joueurs humains. Pour accomplir cela, nous devons évaluer nos programmes contre les joueurs humains très forts, avec du vrai argent en jeu.

Règles

  • Le jeu pour l'événement sera le Texas Hold'em Limit en un-contre-un.
  • Une équipe de deux humains joue contre une équipe de deux machines (toutes les deux étant des copies de Polaris).
  • Les équipiers jouent la même série de mains, mais des côtés opposés (un nord, l'autre sud) pour ramener l'élément chance au minimum.
  • Aucune communication entre léquipiers n'est autorisée pendant le jeu.
  • Tous les joueurs (BOT et humain) sont reliés à un serveur indépendant de poker administré par Poker Academy (www.poker-academy.com), quidistribuera les jeux en parallèle.
  • Chaque série de cartes sera produite aléatoirement, non connue par l'équipe humaine, les représentants de l'équipe de BOT, l'arbitre du match, et les administrateurs de match (aucune entité ne détermine les cartes à distribuer).
  • Il y a quatre sessions doubles de 500 mains chacune, à raison de deux sessions par jour.
  • L'équipe humaine recevra $5.000 additionnels pour chaque session qui est gagnée par plus de 25 "small bets" (+0.05 sb/h).
  • L'équipe humaine recevra $2.500 additionnels pour chaque session qui est gagnée ou perdue par 25 "small bets" ou moins (égalité statistique)
  • Toutes les mains jouées sont rendues publiques après l'événement.

Matchs doubles

En poker, la chance a un énorme impact sur des résultats à court terme. Même le jeu de plusieurs milliers de mains peut être peu concluant pour désigner le meilleur joueur. Dans des tournois typiques avec seulement quelques centaines de mains et des blindes et de antes croissant rapidement, les résultats, Madame Chance décide presque toujours du résultat.

Le match de l'homme contre la machine est une expérience scientifique, et a été conçu pour mesurer la différence de compétence tout en supprimant une grande partie de l'élément chance inhérent au jeu de poker. À cet effet, chaque session de 500 mains est jouée comme match double. Ceci signifie que la même série de cartes est distribuée dans les deux matchs parallèles, avec les deux humains ayant les mains opposées dans chaque match. En d'autres termes, Ali aura le siège « du nord » contre Polaris_A, tandis que Phil aura le siège « du sud » contre Polaris_B.Aucune communication entre les deux humains n'est permise, ni entre les copies séparées du programme Polaris.

À la fin de chaque session, les fonds combinés de l'équipe humaine seront comparés aux fonds combinés de l'équipe de BOT pour déterminer le gagnant du match double. Dans le cas d'une petite marge de victoire (à moins de 25 small bets), une égalité statistique est déclarée pour la manche. Quatre sessions doubles séparées sont jouées durant deux jours, permettant aux deux équipes d'apprendre plus au sujet de leur adversaire, et d'ajuster leur stratégie en conséquence.

Les matchs doubles ont été mis en place pour réduire considérablement le variance normale du poker dû à la chance. Le format a été étudié théoriquement et empiriquement sous forme de publications récentes par une équipe de chercheurs de l'université d'Alberta sur un programme de poker.


Résultats

Phil Laak et Ali Eslami l'ont emporté mardi soir à Vancouver sur la côte pacifique canadienne face à Polaris. Une victoire de justesse dans un match en quatre parties. La tâche des deux hommes n'a pas été facile. La dernière partie qui s'est prolongée tard dans la soirée de mardi était cruciale, car les trois précédentes, disputées lundi et mardi, s'étaient soldées par une victoire chacun pour les humains et pour la machine, et un match nul.

Parties épuisantes

«Je suis vraiment content que ce soit terminé», a déclaré Ali Eslami, 30 ans, estimant avoir disputé la partie la plus épuisante de sa carrière. L'affrontement entre l'homme et la machine, présenté comme le premier du genre dans le domaine du poker, a eu lieu dans le cadre d'une conférence scientifique sur l'intelligence artificielle à Vancouver, métropole de la côte ouest canadienne.

$10/$20 Limit Texas Hold'em


Session1 Session2 Session3 Session4 Total
Ali Eslami +$395 -$2495 -$635 +$460 -$2275
Phil Laak -$465 +$1570 +$1455 +$110 +$2670
Score d'équipe -$70 -$925 +$820 +$570 +$395
Résultat Egalité Polaris gagne Les hommes gagnent Les hommes gagnent Les hommes gagnent
Nombre de mains jouées 497* 499* 499* 500 1995

* Certains nombres de mains jouées ne sont pas tout à fait 500 dus à quelques difficultés techniques pendant les matchs. Dans les quelques cas où ces problèmes se sont produits, la main a été enlevée des deux côtés du match.