Pokerspillet “Heads up no limit Texas hold’em” er sådan set et meget enkelt kortspil. Men det er vildt svært at mestre for en computer.
Nu er det alligevel lykkedes softwaren DeepStack at banke 11 professionelle pokerspillere i “Heads up no limit Texas hold ’em”. Resultatet viser, hvordan AI- altså kunstig intelligens – vinder frem.
Kender ikke modstanderens kort
Lige som i andre kortspil, kender de to spillere ikke alle modstanderens kort i “Heads up no limit Texas hold’em”.
For en computerprogrammør betyder det, at spillet indeholder såkaldt asymmetrisk information. Og den slags er i sig selv nok til at give grå hår i kredsløbene, når en computer skal regne ud, hvor stærk modstanderens hånd er.
Oven i det, skal computeren tage højde for hele det psykologiske spil ved et pokerbord.
Bluf
For eksempel aflurer pokerspillere hinandens styrke ved at tolke på ansigtsudtryk og pengeindsatser undervejs som spillet udvikler sig.
Desuden tester spillerne hinanden i håb om at finde et mønster i, hvor meget modspilleren er parat til at gamble. Det hele krydres så med en god portion bluf for at sløre egen strategi i spillet, og skræmme modstandere til at give op .
Ikke computeres livret
Med andre ord: Psykologi og intuition spiller en stor rolle i poker. Og det er bare ikke computeres livret.
Kolde elektronhjerner har langt nemmere ved at beregne sandsynligheder, når alle oplysninger om modstanderens muligheder er til rådighed. Som for eksempel i skak. Eller Backgammon eller Go.
Derfor har kunstig intelligens traditionelt klaret sig langt bedre i den slags komplicerede brætspil, end i de simple kortspil med bluf, pokerfjæs og kort tæt på kroppen.
Kunstig intelligens overlegent
På det seneste er det dog lykkedes forskere at lave software, der kan hamle op med de professionelle pokerspillere.
I januar vandt softwareprogrammet Libratus over fire professionelle pokerspillere ved en mand-mod-maskine-turnering. Og nu er en artikel netop offentliggjort i tidsskriftet Science, hvor andre forskere beskriver et softwareprogram, DeepStack, som har blanket 11 professionelle pokerspillere af i 3300 runder “Heads up no limit Texas hold’em”.
I 10 af opgørene vandt DeepStack endda med statistisk signifikans, som det hedder – altså uden det på nogen måde kan tilskrives held. Computeren var simpelthen bedst.
Programmeringen med spillekort, jetoner og computerkode er udført på to tjekkiske og et canadisk universitet og beskrevet i en artikel i tidsskriftet Science.
Regner forfra
For at gøre det muligt for softwaren at gennemføre beregningerne på rimelig tid, undlod programmørerne at lade programmet beregne alle muligheder til bunds. De lod også programmet regne forfra, hver gang, den skulle satse penge.
Det betød at antallet af mulige valg i spillet blev skåret ned fra 10^160 til 7 millioner – altså fra et 1-tal med 160 nuller efter sig til kun 7 nuller.
Desuden blev softwaren bygget op med flere uafhængige del-programmer, der hver især lærer af sine erfaringer. Alt i alt betyder det, at DeepStack kan gennemføre alle nødvendige beregninger i spillet på 5 sekunder.
Ikke kun poker
Det virker oplagt, at man vil kunne bruge programmet til at tjene sig en god klat penge på diverse internetkasinoer.
Men forskerne mener selv, at deres software vil blive nyttig i helt andre sammenhænge, hvor man også skal regne med asymmetrisk information. For eksempel ved anbefalinger af medicinske behandlinger til patienter.
Kilde: Science
Skrevet af Henrik Prætorius 2. marts 2017