Януари 2017 г .; Интернет новини

Дали изкуственият интелект ще сложи край на покера ?

Тъй като Alphago „пропука“ играта go, все още ли има игра, която може да издържи напредъка на изкуствения интелект? Всъщност, за разлика от шаха и Go, покерът, поне в по-сложните му форми, досега се противопоставяше на всеки опит за автоматизация. Причината за това е, че това е игра с „непълна информация“. С други думи, машината не знае всички карти, държани от опонента си. Което предполага нова форма на алгоритъм. Има няколко варианта на покер, но този, който интересува най-много изследователите, е този, наречен Heads Up Texas hold'em, в който някои карти са видими, а други са известни само на играча (heads up означава лице в лице, което означава че играта е само двама играчи). Този вариант се предлага и в две версии: „с ограничения“ и „без ограничения“. Във втория играчите могат да вдигат залози през цялата игра. „Безграничният“ има 10 160 различни възможности за игра, тоест IEEE Spectrum ни напомня, може би повече от броя на атомите във Вселената. Бот на име Cepheus вече е спечелил версията "с ограничения", която предлага само 10 14 възможности.

Покерът привлече вниманието на търговската преса през последните дни поради две различни съобщения от два отбора, които се стремят да решат сложността на "без ограничения". На първо място, екип от университета Карнеги Мелън, воден от Туомас Сандхолм, тества своя софтуер срещу най-добрите професионални играчи: състезанието започна на 11 януари и ще приключи на 30 (не е възможно да проследите напредъка на този мач в реално време време на този сайт).

В същото време друга група, водена от Майкъл Боулинг от университета в Алберта, предложи нова програма, Deepstack (.pdf). Изследователите твърдят, че са играли програмата си срещу 33 професионални играчи, всеки от които е играл около 3000 мача срещу машината, а Deepstack би бил на нивото на своите противници. По принцип двата съревноваващи се отбора се основават на две различни теории. Първият, този в центъра на Либрат, е „класическа“ форма на изкуствен интелект. Второто, на което се основава Deepstack, е известното Deep Learning.

Хората под натиск

Малък проблем, напомня IEEE Spectrum, дори суперкомпютър не може да покрие 10 160 потенциала на неограничения вариант на Texas Hold'em. Така Сандхолм и неговият екип намериха начин да намалят размера на това дърво и също така, за разлика от Клаудико, да се учат от грешките му.

Експериментът с Клаудико завърши с победата на хората. Основната причина би била свързана с адаптивността на последния, който много бързо разбра стратегията на бота - докато ботът не беше в състояние да се адаптира към човешката стратегия. Сандхолм каза за споменатите играчи: "Бях много впечатлен от тяхната бърза адаптация, те научиха много бързо от много малък брой ръце".

Ще се случи ли същото с Либрат? Твърде рано е да се съди, разбира се (състезанието ще приключи едва на 30 януари). След първата фаза, в която Либрат водеше, хората след това се качиха по склона на 17 януари. Но нишката на пищялката на Джейсън Лес, един от играчите, състезаващи се срещу програмата, споменава на 18-ти, че машината е поела.

Но хората имат предимство. След като играта приключи, играчите обсъждат и обмислят стратегиите, които да приемат. Оливър Редър, на fivethirtyeight.com (известният уебсайт, управляван от статистик Нейт Силвър), разказва една от тези сесии за разбор:

„След дневната сесия дневник на всяка изиграна ръка се предоставя цифрово на играчите. Тази сряда, докато зареждат данните, цветните числа, топлинните карти, линейните графики и вероятностите мигат в прозореца на софтуера за анализ (...). Те преминаха през всички най-големи ръце на деня, смилайки ги почти мигновено, точно както майстор по шах можеше да изиграе партия в главата си за секунди. Те се опитаха да определят недостатъците в собствената си стратегия и да атакуват тези на бота. Бавно, но сигурно изглеждаше, че демонтират метода на игра на Либрат. "

Интересното при това е, че откриваме, че геймърите също сега използват компютри и алгоритми, за да правят своите планове. С други думи, идеята за „чисто човешки“ играчи, които се противопоставят на машини, вече изглежда до голяма степен е мит ...

И все пак, потенциална победа на Либрат може сериозно да навреди на бъдещето на онлайн покера. Вече, казва ни triblive.com, играчите започват да се предпазват от виртуални взаимодействия, за да предпочитат срещи лице в лице: в интернет те не знаят дали се бият с човек или бот. В допълнение, светът на онлайн покера е в криза от няколко години, след наречения Черен петък през 2011 г., когато трите основни онлайн покер платформи бяха затворени за измами. Вече няма да има достатъчно пари и игри за професионалните играчи, за да си изкарват прехраната. Днес, според fivethirtyeight.com, ситуацията е особено трудна за последователите на хедс-ъп Тексас холдхем без ограничение, тъй като според Джейсън Лес има само около 20 добри играчи в света. Ако Либрат спечели състезанието, играта може да умре ...

Дълбоко обучение на помощ

Могат ли невронните мрежи, Дълбоко обучение, да играят важна роля при решаването на проблеми с непълна информация? Според Wired Deepstack започва, подобно на по-традиционните програми, чрез изграждане на дърво от възможности. Но той не стига до края. Той анализира всяка ръка според контекста и взема решението си и според направените залози.

Изследователите сравняват техниката за сближаване на DeepStack с инстинкта на човешки играч, когато противник блъфира или държи печеливша ръка, дори ако машината трябва да основава оценката си на това как противникът залага, а не на техния език. „Тази оценка може да се приеме като интуиция на DeepStack“, пишат те.

Но Wired посочва, Deepstack е от допълнително значение. Ако се окаже, че използваният метод е ефективен за игра като покер, алгоритъмът може да бъде разширен и към други, много по-важни области, като икономика, война или търговия.

Но Deep Learning не е единственият с тази амбиция. Тумоас Сандхолм също смята програмата си Libratus за отправна точка за решаване на всякакви ситуации, включващи непълна информация.

С други думи, играчите на AI покер ще се доближат до истинския AI, способни да се справят със сложните ситуации, с които се сблъскват хората ... Ще бъдат ли казината врата към Singularity ?

Можем ли да въоръжим „прозрачността“ на алгоритмите ?

Роджър Тейлър (@rtayloropendata) е основателят на мрежата за отворени обществени услуги към Кралското общество на изкуствата. Той е и автор с Тим Келси, директор на австралийската агенция за дигитално здраве (след като е бил на британската NHS и отговаря за откритостта и прозрачността на данните в кабинета), на Прозрачност и отворено общество. В забележителен форум за Discover Society той се върна към въпросите за прозрачността.