В Канаде ученые разработали компьютерную программу, которая является "непобедимым игроком" в покер.
Программа "Цефей" (Cepheus) обучена играть только в одну разновидность популярной карточной игры -
техасский холдем с двумя партнерами и ставками фиксированного размера.
"Цефей" развивал свои способности без вмешательства человека - программу только
ознакомили с правилами игры, после чего она тренировалась самостоятельно.
Ученые рассказали, что "Цефей" на протяжении двух месяцев использовал более
четырех тысяч процессоров, на которых каждую секунду разыгрывались шесть
миллиардов партий в покер - больше, чем человечество сыграло за всю свою
историю.
По мнению создателей программы, она является ключевым этапом в области
исследований искусственного интеллекта и теории игр. Они напоминают, что покер
является игрой с неполной информацией в отличие от шашек, алгоритм игры в
которые полностью просчитан, и шахмат, при игре в которые компьютеры
побеждают людей-шахматистов.
Проверить силу "Цефея" и сыграть с ним в покер можно на сайте проекта.
--
"Цефей" развивал свои способности без вмешательства человека - программу только
ознакомили с правилами игры, после чего она тренировалась самостоятельно.
--
Улыбнуло.. Алгоритм тренировки кто написал? Или программеры - не люди?
Покер - это гремучая смесь из математики, психологии и удачи..
В математике программа будет иметь преимущество перед человеком..
В психологии человек сильнее..
Удачу никто из них контроллировать не может..
Преимущества никто не имеет..
Это в идеале.. А в реале, любая программа ограничена талантом (фантазией) программера..
Это все имхо, естественно..
Немного не соглашусь..
--
"против идеального алгоритма может выигрывать только лакер на короткой дистанции."
--
Идеального алгоритма в игре с неполной информацией быть не может в принципе..
--
в игре машина - человек фактор психологии уже как-то выпадает из описанной тобой гремучей смеси
--
Не согласен.. Обман в покере играет немаловажную роль.. Будь то чистый блеф, продолженная ставка, 3-бет с маргинальной рукой, сквиз, ну и т.д. Обман - это психология.. Написать алгоритм действий для эффективного обмана (эффективного распознавания обмана) еще надо умудриться.. Любое действие оппонента влечет за собой принятие решения, которое сводится к "верю" или "не верю".. Так что никуда психология не денется..
--
Согласно никем не отмененному ЗБЧ, фактор удачи нивелируется
--
Да я не против.. Только не согласен.. Мы принимаем решения в каждой отдельно взятой раздаче, где удача, опять таки, имеет немаловажную роль.. А если повезет не нам.. И так несколько раз.. Банкрола может и не хватить, чтобы воспользоваться преимуществом дистанции..
--
Но оба оппонента имеют одинаковую информацию. Преимущество у того, кто лучше ее оценивает и использует
--
Опять не согласен.. Оба оппонента имеют разную информацию (карманные карты).. Оценивать информацию можно исключительно по ставкам оппонента.. Насколько достоверна такая информация?.. Невозможно играть оптимально, не зная карт соперника.. Преимущество будет у того, кто лучше умеет давать ложную информацию..
Увлекся.. :) Забыл, что речь идет о лимитном холдеме..
Все что писал до этого касается безлимитного холдема..
В лимитном холдеме точный расчет шансов таки принесет свои плоды..
И таки да, математика подвинет в сторону психологию..
Что касаемо удачи..
Мы все играем в покер, потому что верим в то, что на дистанции всем нам выпадет одинаковое количество хороших и плохих карт, попаданий во флоп, натсов и перездов т.д. Все зависит от того, что мы будем с этим делать.. Получается удача и не важна как бы.. :) Однако не хотелось бы оказаться среди тех людей, которым достанутся много плохих раскладов в первой половине дистанции или при переходе на более высокий лимит.. :)
Канадским ученым удалось написать компьютерную программу, способную на слабое решение самой популярной разновидности покера — техасского холдема (с лимитированными ставками). Иными словами, компьютер смог создать стратегию игры, настолько близкую к оптимальной, что никакой человек не способен обыграть его (со статистическим уровнем значимости) за всю свою жизнь. О программе, получившей название Cepheus («Цефей») сообщается в журнале Science.
Покер, как и другие карточные игры, относится к играм с неполной информацией — где участники обладают скрытым от остальных знанием о своих картах, а также могут использовать это знание в свою пользу (например, блефовать). Если в играх с полной информацией (например, шахматах, где оба игрока видят положение всех фигур на доске) искусственный интеллект или обыгрывает человека, или как минимум добился паритета с ним, то над покером программисты безуспешно бились с 2006 года (когда прошел первый ежегодный чемпионат по этой игре среди компьютеров).
Метод Майкла Боулинга (Michael Bowling) и его коллег основывается на принципе counterfactual regret minimization. Алгоритм реализуется на распределенных вычислительных узлах за счет того, что игра разбивается на отдельные фрагменты (около 110 тысяч), согласно доступной информации (знанию об открытых картах и прошлых ходах игроков). Кроме того, специальные техники сжатия данных обеспечивали хранение фрагментов партии на локальных дисках и возврат их в память системы для расчетов. Всего использовалось 200 вычислительных узлов (24 2,1-гигагерцовых процессора AMD, 32 гигабайта оперативной памяти, 1-терабайтный жесткий диск в каждом), а вычисления заняли в общей сложности 68 с половиной суток. За это время Cepheus провел сам с собой несколько миллиардов партий, таким образом набрав необходимый опыт игры.
Практическое преимущество новой техники в том, что ученые снизили требования к ней: не найти точное равновесие, а гарантировать лишь, что при присущей человеку скорости игры противник не сможет выиграть за всю свою жизнь. Для большинства практических приложений этого вполне достаточно. Новый алгоритм обещает найти применение всюду, где имеет место неопределенность и дефицит информации: в сфере бизнеса (модели торгов и переговоров), в медицине (разработка планов борьбы с эпидемиями) и в сфере компьютерной безопасности.
Узнать больше о Cepheus и сыграть с ним партию можно на сайте Университета Альберты.