UAPOKER
Зарегистрируйтесь или войдите, чтобы получать билеты на фрироллы Info

Программа научилась беспроигрышно играть в покер

saniio
saniio
Пользователь оффлайн. Последний раз был на сайте 3 года назад. Оффлайн
VIP пользователь
На сайте: 12 лет
Сообщения: 3977

В Канаде ученые разработали компьютерную программу, которая является "непобедимым игроком" в покер.

Программа "Цефей" (Cepheus) обучена играть только в одну разновидность популярной карточной игры - 

техасский холдем с двумя партнерами и ставками фиксированного размера. 

"Цефей" развивал свои способности без вмешательства человека - программу только 

ознакомили с правилами игры, после чего она тренировалась самостоятельно.

Ученые рассказали, что "Цефей" на протяжении двух месяцев использовал более 

четырех тысяч процессоров, на которых каждую секунду разыгрывались шесть 

миллиардов партий в покер - больше, чем человечество сыграло за всю свою 

историю.

По мнению создателей программы, она является ключевым этапом в области 

исследований искусственного интеллекта и теории игр. Они напоминают, что покер 

является игрой с неполной информацией в отличие от шашек, алгоритм игры в 

которые полностью просчитан, и шахмат, при игре в которые компьютеры 

побеждают людей-шахматистов.

Проверить силу "Цефея" и сыграть с ним в покер можно на сайте проекта.

Источник: 
http://tengrinews.kz/progress/programma-nauchilas-besproigry

PartyPoker
akaz0
akaz0
Пользователь оффлайн. Последний раз был на сайте 5 лет назад. Оффлайн
На пользователя есть (или были недавно) претензии
На сайте: 11 лет
Сообщения: 1253
Интересно, но мнение что программа превосходит человеческий мозг, на мой взгляд, ошибочна, если она не видит карты противника22.gif
saniio
saniio
Пользователь оффлайн. Последний раз был на сайте 3 года назад. Оффлайн
VIP пользователь
На сайте: 12 лет
Сообщения: 3977
Речь ведь не о превосходстве. Софт просто играет безошибочно - т.е. на дистанции у него будет множество плюсовых решений. Поэтому он "непобедимый", а не потому, что выигрывает каждую раздачу.
sot956
sot956
Пользователь оффлайн. Последний раз был на сайте 2 часа назад. Оффлайн
VIP пользователь1-е место в приватном фриролле на Titan PokerПобедитель 8-ми приватников на PokerStarsПобедитель Honey фриролла
На сайте: 14 лет
Сообщения: 6771
saniio , эти проги известны уже давно и называются : "ПокерСтарс","ФуллТ.",и всяко разно остально.
akaz0
akaz0
Пользователь оффлайн. Последний раз был на сайте 5 лет назад. Оффлайн
На пользователя есть (или были недавно) претензии
На сайте: 11 лет
Сообщения: 1253
saniio сказал:
Речь ведь не о превосходстве. Софт просто играет безошибочно - т.е. на дистанции у него будет множество плюсовых решений. Поэтому он "непобедимый", а не потому, что выигрывает каждую раздачу.

я понял что ты хотел сказать, просто не могу понять безошибочно , каждая раздача, каждый ход- это и есть решение, насколько оно правильно, мне кажется, нельзя решить. Именно этим и интересен покер и множество других интеллектуальных игр-это же не "15", где компьютер может просчитать самое быстрое решение11.gif
Vukin
Vukin
Пользователь оффлайн. Последний раз был на сайте 1 год назад. Оффлайн
VIP пользователь
На сайте: 9 лет
Сообщения: 4883
Хорошие игроки обыграют эту программу, поэтому нельзя называть её непобедимой
Bug
Bug
Пользователь оффлайн. Последний раз был на сайте 38 недель назад. Оффлайн
VIP пользовательНаграда: 1-е место в приватнике на BetfairНаграда: 1-е место в приватнике на FullTiltНаграда: 1-е место в приватнике на RedStarНаграда: 1-е место на Битве Форумов (OFC)Награда: Победитель двух приватников на PokerStarsНаграда: Победитель трех приватников на NoxwinНаграда: 1-е место в приватнике на 888poker
На сайте: 14 лет
Сообщения: 4502
Vukin сказал:
Хорошие игроки обыграют эту программу, поэтому нельзя называть её непобедимой

Всегда забавляют такие утверждения. Оно на чем-то основано?
SLVK
SLVK
Пользователь оффлайн. Последний раз был на сайте 5 лет назад. Оффлайн
VIP пользовательНаграда: Победитель двух приватников на TitanНаграда: 1-е место в приватнике по Omaha на PSПобедитель девяти приватников на PSПобедитель новогоднего турнира 2016Победитель фриролла для лидеров рейтинга
На сайте: 10 лет
Сообщения: 1672
Вот он обратный бахматинг.
xxArturasxx
xxArturasxx
Пользователь оффлайн. Последний раз был на сайте 8 недель назад. Оффлайн
VIP пользовательНаграда: 1-е место в приватнике по Omaha на PS
На сайте: 14 лет
Сообщения: 2547
Сомневаюсь,что кто то будет жертвовать своим временем,чтоб сыграть против нее нн-ое колличество рук и проверить обоснованность таких заявлений.
А бабки ученым получать надо. Вот они и трындят все что попало. О динозаврах,звездах и т.д. Теперь вот прога,которую проверить не возможно.

Bug
Bug
Пользователь оффлайн. Последний раз был на сайте 38 недель назад. Оффлайн
VIP пользовательНаграда: 1-е место в приватнике на BetfairНаграда: 1-е место в приватнике на FullTiltНаграда: 1-е место в приватнике на RedStarНаграда: 1-е место на Битве Форумов (OFC)Награда: Победитель двух приватников на PokerStarsНаграда: Победитель трех приватников на NoxwinНаграда: 1-е место в приватнике на 888poker
На сайте: 14 лет
Сообщения: 4502
akaz0 сказал:
просто не могу понять безошибочно , каждая раздача, каждый ход- это и есть решение, насколько оно правильно, мне кажется, нельзя решить.

игрок за столом ведь как-то принимает решение, как ему сыграть и играет так, как считает правильнее. Программа также оценивает ситуацию и принимает решение, правильное, согласно заложенным в нее алгоритмам. В совершенном алгоритме все принятые решения - правильные.
akaz0
akaz0
Пользователь оффлайн. Последний раз был на сайте 5 лет назад. Оффлайн
На пользователя есть (или были недавно) претензии
На сайте: 11 лет
Сообщения: 1253
Bug сказал:
akaz0 сказал:
просто не могу понять безошибочно , каждая раздача, каждый ход- это и есть решение, насколько оно правильно, мне кажется, нельзя решить.

игрок за столом ведь как-то принимает решение, как ему сыграть и играет так, как считает правильнее. Программа также оценивает ситуацию и принимает решение, правильное, согласно заложенным в нее алгоритмам. В совершенном алгоритме все принятые решения - правильные.

да можно спорить сколько угодно...я такой пас...комп вау!!! бет а я такой весь аллын4.gif, комп такой пипи и в аут
Bug
Bug
Пользователь оффлайн. Последний раз был на сайте 38 недель назад. Оффлайн
VIP пользовательНаграда: 1-е место в приватнике на BetfairНаграда: 1-е место в приватнике на FullTiltНаграда: 1-е место в приватнике на RedStarНаграда: 1-е место на Битве Форумов (OFC)Награда: Победитель двух приватников на PokerStarsНаграда: Победитель трех приватников на NoxwinНаграда: 1-е место в приватнике на 888poker
На сайте: 14 лет
Сообщения: 4502
akaz0 сказал:
да можно спорить сколько угодно...я такой пас...комп вау!!! бет а я такой весь аллын4.gif, комп такой пипи и в аут

да, в таком стиле можно спорить сколько угодно. Программа от этого хуже или лучше играть не станет.
akaz0
akaz0
Пользователь оффлайн. Последний раз был на сайте 5 лет назад. Оффлайн
На пользователя есть (или были недавно) претензии
На сайте: 11 лет
Сообщения: 1253
да не я имел ввиду,что программа выполняет определенные действия, ну там если 20% на победу, то колить алын не будет, а блеф умело обойдет это дело. Я же не говорю,что прога это хрень, просто человек и программа это определенно предмет для спора)). Я бы с удовольствием посмотрел бы эксперименты со знаменитыми игроками и машиной22.gif
saniio
saniio
Пользователь оффлайн. Последний раз был на сайте 3 года назад. Оффлайн
VIP пользователь
На сайте: 12 лет
Сообщения: 3977
akaz0, на самом деле все просто. Есть единственный критерий - колличество выигранных фишек. Чем большее количество правильных решений ты принимаешь, тем больше количество фишек ты выигрываешь. А правильные решения основываются преимущественно на математике, теории вероятности и комбинаторике. Не сомневаюсь, что хороший софт разбирается в этом получше нас всех вместе взятых.
А если верить написанному, то она еще и аджаститься умеет.
В турнирах, может, эта прога и не будет столь эффективной. Но в кеше, почему - понятно, против идеального алгоритма может выигрывать только лакер на короткой дистанции.
Всегда догма "против системы не попрешь" доказывала свою состоятельность.
Joaquin
Joaquin
Пользователь оффлайн. Последний раз был на сайте 2 года назад. Оффлайн
VIP пользовательНаграда: 1-е место в приватнике на BetfairНаграда: 1-е место в приватнике на PokerStars
На сайте: 14 лет
Сообщения: 978
Я так понимаю очень много захотели поиграть с прорамой, и положили сайт, сейчас не отрывается.
xRomul
xRomul
Пользователь оффлайн. Последний раз был на сайте 1 год назад. Оффлайн
На сайте: 9 лет
Сообщения: 102

--

"Цефей" развивал свои способности без вмешательства человека - программу только 

ознакомили с правилами игры, после чего она тренировалась самостоятельно.

--


Улыбнуло.. Алгоритм тренировки кто написал? Или программеры - не люди?


Покер - это гремучая смесь из математики, психологии и удачи..

В математике программа будет иметь преимущество перед человеком..

В психологии человек сильнее..

Удачу никто из них контроллировать не может..

Преимущества никто не имеет..

Это в идеале.. А в реале, любая программа ограничена талантом (фантазией) программера..

Это все имхо, естественно..


xRomul
xRomul
Пользователь оффлайн. Последний раз был на сайте 1 год назад. Оффлайн
На сайте: 9 лет
Сообщения: 102

Немного не соглашусь..


--

"против идеального алгоритма может выигрывать только лакер на короткой дистанции."

--


Идеального алгоритма в игре с неполной информацией быть не может в принципе..

Антоха
Антоха
Пользователь оффлайн. Последний раз был на сайте 2 часа назад. Оффлайн
VIP пользовательНаграда: 1-е место в приватнике на PartyPokerНаграда: 1-е место в приватнике на PokerStarsПобедитель десяти приватников на 888pokerПобедитель трех приватников на Lotos Poker
На сайте: 15 лет
Сообщения: 9375
Ну вот блин. Даже программа научилась играть, а некоторые ноют, что ГСЧ подкручен, что не везёт и годами бьют НЛ24.gif
saniio
saniio
Пользователь оффлайн. Последний раз был на сайте 3 года назад. Оффлайн
VIP пользователь
На сайте: 12 лет
Сообщения: 3977
xRomul, в игре машина - человек фактор психологии уже как-то выпадает из описанной тобой гремучей смеси. По понятным причинам. В он-лайне он, кстати, тоже играет не первую и даже не вторую роль, в отличие от игры в IRL.
Согласно никем не отмененному ЗБЧ, фактор удачи нивелируется. Она ведь дама  ветренная. 
Что в сухом остатке? Правильно, математика. А ты говоришь: "преимущества никто не имеет".
Пускай будет не "идеальный", а "оптимальный". Но оба оппонента имеют одинаковую информацию. Преимущество у того, кто лучше ее оценивает и использует, учитывая возможность косвенно влиять на максимальный размер ставки оппонента. 

xxArturasxx
xxArturasxx
Пользователь оффлайн. Последний раз был на сайте 8 недель назад. Оффлайн
VIP пользовательНаграда: 1-е место в приватнике по Omaha на PS
На сайте: 14 лет
Сообщения: 2547
saniio, В какую из трех основных частей этой "смеси" отнести блеф? Он ведь играет определенную роль,где бы ты не играл.

oleg310
oleg310
Пользователь оффлайн. Последний раз был на сайте 7 лет назад. Оффлайн
На сайте: 9 лет
Сообщения: 12
Да с этой прогой надо  поиграть на реальном столе.  
xRomul
xRomul
Пользователь оффлайн. Последний раз был на сайте 1 год назад. Оффлайн
На сайте: 9 лет
Сообщения: 102

--

в игре машина - человек фактор психологии уже как-то выпадает из описанной тобой гремучей смеси

--


Не согласен.. Обман в покере играет немаловажную роль.. Будь то чистый блеф, продолженная ставка, 3-бет с маргинальной рукой, сквиз, ну и т.д. Обман - это психология.. Написать алгоритм действий для эффективного обмана (эффективного распознавания обмана) еще надо умудриться.. Любое действие оппонента влечет за собой принятие решения, которое сводится к "верю" или "не верю"..  Так что никуда психология не денется.. 


--

Согласно никем не отмененному ЗБЧ, фактор удачи нивелируется

--


Да я не против.. Только не согласен.. Мы принимаем решения в каждой отдельно взятой раздаче, где удача, опять таки, имеет немаловажную роль.. А если повезет не нам.. И так несколько раз.. Банкрола может и не хватить, чтобы воспользоваться преимуществом дистанции..


--

Но оба оппонента имеют одинаковую информацию. Преимущество у того, кто лучше ее оценивает и использует

--


Опять не согласен.. Оба оппонента имеют разную информацию (карманные карты).. Оценивать информацию можно исключительно по ставкам оппонента.. Насколько достоверна такая информация?.. Невозможно играть оптимально, не зная карт соперника.. Преимущество будет у того, кто лучше умеет давать ложную информацию..

Bug
Bug
Пользователь оффлайн. Последний раз был на сайте 38 недель назад. Оффлайн
VIP пользовательНаграда: 1-е место в приватнике на BetfairНаграда: 1-е место в приватнике на FullTiltНаграда: 1-е место в приватнике на RedStarНаграда: 1-е место на Битве Форумов (OFC)Награда: Победитель двух приватников на PokerStarsНаграда: Победитель трех приватников на NoxwinНаграда: 1-е место в приватнике на 888poker
На сайте: 14 лет
Сообщения: 4502
Не забывайте, что речь идет о лимитном холдеме против двух оппонентов. Количество возможных вариантов развития событий ограничено и можно просчитать их ВСЕ, начиная с префлопа.
Vukin
Vukin
Пользователь оффлайн. Последний раз был на сайте 1 год назад. Оффлайн
VIP пользователь
На сайте: 9 лет
Сообщения: 4883
Bug сказал:
Vukin сказал:
Хорошие игроки обыграют эту программу, поэтому нельзя называть её непобедимой

Всегда забавляют такие утверждения. Оно на чем-то основано?

я же на писал хорошие игроки. Реально хорошие. Способные к многоуровневому мышление, которые найдут "противоядие", обведут машину вокруг пальца
akaz0
akaz0
Пользователь оффлайн. Последний раз был на сайте 5 лет назад. Оффлайн
На пользователя есть (или были недавно) претензии
На сайте: 11 лет
Сообщения: 1253
Vukin сказал:
Bug сказал:
Vukin сказал:
Хорошие игроки обыграют эту программу, поэтому нельзя называть её непобедимой

Всегда забавляют такие утверждения. Оно на чем-то основано?

я же на писал хорошие игроки. Реально хорошие. Способные к многоуровневому мышление, которые найдут "противоядие", обведут машину вокруг пальца

вокруг процессора немного поточнее2.gif
xRomul
xRomul
Пользователь оффлайн. Последний раз был на сайте 1 год назад. Оффлайн
На сайте: 9 лет
Сообщения: 102

Bug сказал:
Не забывайте, что речь идет о лимитном холдеме против двух оппонентов. Количество возможных вариантов развития событий ограничено и можно просчитать их ВСЕ, начиная с префлопа.


Увлекся.. :) Забыл, что речь идет о лимитном холдеме..

Все что писал до этого касается безлимитного холдема..


В лимитном холдеме точный расчет шансов таки принесет свои плоды..

И таки да, математика подвинет в сторону психологию..

Что касаемо удачи..

Мы все играем в покер, потому что верим в то, что на дистанции всем нам выпадет одинаковое количество хороших и плохих карт, попаданий во флоп, натсов и перездов  т.д. Все зависит от того, что мы будем с этим делать.. Получается удача и не важна как бы.. :) Однако не хотелось бы оказаться среди тех людей, которым достанутся много плохих раскладов в первой половине дистанции или при переходе на более высокий лимит.. :)

saniio
saniio
Пользователь оффлайн. Последний раз был на сайте 3 года назад. Оффлайн
VIP пользователь
На сайте: 12 лет
Сообщения: 3977
xxArturasxx, блеф против машины? В лимитный холдем? Хорошая шутка, надо запомнить. 
На основании каких телсов ты хочешь против нее блефовать?
saniio
saniio
Пользователь оффлайн. Последний раз был на сайте 3 года назад. Оффлайн
VIP пользователь
На сайте: 12 лет
Сообщения: 3977
xRomul теперь понятно, откуда такой ожесточенный спор.
Вообще, я так понимаю, речь идет скорее о математической модели на длиной дистанции. И поверь, с банкроллом там все ОК.
Ну и всем, кто наставает на блефе, как панацее игры против машины. Можете не сомневаться, алгоритм этот фактор тоже учитывает. Неужели вы думаете, что люди десятки лет профессионально занимающиеся теорией игр, настолько дилетанты. Блеф ведь тоже имеет свои закономерности.
Bug
Bug
Пользователь оффлайн. Последний раз был на сайте 38 недель назад. Оффлайн
VIP пользовательНаграда: 1-е место в приватнике на BetfairНаграда: 1-е место в приватнике на FullTiltНаграда: 1-е место в приватнике на RedStarНаграда: 1-е место на Битве Форумов (OFC)Награда: Победитель двух приватников на PokerStarsНаграда: Победитель трех приватников на NoxwinНаграда: 1-е место в приватнике на 888poker
На сайте: 14 лет
Сообщения: 4502
Сегодняшняя новость.
============

Канадским ученым удалось написать компьютерную программу, способную на слабое решение самой популярной разновидности покера — техасского холдема (с лимитированными ставками). Иными словами, компьютер смог создать стратегию игры, настолько близкую к оптимальной, что никакой человек не способен обыграть его (со статистическим уровнем значимости) за всю свою жизнь. О программе, получившей название Cepheus («Цефей») сообщается в журнале Science.

Покер, как и другие карточные игры, относится к играм с неполной информацией — где участники обладают скрытым от остальных знанием о своих картах, а также могут использовать это знание в свою пользу (например, блефовать). Если в играх с полной информацией (например, шахматах, где оба игрока видят положение всех фигур на доске) искусственный интеллект или обыгрывает человека, или как минимум добился паритета с ним, то над покером программисты безуспешно бились с 2006 года (когда прошел первый ежегодный чемпионат по этой игре среди компьютеров).

Метод Майкла Боулинга (Michael Bowling) и его коллег основывается на принципе counterfactual regret minimization. Алгоритм реализуется на распределенных вычислительных узлах за счет того, что игра разбивается на отдельные фрагменты (около 110 тысяч), согласно доступной информации (знанию об открытых картах и прошлых ходах игроков). Кроме того, специальные техники сжатия данных обеспечивали хранение фрагментов партии на локальных дисках и возврат их в память системы для расчетов. Всего использовалось 200 вычислительных узлов (24 2,1-гигагерцовых процессора AMD, 32 гигабайта оперативной памяти, 1-терабайтный жесткий диск в каждом), а вычисления заняли в общей сложности 68 с половиной суток. За это время Cepheus провел сам с собой несколько миллиардов партий, таким образом набрав необходимый опыт игры.

Практическое преимущество новой техники в том, что ученые снизили требования к ней: не найти точное равновесие, а гарантировать лишь, что при присущей человеку скорости игры противник не сможет выиграть за всю свою жизнь. Для большинства практических приложений этого вполне достаточно. Новый алгоритм обещает найти применение всюду, где имеет место неопределенность и дефицит информации: в сфере бизнеса (модели торгов и переговоров), в медицине (разработка планов борьбы с эпидемиями) и в сфере компьютерной безопасности.

Узнать больше о Cepheus и сыграть с ним партию можно на сайте Университета Альберты.
=============

chizh
chizh
Пользователь оффлайн. Последний раз был на сайте 3 года назад. Оффлайн
На сайте: 13 лет
Сообщения: 224
xxArturasxx сказал:
Сомневаюсь,что кто то будет жертвовать своим временем,чтоб сыграть против нее нн-ое колличество рук и проверить обоснованность таких заявлений.
А бабки ученым получать надо. Вот они и трындят все что попало. О динозаврах,звездах и т.д. Теперь вот прога,которую проверить не возможно.



Пра покер сагласен, пра астальное не савсем. Тем не менее действительна чтобы даказать результат нужна привлеть нескалька тысяч успешных играков и заставить их гриндить с  ИИ в течении хатябы года, вот тагда будет результат. Но самае главнае мне не панятна как ИИ будет баротса с блефам играков и как себя будет вести в таких дисцеплинах например как зум, других играх : амаху, трипл-дро или стад, не гаваря уже а мтт.
Floret
Floret
Пользователь оффлайн. Последний раз был на сайте 8 лет назад. Оффлайн
На пользователя есть (или были недавно) претензии
На сайте: 11 лет
Сообщения: 380
- Доктор, у меня рак!
- Сейчас, погодите, спросим у Цефея, как нам вас лечить.
- Чихк-брык-бдыщ-пых.
- ???
- Он говорит, что вам нужно сдаваться в 86.7% случаев.
Кричалка наверх