Зарегистрируйтесь или войдите, чтобы получать билеты на фрироллы Info

Понимание игровой теории (перевод)

1
Foolosopher
VIP пользовательДобрый модератор сайта - волонтерНаграда: 1-е место в оффлайн приватнике UAPOKERНаграда: Лучший блогер"Серебро" в рейтинге игроков за 2011 г.Победитель турнира для модераторовЛидер квартального рейтинга UAPOKERЗаслуженный медалист. Кликните для просмотра

Всем доброго времени суток! Предлагаю вашему вниманию еще один перевод. За статью спасибо нашему форумчанину ShevaDimon 


Хочу сразу же уточнить несколько терминов - в статье используются прилагательные в активном и пассивном залоге, к примеру, "использующий" и "используемый". Так что слова "эксплуатационный" и "эксплуатируемый" обозначают именно активное действие того, кто эксплуатирует, или использует, помарки в игре оппонента, и пассивное действие "эксплуатируемого" игрока. 


Снова повторюсь, что тот факт, что я что-то перевел, не означает, что я со всем согласен 



Понимание игровой теории как ключ к пониманию сути холдема


Теория игры в холдем стала популярной и в то же время несколько превратно понимаемой темой для обсуждений. Целью данной статьи является дать вам фундаментальное представление о том, какова оптимальная стратегия игры с точки зрения игровой теории, как она работает и как влияет на игру в холдем. До того, как мы перейдем к самой статье, мы остановимся на нескольких ключевых определениях. Данные определения не всегда будут совпадать с определениями, используемыеми другими авторами.


Оптимальная эксплуатационная стратегия: стратегия, которая дает вам максимально возможное EV против стратегии вашего оппонента. Например, если в игре камень-ножницы-бумага стратегия вашего оппонента – каждый раз выбирать камень, то вашей оптимальной эксплуатационной стратегией будет каждый раз выбирать бумагу. То же самое справедливо и для случая, когда стратегия вашего оппонента – 50% камень, 25% бумага и 25% ножницы.


Суб-оптимальная стратегия: стратегия, которая работает хуже оптимальной эксплуатационной стратегии. Например, если стратегия вашего оппонента – каждый раз выбирать камень, то в том случае, если вы в 50% случаев выбираете бумагу, а в 50% - камень, вы все равно следуете выигрышной стратегии. EV стратегии бумага-и-камень, конечно, ниже, чем стратегия использования исключительно бумаги. Таким образом, стратегия бумага-и-камень является суб-оптимальной.


Оптимальная теория игры (GTO): стратегия, которая дает вам максимально возможное EV (или, другими словами, “является оптимальной”), если ваш оппонент всегда использует против вас лучшую контр-стратегию. В игре камень-ножницы-бумага стратегия GTO состоит в том, чтобы сделать выбор случайным образом между равным образом распределенными бумагой, ножницами и камнями. Если вы используете камень меньше, чем бумагу, ваше эквити будет меньше ? против стратегии «только ножницы». Отсюда следует, что вы должны использовать бумагу по крайней мере так же часто, как ножницы, а ножницы так же часто, как камень. В результате вы должны использовать в игре бумагу, ножницы и камни с одинаковой частотой для того, чтобы обеспечить себе ? эквити против всех стратегий. Пока ваг оппонент продолжает выбирать оптимальную контр-стратегию в ответ на любую стратегию, которую вы используете, никакая из ваших стратегий не может иметь большее EV, чем эта.


Стратегия эксплуатации: любая стратегия, EV которой выше, чем у стратегии GTO против определенного оппонента.


Эксплуатируемая стратегия: стратегия, EV которой ниже против некоторых стратегий эксплуатации по сравнению со стратегией GTO. Все не-GTO стратегии являются эксплуатируемыми.


Когда мы анализируем оптимальные стратегии, стратегии эксплуатации, мы рассматриваем стратегию оппонента как известную нам. Например: “мой оппонент всегда выбирает камень.” В реальности стратегия нашего оппонента неизвестна, и мы часто действуем на основании предположений и наблюдений, чтобы определить, что именно мы будет считать стратегией нашего оппонента. Чтобы определить стратегию GTO, мы должны предположить, что наш оппонент всегда выбирает оптимальную стратегию эксплуатации для противодействия любой стратегии, которую мы можем использовать, а не играет при помощи какой-то одной, строго определенной стратегии.


Холдем является намного более сложной игрой, чем камень-ножницы-бумага, и в ней никто не захочет играть против оппонента, который всегда пользуется стратегией GTO (или же “неэксплуатируемой”) стратегией. Это важный момент, так как стратегия GTO не обязательно является стратегией с самым высоким EV. Например, если стратегией нашего оппонента является «только камень», то в таком случае стратегия GTO, предполагающая случайный выбор из бумаги, ножниц и камня, имеет меньше EV, чем стратегия «только бумага».


Игра GTO оказывает большое влияние на стратегию игры в холдем. Даже с учетом того, что у стратегии GTO EV может быть меньше, чем у эксплуатационной стратегии, понимание того, что представляет из себя стратегия GTO и способность распознать, насколько сильно отклоняется от нее стратегия ваших оппонентов может помочь вам лучше использовать слабости ваших оппонентов. Кроме того, понимание стратегии GTO также может помочь вам в создании сбалансированных стратегий игры, эксплуатировать которые вашим противникам будет сложно. Данные стратегии могут использоваться в качестве защиты против сильных оппонентов, которые ищут в вашей игре зацепку, которую можно было бы использовать.


В холдеме, как и во многих более простых играх, таких, как камень-ножницы-бумага, стратегия GTO часто идентифицируется путем нахождения «точки неопределенности». Это означает, что благодаря использованию стратегии GTO ваши действия будут настолько разнообразны, что вашему оппоненту будет безразлично, какое из двух действий выбрать, то есть сразу решиться он не сможет. В результате ваша стратегия будет неэксплуатируемой.


Хотя модель холдема и не была полностью решена, были решены модели многих мини-игр, которые моделируют реальные ситуации из холдема и используют как полные, так и неполные варианты игры. Поняв, где находятся «точки неопределенности» в различных сценариях игры в холдем, вы сможете идентифицировать отклонения игры вашего оппонента от стратегии GTO и воспользоваться этим по максимуму. На базовом уровне холдем остается очень простой игрой: мы играем не с использованием вариантов камень-ножницы-бумага, а с чередованием вариантов «блеф» и «не блеф». Поняв принцип работы самых простых мини-игр, вы сможете значительно улучшить свою игру.


Простым примером неполного варианта игры будет игра, в которой у нас сразу есть руки, которые либо сразу выигрывают, либо сразу проигрывают, когда мы доходим до шоудауна. Мы можем сделать либо ставку, либо чек, а наш оппонент может сделать только колл или фолд. Если он делает колл, происходит шоудаун. Часто аналогичный сценарий происходит в реальном игре в холдем на ривере, когда диапазон рук нашего оппонента достаточно узок, а наш полярен. Разобравшись в модели мини-игры, мы сможем увидеть, что стратегия GTO состоит в том, чтобы блефовать на сумму, пропорциональную той, в которую мы оцениваем «цену» колла нашего оппонента. Например, если мы ставим $1 в банк $2, пропорция ставки составит 3:1, а стратегия GTO состоит в том, чтобы блефовать в 25% случаев, когда мы делаем ставки. Нашему оппоненту будет «безразлично», колить или фолдить. В результате мы увидим, что в том случае, если мы отклонимся от этой стратегии, наш оппонент сможет этим воспользоваться, либо колируя, когда мы будем больше блефовать, либо всегда всегда пасуя, если мы будем блефовать меньше.


В то же время, в данном сценарии соотношение банка к размеру нашего блефа 2:1, и поэтому нам «безразлично», делать ли ставку или чекать с нашим блефом, если оппонент колирует в 67% случаев. Это стратегия GTO нашего оппонента. Если же оппонент отклоняется от этой стратегии, мы можем «эксплуатировать» его, всегда блефуя, если он коллирует реже, или никогда не блефуя, если он коллирует больше.


Если наш оппонент отклоняется от стратегии GTO в предыдущем примере, у оптимальной эксплуатационной стратегии, заключающейся в том, чтобы всегда фолдить или всегда блефовать, EV будет выше, чем у любой эксплуатационной стратегии, которая предполагает блефы или фолды менее, чем в 100% случаев. Слабые оппоненты являются таковыми не только потому, что они выбирают для игры эксплуатируемые стратегии, но также и потому, что в игре мы можем прибегать к значительным отклонениям от точек неопределенности, а они не могут приспособится к этому, чтобы эксплуатировать недостатки нашей игры.


Не все решения GTO сводятся к тому, чтобы найти точку неопределенности. Например, предположим, что мы играем в вариант игры камень-ножницы-бумага, в которой есть четвертый вариант выбора — динамит, который побеждает все остальные. Стратегия GTO — всегда выбирать динамит. Но у вашего оппонента остается возможность выбора доминируемой стратегии, а именно выбор между бумагой, ножницами или камнем. Похожие ситуации случаются и в холдеме, например, тогда, когда натсы составляют настолько большую долю наших рук, что мы просто не можем блефовать достаточно часто дял того, чтобы нашему оппоненту было «безразлично», делать колл или фолд.


Это значит, что стратегию GTO эксплуатировать, конечно, нельзя, и она никогда не может быть проигрышной стратегией в холдеме (если нет рейка), но в то же время ваши оппонеты могут принимать решения в рамках своей доминируемой стратегии, которые могут привести их к поражению, а вас к победе. Таким образом, стратегии GTO часто будут суб-оптимальны, но все же возможности, которые открывают эти «неуязвимые стратегии» будут очень привлекательны для думающих игроков, анализирующих игровую теорию, особенно на высоких уровнях игры.


Сильный оппонент силен только потому, что он или она принимает намного меньше суб-оптимальных стратегических решений, чем слабый игрок. У самых сильных игроков чрезвычайно развита способность «чувствовать» игру в динамике. Если вы выбираете стратегию «только камень», он ли она быстро распознает ее и станет использовать стратегию «только бумага» и так далее. Такие игроки быстро идентифицируют основные особенности вашей игры и могут прибегнуть к упреждающим контр-мерам против вашей игры, что может дать им возможность эксплуатировать ваши не-GTO стратегии с пугающей частотой и точностью.


Нам хотелось бы думать, что, выбирая стратегии GTO, наши оппоненты могут только проигрывать. Тем не менее, даже самые сильные оппоненты используют в своей игре стратегии эксплуатации (которые потенциально могут стать эксплуатируемыми стратегиями), а холдем в любой случае был и остается игрой с неполной информацией. Если вы играете против очень сильного оппонента, который, как вам известно, использует стратегию, аналогичную 33% бумаги, 20% ножниц и 47% камня, то будет просто глупо прибегать против него к стратегии «только бумага». Так как ваш оппонент силен, то он по определению быстро адаптируется и начнет эксплуатировать вас. Но вы все же можете играть «эксплуатирующе», если поймете, где находятся точки неопределенности, и начав делать отклонения от них. Даже самые сильные «акулы» - не ясновидящие, и если вы прибегнете к эксплуатирующей стратегии 40; бумаги, 30% ножниц и 30% камня, как они могут догадаться об этом?


Авторы:  Брюс Парадис и Дуглас Зар

Оригинал: http://forumserver.twoplustwo.com/94/stoxpoker-com/understanding-game-th...



Если кому-то попадется интересная статья, отрывок из книги, видео - присылайте мне, переведу в свободное время. 

28
reimm
reimm, Август 27, 2012 - 19:02.
0
Прочитал,есть над чем подумать!!!!!!!

cooler
cooler, Январь 7, 2012 - 14:47.
0
спасибо за информацию.. мне как новичку было интересно прочитать -
да именно почитать, т.к. на практике не могу еще применить
нужно обдумать

ve4a
ve4a, Декабрь 13, 2011 - 23:48.
0
Спс

mao
mao, Сентябрь 8, 2011 - 11:28.
0
Награда: 1-е место в приватнике на PokerStars
Спасибо за интересный матерьял. Чуть доступеней бьы.

Осталось только не забыть это все помножить на практику и тогда получим некий навык.

ДО ФЛОПА ВСЕ РАВНЫ И ЧЕРТ И БОГ. А ВОТ У ПРОРОКА ПРИИМУЩЕСВО,

icefr
icefr, Сентябрь 8, 2011 - 11:23.
0
VIP пользовательНаграда: 1-е место на нашем приватном турниреНаграда: Победитель двух приватников на NoxwinНаграда: Победитель трех приватников на BetfairНаграда: 1-е место в приватнике на 888poker
Спасибо за друг.
 А целом, если очень грубо оценить, то суть сводиться к давно известному факту, надо играть " от опоннета", так сказать "против стола".

Oksana87
Oksana87, Сентябрь 7, 2011 - 17:27.
0
VIP пользовательНаграда: 1-е место в приватнике на BluffRoomНаграда: 1-е место в приватнике на RedStar
интересная статья

Tolian222
Tolian222, Сентябрь 7, 2011 - 16:46.
0
Победитель экспериментального турнираПобедитель трех приватников на 888poker
Статья отличная,попробуй следующий раз отредактировать и сократить,что бы смысл легче дошел,по крайней мере как сам видишь ситуацию,а кому полность надо ты ссылку даешь.

Александр
Александр, Сентябрь 7, 2011 - 12:49.
0
Всезнающий и всемогущий админ сайта
Спасибо, Леша! Отличный материал.  Жаль вчера не заметил, можно было в рассылке упомянуть.

DanShu222
DanShu222, Сентябрь 7, 2011 - 09:20.
0
Награда: 1-е место в приватнике на PokerStarsНаграда: Победитель двух приватников на RedStarНаграда: Победитель трех приватников на BetfairЧемпион UAPOKER 2009 в HEADS-UP
фуууууух, еле осилил, но прочитал до конца.... такое в башке должно быть ... спасибо за труд...

madevgenii
madevgenii, Сентябрь 7, 2011 - 07:45.
0
VIP пользовательНаграда: 1-е место в приватнике на BluffRoomНаграда: Победитель двух приватников по Omaha,  PSНаграда: Победитель трех приватников на FullTiltНаграда: Победитель четырех приватников на PokerStПобедитель экспериментального турнираНаграда: 1-е место в приватнике на TitanПобедитель двух приватников на 888pokerПобедитель шести приватников на Betfair
 более приземлённо-бумага это фолд а камень рейз?

volodiabond
volodiabond, Сентябрь 7, 2011 - 07:13.
0
VIP пользовательДобрый модератор сайта - волонтерПобедитель турнира для модераторовЗаслуженный медалист. Кликните для просмотра
Спасибо!!!

engener
engener, Сентябрь 7, 2011 - 00:00.
0
Награда: 1-е место в приватнике на FullTiltНаграда: 1-е место в приватнике на WilliamHill
Спасибо почитаю на досуге

VitalicS
VitalicS, Сентябрь 6, 2011 - 23:27.
0
VIP пользовательДобрый модератор сайта - волонтерЗаслуженный медалист. Кликните для просмотра
Т.е., смысл не только хорошо играть, но играть так, чтобы твою стратегию не смог эксплуатировать оппонент!
Спасибо за статью - она отличная! Хоть и немного сложно написанная Но если вдуматься, то открывается много интересного!

ShevaDimon
ShevaDimon, Сентябрь 6, 2011 - 23:23.
0
Награда: Победитель двух приватников на Noxwin
Спасибо за перевод,а то я пробежал глазами её в английском варианте и запуталсяОказывается правильно запутался,хотя сама по себе статья это азы покера.

mamamio57
mamamio57, Сентябрь 6, 2011 - 20:48.
0
VIP пользовательЗа победу в турнире прогнозовПобедитель трех приватников по Omaha на PS
Не боюсь сказать-все это есть фуфло! В онлайне есть только знание алгоритма программы того или иного рума!

icefr
icefr, Сентябрь 8, 2011 - 11:22.
0
VIP пользовательНаграда: 1-е место на нашем приватном турниреНаграда: Победитель двух приватников на NoxwinНаграда: Победитель трех приватников на BetfairНаграда: 1-е место в приватнике на 888poker
И много алгоритмов Вы знаете?

mao
mao, Сентябрь 8, 2011 - 11:35.
0
Награда: 1-е место в приватнике на PokerStars
ПОЛНОСТЬЮ С ТОБОЙ СОГЛАСЕН.
АГА ОСОБЕНО У ДИЛЕРА "ЖАНЫ" или "ЭДУАРДА" КАКОЙ АЛГОРИТМ ЗАМЕСА КАРТ В РУЧНУЮ.

КОГДА ОН или ОНА тебе неприятны, когда достают и выкладывают на РИВЕР тебе С.М.Е.Р.Т.Ь.

REBAY PLZ

sot956
sot956, Сентябрь 6, 2011 - 18:24.
0
VIP пользователь1-е место в приватном фриролле на Titan PokerПобедитель Honey фриролла

Ваши переводы-это всегда клёво !

+++++


16декабря
888 Poker888pokerБездеп $88
partypokerpartypokerFree $20
VbetVbetЧипроллы от 5¢
UnibetUnibetБездеп €2
RedStar PokerRedStar30% кешбек
Новые комментарии
  • 2 минуты 18 секунд от Bug
  • 3 минуты 1 секунда от Sheriff
  • 7 минут 31 секунда от alneal
  • 10 минут 56 секунд от alneal
  • 15 минут 47 секунд от Bug
  • 18 минут 18 секунд от Sheriff
  • 29 минут 21 секунда от Pastar
  • 39 минут 42 секунды от Sheriff
  • 1 час 9 минут от lsv78
  • 2 часа 57 минут от ОstapBender
  • 4 часа 37 минут от topgoa
  • 7 часов 6 минут от mamamio57
  • Пароли на фрироллы
  • в 22-05 Киев, Декабрь 15, 2017
  • в 23-30msk, Декабрь 15, 2017
  • в 22:15, Декабрь 15, 2017
  • в 21-03, Декабрь 15, 2017
  • в 21-30msk, Декабрь 15, 2017
  • в 20-30msk, Декабрь 15, 2017
  • в 21.00 MSK, Декабрь 17, 2017
  • в 23-00msk, Декабрь 14, 2017
  • в 20-00 москва, Декабрь 14, 2017
  • в 22:15, Декабрь 14, 2017
  • Кричалка наверх