Вопрос О Расчете Стратегии (Из Книги Билла Чена «Математика Покера»)

  • Автор темы Mama7
  • Обновлено
  • 21, Oct 2024
  • #1

У меня вопрос по поводу примера из книги Математика покера Чена и Анкенмана. Там на стр. 48 он дает

Пример 4.1 Два игрока играют в хедз-ап-лимитный покер на ривере. У игрока А либо натс (20% случаев), либо бесценная (или мертвая) рука (80% случаев), а у игрока Б есть рука посредственного достоинства – достаточная, чтобы побить мертвые руки, но которая проигрывает орехи. В банке четыре большие ставки, первой стоит А. Давайте сначала рассмотрим, что произойдет, если А сделает чек. B мог бы сделать ставку, но A точно знает, когда он побил B или нет; следовательно, он поднимет B с натсовыми руками и сбросит, по крайней мере, большую часть своих блефующих рук. B не может получить вэлью, делая ставку; поэтому он проверит. В результате игрок А поставит все свои натсовые руки. А также может поставить некоторые из своих мертвых рук в качестве блефа; если B сбросит карты, A может получить весь банк.

Мы будем называть процент от общего числа рук, с которыми А блефует с x. Выбор А игроком x является выбором его стратегии. Игрок B теряет одну ставку за колл, когда у А натсовая рука, и выигрывает пять ставок (четыре в банке плюс ту, которую А блефовал), когда у А блеф. Стратегия колла игрока B применяется только тогда, когда игрок A делает ставку, поэтому приведенные ниже значения вероятности зависят от ставки A. Ожидание руки игрока B, если он уравняет:

[B, колл] = P(У А натс)(-1) + P(У А блеф)(+5)

[B, вызов] = (0,2)(-1) + 5x

[Б, колл] = 5х - 0,2

Если B сбросит карты, его ожидание будет просто нулевым.

[B, сложить] = 0

Примечание: [B,call] обозначает ожидание, если B решит сделать колл, а также [B,fold], если он решит сбросить карты.

Я думаю, что этот анализ неверен, согласно предложению "поэтому приведенные ниже значения вероятности зависят от ставки А«Вместо этого нам следует использовать условные вероятности.

Предположим, что в 20% случаев у игрока натс, в x*100% случаев он блефует, а в остальное время он просто чекает. Тогда вероятность того, что у него натс, если он сделает ставку, равна

P(A имеет натс | Ставка A) = P(A имеет натс и A делает ставку) / P(A ставит)

= (0,2 * 1) / (0,2 + х)

  • и, соответственно, вероятность того, что он блефует, если делает ставку, равна
  • P(А блефует | А делает ставку) = P(У А мертвая рука и А делает ставку) / P(А делает ставку) = x / (0,2+x)
  • где
  • P(A имеет натс и A делает ставку) = 0,2

P(У А мертвая рука и А делает ставку) = x

P(А имеет мертвую руку и А делает чек) = 1 - (0,2+x)

P(ставка A) = 0,2 + x

так что правильное выражение для вызова B должно быть

[B, колл] = P(А имеет натс | А делает ставку) * (-1) + P(А блефует | А делает ставку) * 5

[B, колл] = - 0,2/(0,2+x) + 5x/(0,2+x)

Mama7


Рег
05 Sep, 2007

Тем
75

Постов
191

Баллов
606
  • 25, Oct 2024
  • #2

Я только что прочитал этот раздел книги и был удивлен описанной здесь ошибкой. Согласен с анализом Стефана.

Хотя это правда, что для решения 5x - 0,2 = 0 важен расчет - коллировать или сбросить карты, он, конечно, не определяет ожидание.

График на странице 49 также неверен. Если, например, А блефует в 10% случаев, то у Б есть положительное ожидание 1-бета, а не 0,3:

Стратегия А: 70% проверок; 20% ставок с натсом; 10% блефов. Таким образом, в 2/3 случаев (20% из 30%) при ставке у А есть натс, а Б теряет одну ставку (если коллирует); другая 1/3 B получает 5 ставок. Итак, EV равно (2/3 * -1) + (1/3 * 5) = 1.

И, конечно же, если он никогда не блефует, каждый раз, когда Б уравнивает, он теряет одну ставку, а не 0,2!

Довольно загадочная ошибка, тем более что она была запечатлена на графике!

 

Райхан Раинбакова


Рег
13 Apr, 2020

Тем
66

Постов
232

Баллов
582
  • 25, Oct 2024
  • #3

Я боролся над тем же примером по той же причине.

Пусть P(A) = Prob A имеет орехи = 0,2,

 
 
       x > 0.05
 

Тогда P(A|B) = [P(A)P(B|A)]/[P(A)P(B|A)+P(A')P(B|A')] = (0,2* 1)/(0,2*1 + 0,8х)

и P(A'|B) = [P(A')P(B|A')]/[P(A)P(B|A)+P(A')P(B|A')] = (0,8x)/(0,8x + 0,2*1)

итак = P(A|B)(-1) + P(A'|B)(5) = (4x)/(8x + 0,2) - 0,2/(0,8x + 0,2)

= (4x - 0.2)/(0.8x + 0.2)

Следовательно, 4x - 0,2 > 0

P(A') = Prob A has dead hand = 0.8, P(B) = Prob A bets, P(A'|B) = Prob A has dead hand given A bets P(A|B) = Prob A has nuts given A bets

Этот ответ очень близок к ответу 0,04, приведенному в книге, но не совсем к нему. Может ли кто-нибудь объяснить, почему это так, или, возможно, это подтверждение того, что написанное в книге не так математически строго, как могло бы быть?

 

Михаил Вен. Чер


Рег
02 Oct, 2006

Тем
72

Постов
205

Баллов
575
  • 25, Oct 2024
  • #4

Книга правильная. Вы не указали нам ожидаемую ценность, учитывая ставку А. Для этого вам понадобится следующая формула:

[B, колл] = (P(А имеет натс | А делает ставку) * (-1) + P(А блефует | А делает ставку) * 5) * P(А делает ставку)

Распределите ставки P(A) и подумайте о каждом члене в отдельности. Это дает вам истинное ожидание:

[B, колл] = P(А имеет натс | А делает ставку) * P(А делает ставку) * (-1) + P(А блефует | А делает ставку) * P(А делает ставку) * 5

Надеемся, что, глядя на это таким образом, будет легче понять.

 

Вад12242арни


Рег
17 Mar, 2014

Тем
76

Постов
180

Баллов
590
  • 25, Oct 2024
  • #5

Я почти уверен, что ваши расчеты верны и полученная вами формула математически более точна, чем книги.

Однако это не обязательно означает, что книга неверна. Я полагаю, что они просто хотели объяснить ситуацию, не вводя понятия условных вероятностей, и составили свое объяснение так:

Стратегия колла игрока B применяется только тогда, когда игрок A делает ставку, поэтому приведенные ниже значения вероятности зависят от ставки A.

поэтому им не нужно будет заниматься более сложной математикой. Как я отметил в своем комментарии, обе формулы приводят к одному и тому же логическому выводу - если x>4%, B должен коллировать.

 

DonaldRes


Рег
18 Jun, 2014

Тем
71

Постов
207

Баллов
582
  • 25, Oct 2024
  • #6

Я думаю, что у меня есть это:

Формула, используемая в книге, ДОЛЖНА предполагать, что игрок А еще НЕ сделал ставку, что, я думаю, не совсем ясно отражено в книге. Я не думаю, что это было задумано, поскольку в книге ясно сказано, что ожидаемое значение колла игрока B зависит от того, что игрок A уже сделал ставку, и в этом случае книга неверна.

Это дает нам < B,call > = P(A И B)(-1) + Р(А' И В)(5)

= 0,2*(-1) + 5x

Поэтому я думаю, что книга неверна на том основании, что в этой формуле не используется условная вероятность.

 

Igobak


Рег
13 Feb, 2008

Тем
68

Постов
203

Баллов
543
  • 25, Oct 2024
  • #7

«Математика покера» лучше подходит для динамического программирования. Это похоже на то, как будто вы подносите пиковый туз прямо к глазу, чтобы попытаться увидеть масть... вам НЕ нужно подходить так близко к карте. Если вы хотите утомить свой мозг во время игры в покер, отличная книга :)

 

Tisbus


Рег
12 Nov, 2019

Тем
67

Постов
182

Баллов
517
Тем
403,760
Комментарии
400,028
Опыт
2,418,908

Интересно