Смастерим симулятор

korovin · 31.08.2006, 14:54

Цитата:

Сообщение от Цитата:

В теории игр смешанными стратегиями называют применения нескольких чистых стратегий, чередующихся по случайному закону с определенным соотношением частот.

Вижу что плаваю в предмете обсуждения, посему "отваливаю".

Sharky · 31.08.2006, 15:03

Цитата:

Сообщение от tigra писал чт, 31 августа 2006 13:51

Это да, а что такое чистая стратегия?

Оптимальная стратегия по принципу минимакса.

Grey · 31.08.2006, 15:11

Цитата:

Сообщение от Korovin писал

Ну а если под данные подогнать и масть карты, то любую стратегию с нашей точки зрения можно считать чистой а с точки зрения оппонентов - смешаной?

С таким же успехом можно подогнать подбрасывание монетки или взгляд на часы (четное/нечетное число секунд и т.п.). Ну а масти тут можно использовать лишь постольку, поскольку они подходят под оптимальное соотношение стратегий 1/4. А оптимально ли оно? А если оптимальное 2/7, что тогда делать?

Grey · 31.08.2006, 15:13

Цитата:

Сообщение от Sharky писал

Цитата:

Сообщение от tigra писал

Это да, а что такое чистая стратегия?

Оптимальная стратегия по принципу минимакса.

Sharky, бросай пить. До вечера еще далеко, а ты уже лыка не вяжешь

tigra_7 · 31.08.2006, 15:23

Ну, насколко я знаю, точнее помню, точнее сейчас читаю , оптимальной стратегии по принципу минимакса может и не быть.
Сейчас промотриваю свои старые лекции по теории игр, всё оказывается не так уж и просто. (Ушёл дальше читать)

CorwinXX · 31.08.2006, 17:09

Цитата:

Сообщение от Это Я писал ср, 30 августа 2006 20:42

либо всегда с Q reise либо никогда, и нет никакой вероятности!

У оппонента есть 2 "чистые" стратегии - всегда кол и всегда фолд.

У нас есть 2 чистые стратегии - с дамой всегда чек и с дамой всегда бет (с тузом всегда бет в обеих стратегиях).

1. Если мы используем "с дамой всегда чек", то оппонент будет использовать "всегда фолд". МО = 0.

2. Если мы используем "с дамой всегда бет", то оппонент будет использовать "всегда кол". МО = 0.

3. Если мы используем "с дамой бет с вероятностью х".
3.1. Оппонент использует "всегда фолд"
МО = 0.5 * $1 + 0.5 * х * $1 - 0.5 * (1 - х) * $1 = х * $1

3.2. Оппонент использует "всегда кол"
МО = 0.5 * $3 - 0.5 * х * $3 - 0.5 * (1 - х) * $1 = (1 - 2х) * $1

При х = 1/3 МО нашей стратегии $1/3 > 0. (Независимо от стратегии, используемой оппонентом).

Ответ:
Оптимальная стратегия - с тузом всегда ставить, с дамой ставить в 1/3 случаев.

Это Я · 31.08.2006, 17:18

Придумали игру с МО=0,5 при хаотичной стратегии и радуются, что выигрывают эти 0,5. Давайте изменим правила - введем рейк 0,55 (для простоты за каждый хенд). Какая теперь стратегия. Полная аналогия с клубным покером.
Если противник умный, постоянно меняет стратегию (аналогия довольно таки продвинутый бот в покере), лучшая стратегия не играть в эту игру т.к. мы не можем побить рейк.
Если противник рыба, играет по одной стратегии, то нужно играть по приведенному мной выше алгоритму.

И правильное решение всегда одно. Это как погоня щуки за карасем. Карась убегает хаотично, а щука тоже меняет постоянно направление, но осознанно. Итог вы знаете…

CorwinXX · 31.08.2006, 17:29

Цитата:

Сообщение от Korovin писал чт, 31 августа 2006 14:24

Осмелюсь предположить что при такой формулировке чистая стретегия игры в клубный покер сильно уступает смешаной по доходности (если вообще бъет рейк).

Большинство народа в покере использует чистые стратегии. Яркий пример этого - префлоп таблицы.
Слабые игроки делают ставку на префлопе в зависимости от карты, позиции, ставок перед нами и количества игроков в банке.
Сильные игроки добавляют к входным данным параметры игроков (и сделавших ставки перед нами, и тех, кто сидит за нами и ещё не сделал свою ставку). Но это всё равно "чистая" стратегия (ход определяется набором входных данных). Хотя она более сложная и её не уместить в префлоп-таблицу, но фактически эту "таблицу" (или можно сказать "алгоритм")) игрок держит в голове.

На флопе и дальше в принципе то же самое. Только из-за большого количества разветвлений алгоритм сложно оформить в виде таблицы.

korovin · 31.08.2006, 17:34

Цитата:

Сообщение от Цитата:

3.2. Оппонент использует "всегда кол"
МО = 0.5 * $3 - 0.5 * х * $3 - 0.5 * (1 - х) * $1 = (1 - 2х) * $1

МО = 0.5 * $3 - 0.5 * х * $3 - 0.5 * (1 - х) * $1 = (1 - х) * $1

Средняяя школа, 3-й класс

CorwinXX · 31.08.2006, 17:36

Это Я
Знаешь, в чём польза использования ГСЧ в покерной стратегии?
Если с АА ты всегда даёшь рейз на префлопе, то в случае кола я могу быть уверен, что у тебя не АА.
Если с натсовым флеш-дро ты всегда делаешь бет на флопе, то в случае чека я могу быть уверен, что у тебя нет натсового флеш-дро.
Ну и так далее.

Это Я · 31.08.2006, 17:46

Цитата:

Сообщение от CorwinXX писал чт, 31 августа 2006 17:36

Это Я
Знаешь, в чём польза использования ГСЧ в покерной стратегии?
Если с АА ты всегда даёшь рейз на префлопе, то в случае кола я могу быть уверен, что у тебя не АА.
Если с натсовым флеш-дро ты всегда делаешь бет на флопе, то в случае чека я могу быть уверен, что у тебя нет натсового флеш-дро.
Ну и так далее.

Когда ты даешь понять, что ты это знаешь, я начинаю этим пользоваться и с АА не raise, это же не случайная стратегия.

CorwinXX · 31.08.2006, 17:51

Цитата:

Сообщение от Это Я писал чт, 31 августа 2006 17:18

Придумали игру с МО=0,5 при хаотичной стратегии и радуются, что выигрывают эти 0,5.

Этой задачкой я хотел продемонстрировать один важный принцип.

Предположим, что оппонент знает нашу стратегию. (Чтобы её вычислить, достаточно собрать на нас большую статистику). Тогда он может точно вычислить диапозон наших рук, в зависимости от нашей заявки. В зависимости от диапазона рук, он может посчитать МО своего рейза/кола/фолда.

Пример 1.
МО кола = -0.15, МО фолда = 0. Он выбирает фолд.
Нам выгодно чуть-чуть расширить диапазон нашей заявки. При этом для оппонента возрастёт МО кола. Но если оно останется меньше нуля, то он всё равно будет выбирать фолд. Но так как мы расширили диапазон, то это будет происходить чаще (то есть, мы будем выигрывать чаще).

Пример 2.
МО кола = 0.10, МО рейза = 0.20. Он выбирает рейз.
Если это возможно, то нам нужно изменить диапазон нашей заявки таким образом, чтобы для оппонента МО кола стало 0.15 и МО рейза стало 0.15. Тогда его ставка станет менее выгодной для него, а значит более выгодной для нас.

Например, если мы добавим к нашей заявке KQo, то МО поменяются слишком сильно (сильнее, чем нам хотелось бы). Тогда мы поступаем очень просто - добавляем "половину" KQo. То есть, с KQo мы 50% рейз, 50% фолд. Цель достигнута.

з.ы. Все примеры условные. Не надо к ним придираться

.

tigra_7 · 31.08.2006, 17:51

На самом деле это нельзя назвать оптимальной стратегией. В общем я посчитал, вроде правильно, хотя вечером, когда время поболе будет проверю. Пусть мы утраиваем с вероятностью q, а опп нас вскрывает с вероятностью p. Тогда при Вашей стратегии МО будет (p+1)/3. То есть колебаться от 1/3 до 2/3. Вообще, МО будет равно q(1-2p)+p. Заметим, что при q=1/2 нам неважно, как будет поступать наш оппонент. Ответ на данную задачу сказать трудно, чем дальше от 1/2 мы утраиваем на дамах, тем больше диспа, при МО 1/2.

CorwinXX · 31.08.2006, 17:55

Цитата:

Сообщение от Korovin писал чт, 31 августа 2006 17:34

МО = 0.5 * $3 - 0.5 * х * $3 - 0.5 * (1 - х) * $1 = (1 - х) * $1

Средняяя школа, 3-й класс

Спасибо.
Ну, значит я посчитал неправильно

. Я, кажется, уже говорил, что не силён в математике

.

В таком случае оптимальное х = 0.5, МО = $0.5.

Это Я · 31.08.2006, 17:58

Но скорее я расширю PFR чтобы ты постоянно fold.

Весь смысл этой "гонки вооружений" - кто может лучше использовать статистику на противника.

У этой медали есть и обратная сторона. Для меня есть 2 МО: если ты raise с AA и если ты call c AA. Обе отрицательные. Допустим МО(raise) < МО(call), и ты добровольно будешь не добирать.

korovin · 31.08.2006, 17:58

Цитата:

Сообщение от Цитата:

Предположим, что оппонент знает нашу стратегию. (Чтобы её вычислить, достаточно собрать на нас большую статистику). Тогда он может точно вычислить диапозон наших рук, в зависимости от нашей заявки. В зависимости от диапазона рук, он может посчитать МО своего рейза/кола/фолда.

Пока совсем не ушел, замечу что играть против думающего оппонента при наличии рейка в тех размерах, которых он имеет место быть сейчас - ИМХО бесмыссленно. Раба - игрок, который делает много грубых ошибок совершая ставки на отрицательных для него шансах. Его ошибки минус рейк - наш доход. Если сумма денег с его ошибок рейк не бъет - играть смысла НЕТ.

san_piter · 31.08.2006, 18:04

Цитата:

Сообщение от CorwinXX писал чт, 31 августа 2006 17:09

3. Если мы используем "с дамой бет с вероятностью х".
3.1. Оппонент использует "всегда фолд"
МО = 0.5 * $1 + 0.5 * х * $1 - 0.5 * (1 - х) * $1 = х * $1

3.2. Оппонент использует "всегда кол"
МО = 0.5 * $3 - 0.5 * х * $3 - 0.5 * (1 - х) * $1 = (1 - 2х) * $1

При х = 1/3 МО нашей стратегии $1/3 > 0. (Независимо от стратегии, используемой оппонентом).

Правильнее было бы сказать - независимо от того, какую из двух стратегий (всегда фолд или всегда кол) использут оппонент. Из вышеописанного никак не следует, что эта стратегия оптимальна при любой вероятности кола противника, отличной от 0 и 1.

По изначальной теме:
Вообще говоря, в большинстве игр есть оптимальная и максимальная стратегии. Играя в покер по оптимальной (т.е. неэксплуатируемой) стратегии много денег не выиграешь. Максимальная же стратегия включает в себя эксплуатирование знания об используемой оппонентом стратегии. И, соответсвенно, изменение стратегии в зависимости от изменения стратегии оппонентом.
Это я к тому, что бессмысленно забивать в симулятор оптимальную стратегию.

CorwinXX · 31.08.2006, 18:06

Цитата:

Сообщение от Это Я писал чт, 31 августа 2006 17:58

Но скорее я расширю PFR чтобы ты постоянно fold.

Расширение твоего ПФР приводит к увеличению моих МО для кола и рейза.

Попробую сформулировать немного подругому:
Грубо говоря, тебе нужно подобрать диапазон своего ПФР таким образом, чтобы я выбирал не между очень плохим и очень хорошим ходом, а между двумя не очень хорошими ходами. Таким образом, ты поднимешь своё МО (в предположении, что я в состоянии выбрать лучший из ходов).

Это Я · 31.08.2006, 18:08

Есть МО(1) твоей игры в ситуации Х без KQo и есть МО(2) игры с ней.
Нет такого числа n=0...1 где мы n*100% играем остальное не играем.
чтобы получить МО(3)>МО(1) и МО(3)>МО(2).
(с) теорема имени меня.

Mellon · 31.08.2006, 18:12 TS

Товарищи саксаулы, может напишем каждый по алгоритму (специально для косяка), посадим алгоритмы и пусть они сыграют пару тысячек рук ?

31.08.2006, 15:23	#45 (permalink)
tigra_7 Старожил Регистрация: 08.04.2006 Адрес: Москва Сообщений: 894	Ну, насколко я знаю, точнее помню, точнее сейчас читаю , оптимальной стратегии по принципу минимакса может и не быть. Сейчас промотриваю свои старые лекции по теории игр, всё оказывается не так уж и просто. (Ушёл дальше читать) __________________ I don\'t play against a particular villain. I play against the idea of losing.(c) Замазка - двигатель катушки.(c)
	Ответить 0

31.08.2006, 17:18	#47 (permalink)
Это Я Увлечённый Регистрация: 26.10.2005 Адрес: Провинция Сообщений: 462	Придумали игру с МО=0,5 при хаотичной стратегии и радуются, что выигрывают эти 0,5. Давайте изменим правила - введем рейк 0,55 (для простоты за каждый хенд). Какая теперь стратегия. Полная аналогия с клубным покером. Если противник умный, постоянно меняет стратегию (аналогия довольно таки продвинутый бот в покере), лучшая стратегия не играть в эту игру т.к. мы не можем побить рейк. Если противник рыба, играет по одной стратегии, то нужно играть по приведенному мной выше алгоритму. И правильное решение всегда одно. Это как погоня щуки за карасем. Карась убегает хаотично, а щука тоже меняет постоянно направление, но осознанно. Итог вы знаете…
	Ответить 0

31.08.2006, 17:36	#50 (permalink)
CorwinXX Бессмертный Регистрация: 08.02.2006 Адрес: Москва Сообщений: 12,352	Это Я Знаешь, в чём польза использования ГСЧ в покерной стратегии? Если с АА ты всегда даёшь рейз на префлопе, то в случае кола я могу быть уверен, что у тебя не АА. Если с натсовым флеш-дро ты всегда делаешь бет на флопе, то в случае чека я могу быть уверен, что у тебя нет натсового флеш-дро. Ну и так далее. __________________ Моё мнение здесь для того, чтобы узнать, почему оно неправильное.
	Ответить 0

31.08.2006, 17:51	#53 (permalink)
tigra_7 Старожил Регистрация: 08.04.2006 Адрес: Москва Сообщений: 894	На самом деле это нельзя назвать оптимальной стратегией. В общем я посчитал, вроде правильно, хотя вечером, когда время поболе будет проверю. Пусть мы утраиваем с вероятностью q, а опп нас вскрывает с вероятностью p. Тогда при Вашей стратегии МО будет (p+1)/3. То есть колебаться от 1/3 до 2/3. Вообще, МО будет равно q(1-2p)+p. Заметим, что при q=1/2 нам неважно, как будет поступать наш оппонент. Ответ на данную задачу сказать трудно, чем дальше от 1/2 мы утраиваем на дамах, тем больше диспа, при МО 1/2. __________________ I don\'t play against a particular villain. I play against the idea of losing.(c) Замазка - двигатель катушки.(c)
	Ответить 0

31.08.2006, 17:58	#55 (permalink)
Это Я Увлечённый Регистрация: 26.10.2005 Адрес: Провинция Сообщений: 462	Но скорее я расширю PFR чтобы ты постоянно fold. Весь смысл этой "гонки вооружений" - кто может лучше использовать статистику на противника. У этой медали есть и обратная сторона. Для меня есть 2 МО: если ты raise с AA и если ты call c AA. Обе отрицательные. Допустим МО(raise) < МО(call), и ты добровольно будешь не добирать.
	Ответить 0

31.08.2006, 18:08	#59 (permalink)
Это Я Увлечённый Регистрация: 26.10.2005 Адрес: Провинция Сообщений: 462	Есть МО(1) твоей игры в ситуации Х без KQo и есть МО(2) игры с ней. Нет такого числа n=0...1 где мы n*100% играем остальное не играем. чтобы получить МО(3)>МО(1) и МО(3)>МО(2). (с) теорема имени меня.
	Ответить 0

31.08.2006, 18:12 TS	#60 (permalink)
Mellon Незнакомец Регистрация: 29.08.2006 Адрес: Воронеж Сообщений: 8	Товарищи саксаулы, может напишем каждый по алгоритму (специально для косяка), посадим алгоритмы и пусть они сыграют пару тысячек рук ?
	Ответить 0

Похожие темы
Тема	Автор	Раздел	Ответов	Последнее сообщение
К. Мошман: Симулятор дистанции	OldBoy	Новости, статьи, репортажи..	0	23.02.2012 17:17
Эх, создать бы симулятор спортивных игр!	dibloid	Ваши прогнозы	12	03.02.2011 13:24
Есть ли какой симулятор СнГ??	Poke	Одностоловые турниры	8	17.11.2006 11:19
Симулятор флопов/тёрнов для холдема	I will kill your set	Теории, стратегии, основы покера	11	14.07.2006 10:58
Где скачать хороший симулятор по блекджеку?	Сaballero	Блэкджек	6	04.08.2005 01:13