Регистрация
Регистрация Поиск Сообщество  
CGM > Покер > Около покерного стола
Опции темы

Смастерим симулятор

Важные объявления
Старый 31.08.2006, 14:54   #41 (permalink)
Бессмертный
 
Аватар для korovin
 
Регистрация: 13.02.2004
Адрес: Россия
Сообщений: 3,027
Цитата:
Сообщение от Цитата:
В теории игр смешанными стратегиями называют применения нескольких чистых стратегий, чередующихся по случайному закону с определенным соотношением частот.
Вижу что плаваю в предмете обсуждения, посему "отваливаю".
korovin вне форума      
Старый 31.08.2006, 15:03   #42 (permalink)
Ветеран
 
Регистрация: 26.11.2005
Адрес: Минск
Сообщений: 1,242
Цитата:
Сообщение от tigra писал чт, 31 августа 2006 13:51
Это да, а что такое чистая стратегия?
Оптимальная стратегия по принципу минимакса.
__________________
Единственный способ стать умнее -- играть с более умным противником. // Основы шахмат\'1883
Sharky вне форума      
Старый 31.08.2006, 15:11   #43 (permalink)
Бессмертный
 
Аватар для Grey
 
Регистрация: 30.04.2004
Сообщений: 3,612
Цитата:
Сообщение от Korovin писал
Ну а если под данные подогнать и масть карты, то любую стратегию с нашей точки зрения можно считать чистой а с точки зрения оппонентов - смешаной?
С таким же успехом можно подогнать подбрасывание монетки или взгляд на часы (четное/нечетное число секунд и т.п.). Ну а масти тут можно использовать лишь постольку, поскольку они подходят под оптимальное соотношение стратегий 1/4. А оптимально ли оно? А если оптимальное 2/7, что тогда делать?
__________________
Arthur Grey
Grey вне форума      
Старый 31.08.2006, 15:13   #44 (permalink)
Бессмертный
 
Аватар для Grey
 
Регистрация: 30.04.2004
Сообщений: 3,612
Цитата:
Сообщение от Sharky писал
Цитата:
Сообщение от tigra писал
Это да, а что такое чистая стратегия?
Оптимальная стратегия по принципу минимакса.
Sharky, бросай пить. До вечера еще далеко, а ты уже лыка не вяжешь
__________________
Arthur Grey
Grey вне форума      
Старый 31.08.2006, 15:23   #45 (permalink)
Старожил
 
Аватар для tigra_7
 
Регистрация: 08.04.2006
Адрес: Москва
Сообщений: 894
Отправить сообщение для tigra_7 с помощью ICQ
Ну, насколко я знаю, точнее помню, точнее сейчас читаю , оптимальной стратегии по принципу минимакса может и не быть.
Сейчас промотриваю свои старые лекции по теории игр, всё оказывается не так уж и просто. (Ушёл дальше читать)
__________________
I don\'t play against a particular villain. I play against the idea of losing.(c)

Замазка - двигатель катушки.(c)
tigra_7 вне форума      
Старый 31.08.2006, 17:09   #46 (permalink)
Бессмертный
 
Регистрация: 08.02.2006
Адрес: Москва
Сообщений: 12,352
Цитата:
Сообщение от Это Я писал ср, 30 августа 2006 20:42
либо всегда с Q reise либо никогда, и нет никакой вероятности!
У оппонента есть 2 "чистые" стратегии - всегда кол и всегда фолд.

У нас есть 2 чистые стратегии - с дамой всегда чек и с дамой всегда бет (с тузом всегда бет в обеих стратегиях).

1. Если мы используем "с дамой всегда чек", то оппонент будет использовать "всегда фолд". МО = 0.

2. Если мы используем "с дамой всегда бет", то оппонент будет использовать "всегда кол". МО = 0.


3. Если мы используем "с дамой бет с вероятностью х".
3.1. Оппонент использует "всегда фолд"
МО = 0.5 * $1 + 0.5 * х * $1 - 0.5 * (1 - х) * $1 = х * $1

3.2. Оппонент использует "всегда кол"
МО = 0.5 * $3 - 0.5 * х * $3 - 0.5 * (1 - х) * $1 = (1 - 2х) * $1

При х = 1/3 МО нашей стратегии $1/3 > 0. (Независимо от стратегии, используемой оппонентом).


Ответ:
Оптимальная стратегия - с тузом всегда ставить, с дамой ставить в 1/3 случаев.
__________________
Моё мнение здесь для того, чтобы узнать, почему оно неправильное.
CorwinXX вне форума      
Старый 31.08.2006, 17:18   #47 (permalink)
Увлечённый
 
Регистрация: 26.10.2005
Адрес: Провинция
Сообщений: 462
Придумали игру с МО=0,5 при хаотичной стратегии и радуются, что выигрывают эти 0,5. Давайте изменим правила - введем рейк 0,55 (для простоты за каждый хенд). Какая теперь стратегия. Полная аналогия с клубным покером.
Если противник умный, постоянно меняет стратегию (аналогия довольно таки продвинутый бот в покере), лучшая стратегия не играть в эту игру т.к. мы не можем побить рейк.
Если противник рыба, играет по одной стратегии, то нужно играть по приведенному мной выше алгоритму.

И правильное решение всегда одно. Это как погоня щуки за карасем. Карась убегает хаотично, а щука тоже меняет постоянно направление, но осознанно. Итог вы знаете…
Это Я вне форума      
Старый 31.08.2006, 17:29   #48 (permalink)
Бессмертный
 
Регистрация: 08.02.2006
Адрес: Москва
Сообщений: 12,352
Цитата:
Сообщение от Korovin писал чт, 31 августа 2006 14:24
Осмелюсь предположить что при такой формулировке чистая стретегия игры в клубный покер сильно уступает смешаной по доходности (если вообще бъет рейк).
Большинство народа в покере использует чистые стратегии. Яркий пример этого - префлоп таблицы.
Слабые игроки делают ставку на префлопе в зависимости от карты, позиции, ставок перед нами и количества игроков в банке.
Сильные игроки добавляют к входным данным параметры игроков (и сделавших ставки перед нами, и тех, кто сидит за нами и ещё не сделал свою ставку). Но это всё равно "чистая" стратегия (ход определяется набором входных данных). Хотя она более сложная и её не уместить в префлоп-таблицу, но фактически эту "таблицу" (или можно сказать "алгоритм")) игрок держит в голове.

На флопе и дальше в принципе то же самое. Только из-за большого количества разветвлений алгоритм сложно оформить в виде таблицы.

__________________
Моё мнение здесь для того, чтобы узнать, почему оно неправильное.
CorwinXX вне форума      
Старый 31.08.2006, 17:34   #49 (permalink)
Бессмертный
 
Аватар для korovin
 
Регистрация: 13.02.2004
Адрес: Россия
Сообщений: 3,027
Цитата:
Сообщение от Цитата:
3.2. Оппонент использует "всегда кол"
МО = 0.5 * $3 - 0.5 * х * $3 - 0.5 * (1 - х) * $1 = (1 - 2х) * $1
МО = 0.5 * $3 - 0.5 * х * $3 - 0.5 * (1 - х) * $1 = (1 - х) * $1

Средняяя школа, 3-й класс
korovin вне форума      
Старый 31.08.2006, 17:36   #50 (permalink)
Бессмертный
 
Регистрация: 08.02.2006
Адрес: Москва
Сообщений: 12,352
Это Я
Знаешь, в чём польза использования ГСЧ в покерной стратегии?
Если с АА ты всегда даёшь рейз на префлопе, то в случае кола я могу быть уверен, что у тебя не АА.
Если с натсовым флеш-дро ты всегда делаешь бет на флопе, то в случае чека я могу быть уверен, что у тебя нет натсового флеш-дро.
Ну и так далее.
__________________
Моё мнение здесь для того, чтобы узнать, почему оно неправильное.
CorwinXX вне форума      
Старый 31.08.2006, 17:46   #51 (permalink)
Увлечённый
 
Регистрация: 26.10.2005
Адрес: Провинция
Сообщений: 462
Цитата:
Сообщение от CorwinXX писал чт, 31 августа 2006 17:36
Это Я
Знаешь, в чём польза использования ГСЧ в покерной стратегии?
Если с АА ты всегда даёшь рейз на префлопе, то в случае кола я могу быть уверен, что у тебя не АА.
Если с натсовым флеш-дро ты всегда делаешь бет на флопе, то в случае чека я могу быть уверен, что у тебя нет натсового флеш-дро.
Ну и так далее.
Когда ты даешь понять, что ты это знаешь, я начинаю этим пользоваться и с АА не raise, это же не случайная стратегия.
Это Я вне форума      
Старый 31.08.2006, 17:51   #52 (permalink)
Бессмертный
 
Регистрация: 08.02.2006
Адрес: Москва
Сообщений: 12,352
Цитата:
Сообщение от Это Я писал чт, 31 августа 2006 17:18
Придумали игру с МО=0,5 при хаотичной стратегии и радуются, что выигрывают эти 0,5.
Этой задачкой я хотел продемонстрировать один важный принцип.

Предположим, что оппонент знает нашу стратегию. (Чтобы её вычислить, достаточно собрать на нас большую статистику). Тогда он может точно вычислить диапозон наших рук, в зависимости от нашей заявки. В зависимости от диапазона рук, он может посчитать МО своего рейза/кола/фолда.

Пример 1.
МО кола = -0.15, МО фолда = 0. Он выбирает фолд.
Нам выгодно чуть-чуть расширить диапазон нашей заявки. При этом для оппонента возрастёт МО кола. Но если оно останется меньше нуля, то он всё равно будет выбирать фолд. Но так как мы расширили диапазон, то это будет происходить чаще (то есть, мы будем выигрывать чаще).


Пример 2.
МО кола = 0.10, МО рейза = 0.20. Он выбирает рейз.
Если это возможно, то нам нужно изменить диапазон нашей заявки таким образом, чтобы для оппонента МО кола стало 0.15 и МО рейза стало 0.15. Тогда его ставка станет менее выгодной для него, а значит более выгодной для нас.


Например, если мы добавим к нашей заявке KQo, то МО поменяются слишком сильно (сильнее, чем нам хотелось бы). Тогда мы поступаем очень просто - добавляем "половину" KQo. То есть, с KQo мы 50% рейз, 50% фолд. Цель достигнута.


з.ы. Все примеры условные. Не надо к ним придираться .
__________________
Моё мнение здесь для того, чтобы узнать, почему оно неправильное.
CorwinXX вне форума      
Старый 31.08.2006, 17:51   #53 (permalink)
Старожил
 
Аватар для tigra_7
 
Регистрация: 08.04.2006
Адрес: Москва
Сообщений: 894
Отправить сообщение для tigra_7 с помощью ICQ
На самом деле это нельзя назвать оптимальной стратегией. В общем я посчитал, вроде правильно, хотя вечером, когда время поболе будет проверю. Пусть мы утраиваем с вероятностью q, а опп нас вскрывает с вероятностью p. Тогда при Вашей стратегии МО будет (p+1)/3. То есть колебаться от 1/3 до 2/3. Вообще, МО будет равно q(1-2p)+p. Заметим, что при q=1/2 нам неважно, как будет поступать наш оппонент. Ответ на данную задачу сказать трудно, чем дальше от 1/2 мы утраиваем на дамах, тем больше диспа, при МО 1/2.
__________________
I don\'t play against a particular villain. I play against the idea of losing.(c)

Замазка - двигатель катушки.(c)
tigra_7 вне форума      
Старый 31.08.2006, 17:55   #54 (permalink)
Бессмертный
 
Регистрация: 08.02.2006
Адрес: Москва
Сообщений: 12,352
Цитата:
Сообщение от Korovin писал чт, 31 августа 2006 17:34

МО = 0.5 * $3 - 0.5 * х * $3 - 0.5 * (1 - х) * $1 = (1 - х) * $1

Средняяя школа, 3-й класс
Спасибо.
Ну, значит я посчитал неправильно . Я, кажется, уже говорил, что не силён в математике .

В таком случае оптимальное х = 0.5, МО = $0.5.
__________________
Моё мнение здесь для того, чтобы узнать, почему оно неправильное.
CorwinXX вне форума      
Старый 31.08.2006, 17:58   #55 (permalink)
Увлечённый
 
Регистрация: 26.10.2005
Адрес: Провинция
Сообщений: 462
Но скорее я расширю PFR чтобы ты постоянно fold.

Весь смысл этой "гонки вооружений" - кто может лучше использовать статистику на противника.

У этой медали есть и обратная сторона. Для меня есть 2 МО: если ты raise с AA и если ты call c AA. Обе отрицательные. Допустим МО(raise) < МО(call), и ты добровольно будешь не добирать.
Это Я вне форума      
Старый 31.08.2006, 17:58   #56 (permalink)
Бессмертный
 
Аватар для korovin
 
Регистрация: 13.02.2004
Адрес: Россия
Сообщений: 3,027
Цитата:
Сообщение от Цитата:
Предположим, что оппонент знает нашу стратегию. (Чтобы её вычислить, достаточно собрать на нас большую статистику). Тогда он может точно вычислить диапозон наших рук, в зависимости от нашей заявки. В зависимости от диапазона рук, он может посчитать МО своего рейза/кола/фолда.
Пока совсем не ушел, замечу что играть против думающего оппонента при наличии рейка в тех размерах, которых он имеет место быть сейчас - ИМХО бесмыссленно. Раба - игрок, который делает много грубых ошибок совершая ставки на отрицательных для него шансах. Его ошибки минус рейк - наш доход. Если сумма денег с его ошибок рейк не бъет - играть смысла НЕТ.
korovin вне форума      
Старый 31.08.2006, 18:04   #57 (permalink)
Аксакал
 
Аватар для san_piter
 
Регистрация: 15.01.2006
Адрес: Питер
Сообщений: 2,211
Цитата:
Сообщение от CorwinXX писал чт, 31 августа 2006 17:09
3. Если мы используем "с дамой бет с вероятностью х".
3.1. Оппонент использует "всегда фолд"
МО = 0.5 * $1 + 0.5 * х * $1 - 0.5 * (1 - х) * $1 = х * $1

3.2. Оппонент использует "всегда кол"
МО = 0.5 * $3 - 0.5 * х * $3 - 0.5 * (1 - х) * $1 = (1 - 2х) * $1

При х = 1/3 МО нашей стратегии $1/3 > 0. (Независимо от стратегии, используемой оппонентом).
Правильнее было бы сказать - независимо от того, какую из двух стратегий (всегда фолд или всегда кол) использут оппонент. Из вышеописанного никак не следует, что эта стратегия оптимальна при любой вероятности кола противника, отличной от 0 и 1.

По изначальной теме:
Вообще говоря, в большинстве игр есть оптимальная и максимальная стратегии. Играя в покер по оптимальной (т.е. неэксплуатируемой) стратегии много денег не выиграешь. Максимальная же стратегия включает в себя эксплуатирование знания об используемой оппонентом стратегии. И, соответсвенно, изменение стратегии в зависимости от изменения стратегии оппонентом.
Это я к тому, что бессмысленно забивать в симулятор оптимальную стратегию.
san_piter вне форума      
Старый 31.08.2006, 18:06   #58 (permalink)
Бессмертный
 
Регистрация: 08.02.2006
Адрес: Москва
Сообщений: 12,352
Цитата:
Сообщение от Это Я писал чт, 31 августа 2006 17:58
Но скорее я расширю PFR чтобы ты постоянно fold.
Расширение твоего ПФР приводит к увеличению моих МО для кола и рейза.

Попробую сформулировать немного подругому:
Грубо говоря, тебе нужно подобрать диапазон своего ПФР таким образом, чтобы я выбирал не между очень плохим и очень хорошим ходом, а между двумя не очень хорошими ходами. Таким образом, ты поднимешь своё МО (в предположении, что я в состоянии выбрать лучший из ходов).
__________________
Моё мнение здесь для того, чтобы узнать, почему оно неправильное.
CorwinXX вне форума      
Старый 31.08.2006, 18:08   #59 (permalink)
Увлечённый
 
Регистрация: 26.10.2005
Адрес: Провинция
Сообщений: 462
Есть МО(1) твоей игры в ситуации Х без KQo и есть МО(2) игры с ней.
Нет такого числа n=0...1 где мы n*100% играем остальное не играем.
чтобы получить МО(3)>МО(1) и МО(3)>МО(2).
(с) теорема имени меня.
Это Я вне форума      
Старый 31.08.2006, 18:12     TS Старый   #60 (permalink)
Незнакомец
 
Регистрация: 29.08.2006
Адрес: Воронеж
Сообщений: 8
Товарищи саксаулы, может напишем каждый по алгоритму (специально для косяка), посадим алгоритмы и пусть они сыграют пару тысячек рук ?
Mellon вне форума      

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
К. Мошман: Симулятор дистанции OldBoy Новости, статьи, репортажи.. 0 23.02.2012 17:17
Эх, создать бы симулятор спортивных игр! dibloid Ваши прогнозы 12 03.02.2011 13:24
Есть ли какой симулятор СнГ?? Poke Одностоловые турниры 8 17.11.2006 11:19
Симулятор флопов/тёрнов для холдема I will kill your set Теории, стратегии, основы покера 11 14.07.2006 10:58
Где скачать хороший симулятор по блекджеку? Сaballero Блэкджек 6 04.08.2005 01:13



Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.
Trackbacks are Выкл.
Pingbacks are Выкл.
Refbacks are Выкл.

Быстрый переход
Правила форумов CGM Контакты Справка Обратная связь CGM.ru Архив Вверх Главная
 
Использование материалов сайта разрешено только при наличии активной ссылки на источник.
Все права на картинки и тексты принадлежат Информационному агентству CGM и их ПАРТНЕРАМ. Политика конфидециальности
CGM.ru на Youtube CGM.ru на Google+ CGM.ru в Twitter CGM.ru на Facebook CGM.ru в vKontakte CGM.ru в Instagram

В сотрудничестве с Pokeroff.ru
Текущее время: 11:42. Часовой пояс GMT +3.
Powered by vBulletin® Version 3.8.7
Copyright ©2000 - 2024, vBulletin Solutions, Inc. Перевод: zCarot