| ||||
| ||||
|
Важные объявления |
|
31.08.2006, 14:54 | #41 (permalink) | |
Бессмертный
Регистрация: 13.02.2004
Адрес: Россия
Сообщений: 3,027
|
Цитата:
|
|
0 |
31.08.2006, 15:03 | #42 (permalink) | |
Ветеран
Регистрация: 26.11.2005
Адрес: Минск
Сообщений: 1,242
|
Цитата:
__________________
Единственный способ стать умнее -- играть с более умным противником. // Основы шахмат\'1883 |
|
0 |
31.08.2006, 15:11 | #43 (permalink) | |
Бессмертный
Регистрация: 30.04.2004
Сообщений: 3,612
|
Цитата:
__________________
Arthur Grey |
|
0 |
31.08.2006, 15:13 | #44 (permalink) | ||
Бессмертный
Регистрация: 30.04.2004
Сообщений: 3,612
|
Цитата:
__________________
Arthur Grey |
||
0 |
31.08.2006, 15:23 | #45 (permalink) |
Старожил
|
Ну, насколко я знаю, точнее помню, точнее сейчас читаю , оптимальной стратегии по принципу минимакса может и не быть.
Сейчас промотриваю свои старые лекции по теории игр, всё оказывается не так уж и просто. (Ушёл дальше читать)
__________________
I don\'t play against a particular villain. I play against the idea of losing.(c) Замазка - двигатель катушки.(c) |
0 |
31.08.2006, 17:09 | #46 (permalink) | |
Бессмертный
Регистрация: 08.02.2006
Адрес: Москва
Сообщений: 12,352
|
Цитата:
У нас есть 2 чистые стратегии - с дамой всегда чек и с дамой всегда бет (с тузом всегда бет в обеих стратегиях). 1. Если мы используем "с дамой всегда чек", то оппонент будет использовать "всегда фолд". МО = 0. 2. Если мы используем "с дамой всегда бет", то оппонент будет использовать "всегда кол". МО = 0. 3. Если мы используем "с дамой бет с вероятностью х". 3.1. Оппонент использует "всегда фолд" МО = 0.5 * $1 + 0.5 * х * $1 - 0.5 * (1 - х) * $1 = х * $1 3.2. Оппонент использует "всегда кол" МО = 0.5 * $3 - 0.5 * х * $3 - 0.5 * (1 - х) * $1 = (1 - 2х) * $1 При х = 1/3 МО нашей стратегии $1/3 > 0. (Независимо от стратегии, используемой оппонентом). Ответ: Оптимальная стратегия - с тузом всегда ставить, с дамой ставить в 1/3 случаев.
__________________
Моё мнение здесь для того, чтобы узнать, почему оно неправильное. |
|
0 |
31.08.2006, 17:18 | #47 (permalink) |
Увлечённый
Регистрация: 26.10.2005
Адрес: Провинция
Сообщений: 462
|
Придумали игру с МО=0,5 при хаотичной стратегии и радуются, что выигрывают эти 0,5. Давайте изменим правила - введем рейк 0,55 (для простоты за каждый хенд). Какая теперь стратегия. Полная аналогия с клубным покером.
Если противник умный, постоянно меняет стратегию (аналогия довольно таки продвинутый бот в покере), лучшая стратегия не играть в эту игру т.к. мы не можем побить рейк. Если противник рыба, играет по одной стратегии, то нужно играть по приведенному мной выше алгоритму. И правильное решение всегда одно. Это как погоня щуки за карасем. Карась убегает хаотично, а щука тоже меняет постоянно направление, но осознанно. Итог вы знаете… |
0 |
31.08.2006, 17:29 | #48 (permalink) | |
Бессмертный
Регистрация: 08.02.2006
Адрес: Москва
Сообщений: 12,352
|
Цитата:
Слабые игроки делают ставку на префлопе в зависимости от карты, позиции, ставок перед нами и количества игроков в банке. Сильные игроки добавляют к входным данным параметры игроков (и сделавших ставки перед нами, и тех, кто сидит за нами и ещё не сделал свою ставку). Но это всё равно "чистая" стратегия (ход определяется набором входных данных). Хотя она более сложная и её не уместить в префлоп-таблицу, но фактически эту "таблицу" (или можно сказать "алгоритм")) игрок держит в голове. На флопе и дальше в принципе то же самое. Только из-за большого количества разветвлений алгоритм сложно оформить в виде таблицы.
__________________
Моё мнение здесь для того, чтобы узнать, почему оно неправильное. |
|
0 |
31.08.2006, 17:34 | #49 (permalink) | |
Бессмертный
Регистрация: 13.02.2004
Адрес: Россия
Сообщений: 3,027
|
Цитата:
Средняяя школа, 3-й класс |
|
0 |
31.08.2006, 17:36 | #50 (permalink) |
Бессмертный
Регистрация: 08.02.2006
Адрес: Москва
Сообщений: 12,352
|
Это Я
Знаешь, в чём польза использования ГСЧ в покерной стратегии? Если с АА ты всегда даёшь рейз на префлопе, то в случае кола я могу быть уверен, что у тебя не АА. Если с натсовым флеш-дро ты всегда делаешь бет на флопе, то в случае чека я могу быть уверен, что у тебя нет натсового флеш-дро. Ну и так далее.
__________________
Моё мнение здесь для того, чтобы узнать, почему оно неправильное. |
0 |
31.08.2006, 17:46 | #51 (permalink) | |
Увлечённый
Регистрация: 26.10.2005
Адрес: Провинция
Сообщений: 462
|
Цитата:
|
|
0 |
31.08.2006, 17:51 | #52 (permalink) | |
Бессмертный
Регистрация: 08.02.2006
Адрес: Москва
Сообщений: 12,352
|
Цитата:
Предположим, что оппонент знает нашу стратегию. (Чтобы её вычислить, достаточно собрать на нас большую статистику). Тогда он может точно вычислить диапозон наших рук, в зависимости от нашей заявки. В зависимости от диапазона рук, он может посчитать МО своего рейза/кола/фолда. Пример 1. МО кола = -0.15, МО фолда = 0. Он выбирает фолд. Нам выгодно чуть-чуть расширить диапазон нашей заявки. При этом для оппонента возрастёт МО кола. Но если оно останется меньше нуля, то он всё равно будет выбирать фолд. Но так как мы расширили диапазон, то это будет происходить чаще (то есть, мы будем выигрывать чаще). Пример 2. МО кола = 0.10, МО рейза = 0.20. Он выбирает рейз. Если это возможно, то нам нужно изменить диапазон нашей заявки таким образом, чтобы для оппонента МО кола стало 0.15 и МО рейза стало 0.15. Тогда его ставка станет менее выгодной для него, а значит более выгодной для нас. Например, если мы добавим к нашей заявке KQo, то МО поменяются слишком сильно (сильнее, чем нам хотелось бы). Тогда мы поступаем очень просто - добавляем "половину" KQo. То есть, с KQo мы 50% рейз, 50% фолд. Цель достигнута. з.ы. Все примеры условные. Не надо к ним придираться .
__________________
Моё мнение здесь для того, чтобы узнать, почему оно неправильное. |
|
0 |
31.08.2006, 17:51 | #53 (permalink) |
Старожил
|
На самом деле это нельзя назвать оптимальной стратегией. В общем я посчитал, вроде правильно, хотя вечером, когда время поболе будет проверю. Пусть мы утраиваем с вероятностью q, а опп нас вскрывает с вероятностью p. Тогда при Вашей стратегии МО будет (p+1)/3. То есть колебаться от 1/3 до 2/3. Вообще, МО будет равно q(1-2p)+p. Заметим, что при q=1/2 нам неважно, как будет поступать наш оппонент. Ответ на данную задачу сказать трудно, чем дальше от 1/2 мы утраиваем на дамах, тем больше диспа, при МО 1/2.
__________________
I don\'t play against a particular villain. I play against the idea of losing.(c) Замазка - двигатель катушки.(c) |
0 |
31.08.2006, 17:55 | #54 (permalink) | |
Бессмертный
Регистрация: 08.02.2006
Адрес: Москва
Сообщений: 12,352
|
Цитата:
Ну, значит я посчитал неправильно . Я, кажется, уже говорил, что не силён в математике . В таком случае оптимальное х = 0.5, МО = $0.5.
__________________
Моё мнение здесь для того, чтобы узнать, почему оно неправильное. |
|
0 |
31.08.2006, 17:58 | #55 (permalink) |
Увлечённый
Регистрация: 26.10.2005
Адрес: Провинция
Сообщений: 462
|
Но скорее я расширю PFR чтобы ты постоянно fold.
Весь смысл этой "гонки вооружений" - кто может лучше использовать статистику на противника. У этой медали есть и обратная сторона. Для меня есть 2 МО: если ты raise с AA и если ты call c AA. Обе отрицательные. Допустим МО(raise) < МО(call), и ты добровольно будешь не добирать. |
0 |
31.08.2006, 17:58 | #56 (permalink) | |
Бессмертный
Регистрация: 13.02.2004
Адрес: Россия
Сообщений: 3,027
|
Цитата:
|
|
0 |
31.08.2006, 18:04 | #57 (permalink) | |
Аксакал
Регистрация: 15.01.2006
Адрес: Питер
Сообщений: 2,211
|
Цитата:
По изначальной теме: Вообще говоря, в большинстве игр есть оптимальная и максимальная стратегии. Играя в покер по оптимальной (т.е. неэксплуатируемой) стратегии много денег не выиграешь. Максимальная же стратегия включает в себя эксплуатирование знания об используемой оппонентом стратегии. И, соответсвенно, изменение стратегии в зависимости от изменения стратегии оппонентом. Это я к тому, что бессмысленно забивать в симулятор оптимальную стратегию. |
|
0 |
31.08.2006, 18:06 | #58 (permalink) | |
Бессмертный
Регистрация: 08.02.2006
Адрес: Москва
Сообщений: 12,352
|
Цитата:
Попробую сформулировать немного подругому: Грубо говоря, тебе нужно подобрать диапазон своего ПФР таким образом, чтобы я выбирал не между очень плохим и очень хорошим ходом, а между двумя не очень хорошими ходами. Таким образом, ты поднимешь своё МО (в предположении, что я в состоянии выбрать лучший из ходов).
__________________
Моё мнение здесь для того, чтобы узнать, почему оно неправильное. |
|
0 |
31.08.2006, 18:08 | #59 (permalink) |
Увлечённый
Регистрация: 26.10.2005
Адрес: Провинция
Сообщений: 462
|
Есть МО(1) твоей игры в ситуации Х без KQo и есть МО(2) игры с ней.
Нет такого числа n=0...1 где мы n*100% играем остальное не играем. чтобы получить МО(3)>МО(1) и МО(3)>МО(2). (с) теорема имени меня. |
0 |
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
К. Мошман: Симулятор дистанции | OldBoy | Новости, статьи, репортажи.. | 0 | 23.02.2012 17:17 |
Эх, создать бы симулятор спортивных игр! | dibloid | Ваши прогнозы | 12 | 03.02.2011 13:24 |
Есть ли какой симулятор СнГ?? | Poke | Одностоловые турниры | 8 | 17.11.2006 11:19 |
Симулятор флопов/тёрнов для холдема | I will kill your set | Теории, стратегии, основы покера | 11 | 14.07.2006 10:58 |
Где скачать хороший симулятор по блекджеку? | Сaballero | Блэкджек | 6 | 04.08.2005 01:13 |
|
|