Теория игр

  • В закладки
  • Вставить в блог

От рулетки до футбола

До взрыва двадцать секунд. В твоей руке – кусачки, перед глазами – два провода. Красный и синий. Неправильный выбор – и взрыв грянет немедленно. Ты знаешь: обычно, чтобы обесточить взрыватель, режут красный. Кусачки уже обхватили с обеих сторон изоляцию…

Постой-ка. Разве не так же думал бы злоумышленник, который соорудил бомбу? Может, лучше, синий?

Но… если он знал, что ты знал, что он выберет синий, то он должен был выбрать красный!

Задача становится неразрешимой. Ты должен сделать то, чего не ожидал злоумышленник, но, как только ты посчитаешь какой-то вариант неожиданным, он тут же станет наиболее ожидаемым. До взрыва три секунды… две… одна…… Какой провод резать?

Продолжать ли компании вести дорогостоящие разработки в области новых технологий, если конкурент уже на полшага впереди?

Должен ли глава государства верить заявлению агрессивного соседа о том, что его страна сокращает арсеналы? Или это повод привести армию в боевую готовность?

До сороковых годов XX века поиск ответов на эти вопросы был прерогативой философии и этики. Рациональные решения таких задач были впервые предложены фон Нейманом и Моргенштерном в работе «Теория игр и экономическое поведение».

Игрой с точки зрения теории считается любая ситуация, когда как минимум один из игроков может увеличить свой выигрыш, предугадав действия других участников. Предполагается, что все игроки действуют рационально: оценивают выигрыш, просчитывают пути его достижения и выбирают наиболее предпочтительные действия. Каждый игрок имеет выбор из нескольких стратегий, диктующих действия игрока в ответ на ходы остальных.

В самых простых играх перед принятием решения игрок знает, что произошло в игре до настоящего момента – как, например, в шахматах. Решения задач для таких игр представляются в виде «деревьев», ветвящихся в точках принятия решений о следующем ходе.

Есть игры, где информация неполная: сапер должен резать провод, не зная, как сконструировал бомбу злоумышленник. Знание или незнание о действиях соперника может совершенно изменить ход рассуждений игрока и его решение о выборе стратегии. Решения таких задач представляют в виде или матриц. Самая известная из них – «Дилемма заключенного».

Двое преступников попались на сходных преступлениях. Полиция предлагает сделку: если один свидетельствует против другого, то первый освобождается за помощь следствию, а второй получает максимальный срок (10 лет). Если оба молчат, дело проходит по другой статье, и они приговариваются к 6 месяцам. Если оба свидетельствуют друг против друга, они получают минимальный срок (по 2 года). Ни один из них не знает точно, что сделает другой. Что произойдет?

Представим рассуждения одного из заключенных. Если партнер молчит, то лучше его предать и выйти на свободу. Если партнер свидетельствует, то лучше тоже свидетельствовать против него, чтобы получить 2 года. Стратегия «свидетельствовать» строго доминирует над стратегией «молчать». В результате этой строгой логики каждая из сторон склоняется к возможному предательству.

Однако, с точки зрения группы двух заключенных, лучше всего сотрудничать друг с другом, хранить молчание и получить по полгода, так как это уменьшит суммарный срок заключения. В «дилемме заключенного», как и во многих реальных ситуациях, моделируемых на ее основе, выгода от сотрудничества выше, чем от взаимного предательства.

Роберт Аксельрод исследовал расширение сценария «ДЗ», которое он назвал «повторяющаяся дилемма заключенного», где участники помнят предыдущие результаты. Он открыл, что если игра повторялась долго среди множества игроков, «жадные» стратегии давали плохие результаты в долгосрочном периоде, а лучше работали «альтруистические» стратегии. Аксельрод сформулировал несколько условий, необходимых, чтобы стратегия получила высокий результат:

Добрая. Стратегия не должна предавать, пока этого не сделает оппонент. Почти все стратегии-лидеры были добрыми. Поэтому эгоистичная стратегия по чисто эгоистическим причинам не будет первой «бить» соперника.

Мстительная. Успешная стратегия не должна быть слепым оптимистом. Она всегда должна мстить. Пример немстительной стратегии — всегда сотрудничать. Это очень плохой выбор, поскольку «подлые» стратегии воспользуются этим.

Прощающая. Другое важное качество успешных стратегий — уметь прощать. Отомстив, они должны вернуться к сотрудничеству, если оппонент не продолжает предавать. Это предотвращает бесконечное мщение друг другу и максимизирует выигрыш.

Независтливая. Последнее качество — не быть завистливым, то есть не пытаться набрать больше очков, чем оппонент.

Аксельрод пришел к утопично звучащему выводу, что эгоистичные индивиды во имя их же эгоистического блага будут стремиться быть добрыми и прощающими и независтливыми.

Сорвать большой куш

  • В закладки
  • Вставить в блог
Представьтесь Facebook Google Twitter или зарегистрируйтесь, чтобы участвовать в обсуждении.

В 6-м номере читайте о знаменитом Владимире Гиляровском, о «соловецком эпизоде» в ходе Крымской войны,  об истории создания серии картин Уильяма Хогарта «Выборы в парламент», о судьбе  французского короля королю Людовика XI, нареченного Святым, о малоизвестных фактах из  биографии композитора Алябьева, о жизни и творчестве актера Олега Борисова, новый детектив Андрея Быстрова «Легкокрылый ангел»  и многое  другое...



Виджет Архива Смены

в этой рубрике

Болельщики против болезни

Сколько человек поедет на матч в Уэльс, и чем глорихантер отличается от маркитантки

Правила покера

Игра ковбоев и президентов

Рыцари зеленого стола

Лучшие снукеристы докатили шары до российских луз

в этом номере

Иерусалим

Фотопутешествие с Юлианом Рибиником

Диzaйн как игра

Почему вещи из дешевых материалов считаются венцом моды

Peer на весь мир

Что нам готовит технология bittorrent