Гадалка Шеннона

В студенческое время я наткнулся на интересную статью об игре "Чет-нечет" на домашней страничке пользователя ltwood.

Правила очень простые. Игрок загадывает один вариант из двух: "чет" или "нечет", а оппонент пытается угадать выбор игрока. Если угадать не удалось, то очко получает загадавший, а если угадать получилось - то угадывающий. Кто первым наберет 20 очков, тот и молодец!

Кажется, что в этой игре все случайно. Случайно загадывается число, потом случайно второй игрок пытается угадать что же было загадано. Я очень сильно удивился, когда попробовал поиграть в эту игру с программой и за десять попыток так ни разу и не выиграл.

Парадокс в том, что мы думаем что загадываем числа случайно. На самом деле все не так, и последовательность загаданных чисел не случайна.

Исходного кода оригинальной гадалки в открытом доступе нет, есть только описание алгоритма, по которому я сделал свою реализацию на TypeScrypt.

Демоверсия

Попробуйте набрать 50 очков и выиграть. Чтобы выбирать вариант с клавиатуры, кликните внутри серой рамки, а потом пользуйтесь клавишами "1" - нечет или "2" - чет.

Как Это работает

Математически алгоритм на странице сайта ltwood. Я рассмотрю простой пример, чтобы показать принцип.

В основе алгоритма находится популяция "демонов" - автоматов, которые на основании ходов игрока и предсказанных значениях выдают новое предсказание. Демонами управляет супервайзер. Задача супервайзера в том, чтобы опросить всех демонов, выбрать ответ от одного их них, а после получения ответа игрока пометить тех, кто выдал правильный ответ.

Алгоритм состоит из двух шагов:

предсказать следующих ход игрока;
учесть реальный ход игрока, добавив веса тому демону, который предугадал ход.

Рассмотрим работу на примере одного демона.

Пусть у нас есть демон, который смотрит на последний хода игрока и на свое последнее предсказание.

Строим два вектора:

[<1 ход демона>, <1 ход игрока>, 0]
[<1 ход демона>, <1 ход игрока>, 1]

В самом начале, когда у демона нет никакой информации о ходах игрока, эти векторы будут выглядеть как [0] и [1]. Но с накоплением данных, они всегда будут каждый по 5 элементов.

После чего смотрим, который из таких наборов в прошлом приносил победу чаще, и соответственно выбираем или вариант с 0, или с 1.

После получения действительного хода игрока, мы увеличиваем вес того набора, который оказался верным. И далее снова предсказываем ход.

Теперь с числами.

Ход 1

У демона нет информации, наборы [0] и [1] равнозначны, выбираем [0], а значит предсказываем ход игрока 0.

Игрок загадывал 1. Обновляем веса:

[0] = 0
[1] = 1

Ход 2

Строим векторы на основе последних ходов:

0: [0, 1, 0]
1: [0, 1, 1]

Для этих векторов тоже еще нет весов, так что снова выбираем первый, предсказываем 0.

Игрок снова выбрал 1. Обновляем веса (помним, что еще были прошлые вектора из одного элемента):

[0] = 0
[1] = 1
[0, 1, 0] = 0
[0, 1, 1] = 1

Ход 3

Картина такая же, как на втором ходу, но отличие в том, что у нас есть веса с прошлого хода:

0: [0, 1, 0] - 0
1: [0, 1, 1] - 1

Выбираем вариант 1, игрок снова выбирает 1. Предсказание удалось!

Расширение алгоритма

Это был самый элементарный вариант. Понятно, что на таком далеко не уедешь, и никого не обыграешь. Чтобы хорошо предугадывать ходы игроков, используется несколько демонов с разной величиной просматриваемой истории. Следит за ними "супервайзер", который ведет для каждого демона рейтинг. На основе этого рейтинга выбираются ответы тех демонов, которые были наиболее успешны в своих предсказаниях.

Ссылки

01.05.2019, anton@vakhrushev.me