Собесов

Вероятность — монета: ОР против РР, кто чаще побеждает

Статистика и теорверЦепи Маркова и стратегииСложнаяSenior

Условие

Бросают монету. Первый игрок выигрывает, если первой выпадет последовательность ОР (Орёл-Решка). Второй — если РР (Решка-Решка). Броски продолжаются до выпадения одной из этих пар. Какова вероятность победы каждого?

Решение

Подход — система уравнений

Обозначим состояние «история последнего броска»:

  • S — старт (ничего не было).
  • O — последний бросок Орёл.
  • R — последний бросок Решка.

Пусть p — вероятность победы первого игрока, начиная из состояния S. Пусть q — из состояния O (последний был Орёл). Пусть r — из состояния R.

Уравнения

Из S бросаем монету: 50/50 → попадаем в O или R.

p = 1/2 · q + 1/2 · r

Из O (последний был Орёл):

  • Бросили Решку → пара ОР → первый победил → 1.
  • Бросили Орла → остаёмся в O.
q = 1/2 · 1 + 1/2 · q   ⇒   q = 1

Логика: если хотя бы раз выпал Орёл, то рано или поздно после него выпадет Решка → пара ОР появится раньше РР.

Из R (последний был Решка):

  • Бросили Решку → пара РР → второй победил → 0 (для первого).
  • Бросили Орла → переходим в O.
r = 1/2 · 0 + 1/2 · q = 1/2 · 1 = 1/2

Ответ

p = 1/2 · q + 1/2 · r = 1/2 · 1 + 1/2 · 1/2 = 1/2 + 1/4 = 3/4
Игрок Вероятность победы
ОР (первый) 3/4 = 75%
РР (второй) 1/4 = 25%

Интуиция (Penney's game)

Это классический парадокс «нет лучшей последовательности»: для любой 3-битной последовательности есть другая, которая её бьёт.

Здесь идея: если выпал хотя бы один Орёл, второй игрок (РР) проиграл — потому что сразу за Орлом неизбежно когда-нибудь выпадет Решка → ОР появится до того, как удастся собрать РР (которому нужны две подряд решки, не нарушенные орлами).

Симуляция

import random
def simulate(n=10**6):
    p1 = p2 = 0
    for _ in range(n):
        prev, curr = None, None
        while True:
            curr = random.choice('OR')
            if prev == 'O' and curr == 'R':
                p1 += 1; break
            if prev == 'R' and curr == 'R':
                p2 += 1; break
            prev = curr
    return p1 / n, p2 / n
# (~0.75, ~0.25)

Подводные камни

  1. «Шансы 50/50» — нет, асимметрия из-за структуры строк.
  2. «У РР есть преимущество — две одинаковые буквы» — нет, наоборот: длинные «полосы решек» сразу дают РР, но ОР гасит любую такую полосу появлением одной решки после орла.
  3. Не путать с независимыми бросками — здесь игра до первого появления пары, события зависимы по истории.

Эталонный ответ

Первый (ОР) побеждает с вероятностью 3/4, второй (РР) — 1/4.

Решение через систему: q = 1 (после Орла ОР неизбежен раньше РР), r = 1/2, p = 3/4.

Хочешь увидеть разбор?

Зарегистрируйся бесплатно — откроется развёрнутое решение этой задачи и ещё 4 на выбор.

Зарегистрироваться и увидеть разбор
Уже есть аккаунт? Войти