Условие
В корзине 85 чёрных и 15 красных мячей. Мяч достаём, фиксируем цвет, возвращаем обратно. 100 повторений. Оценить 95%-доверительный интервал количества вытянутых красных мячей. Указать левую (наименьшую) границу, округлённую вниз.
Решение
Подход
Возврат с заменой → биномиальное распределение X ~ Binomial(n=100, p=0.15).
E[X] = n·p = 100·0.15 = 15.Var(X) = n·p·(1−p) = 100·0.15·0.85 = 12.75.SD(X) = √12.75 ≈ 3.5707.
При n·p ≥ 5 и n·(1−p) ≥ 5 нормальная аппроксимация работает:
X ≈ Normal(15, 3.5707)
95% доверительный интервал по нормальному:
[μ − 1.96·σ , μ + 1.96·σ] = [15 − 6.998 , 15 + 6.998] = [8.002 , 21.998]
Округление вниз
8.002 → 8.
Реализация в Python
import math
from scipy.stats import norm, binom
n, p = 100, 0.15
mu = n * p
sigma = math.sqrt(n * p * (1 - p))
z = norm.ppf(0.975) # 1.96
lo = mu - z * sigma # 8.002...
hi = mu + z * sigma # 21.998...
print(math.floor(lo), math.ceil(hi)) # 8, 22
# Точнее - через биномиальные квантили
print(binom.ppf(0.025, n, p), binom.ppf(0.975, n, p)) # 8.0, 22.0Ответ
Левая граница = 8 (с округлением вниз 8.002).
Подводные камни
- С возвратом / без возврата. При без возврата распределение — гипергеометрическое, дисперсия меньше. Здесь явно «возвращаем» → биномиальное.
- Какой интервал. Существует доверительный интервал параметра (Wilson, Clopper–Pearson) и prediction interval для случайной величины. Здесь нужен второй: интервал самого числа, а не оценки
p. - Нормальная аппроксимация vs точный. При больших
nиpне у краёв оба совпадают. Здесьn·p=15— нормальная работает. - Округление. «Вниз» — это
floor, а не «по правилу банка». 8.002 → 8. - «Левая граница 1.96σ» — это для двустороннего 95%. Если задача про одностороннюю —
z = 1.645.
Эталонный ответ
X ~ Bin(100, 0.15) → μ=15, σ≈3.57 → 95% prediction interval [8.00, 22.00]. Левая граница, округлённая вниз: 8.