Базовая формула: n = Z² × p × (1-p) / e² §

Классическая формула Cochran (1977) для расчёта размера выборки при оценке доли:

n = Z² × p × (1-p) / e²

Где:

  • Z — z-score для выбранного уровня доверия (1.96 при 95%, 1.645 при 90%)
  • p — ожидаемая доля ответов (0.5 — консервативное значение, максимизирует выборку)
  • e — допустимая погрешность (0.05 = ±5%)

Подстановка стандартных значений:

n = 1.96² × 0.5 × 0.5 / 0.05²
n = 3.8416 × 0.25 / 0.0025
n = 384.16 ≈ 385

385 — это минимум для одной группы (тест или контроль). Brand Lift исследует две независимые группы, поэтому суммарный минимум составляет 770 завершённых интервью.

Важный нюанс: формула рассчитывает размер выборки для финальной базы. Если ожидаемый response rate анкеты составляет 80%, то рекрутировать нужно 385 / 0.8 = 482 человека на группу.


Что значит «95% confidence interval» и «margin ±5%» §

Confidence interval (доверительный интервал) — вероятность того, что истинное значение показателя (например, доля знающих бренд) попадает в рассчитанный диапазон. При 95% confidence и awareness 62% диапазон будет 62% ± 5% = от 57% до 67%.

Margin of error ±5% — это допустимая ширина этого диапазона. Если margin слишком велик (например, ±10%), разница между тест-группой и контролем становится неотличимой от погрешности.

Применительно к Brand Lift это означает следующее: если awareness в тест-группе 62%, а в контроле 58%, и margin = ±5%, то диапазоны групп перекрываются. Lift +4 п.п. в этом случае статистически незначим. Именно поэтому малые lift (1–3 п.п.) требуют большей выборки.

Детали о методологии контрольной и тестовой групп — в статье Контрольная и тестовая группы в Brand Lift.


На практике: 500–1000 респондентов на группу §

Три причины, по которым реальные исследования превышают теоретический минимум в 385:

1. Dropout rate. Средний процент незавершённых анкет в онлайн-исследованиях — 15–25%. При dropout rate 20% выборка 500 даёт 400 завершённых интервью — чуть выше минимума, но с буфером.

2. Отсев по качеству ответов. Speeders (слишком быстрые ответы), straight-liners (одинаковые ответы на все вопросы) и duplicate IDs исключаются. Потери: дополнительные 3–8% от базы.

3. Точность для малых lift. Lift в 2–3 п.п. по purchase intent требует большей выборки, чем lift в 12 п.п. по awareness. При ожидаемом lift 3 п.п. и baseline 25% минимальная выборка возрастает до ~900 на группу.

Стандарт Kantar и Nielsen для digital Brand Lift — 500 на группу как минимум, 800–1000 как целевое значение для основных метрик. Для сравнения: исследования, проводимые через крупные российские рекламные платформы, используют выборки 600–1200 на группу в зависимости от охвата кампании.


Когда нужна сегментация: 2000+ на группу §

СценарийMin sample / группаЧто меряем
Базовый замер крупного lift (≥8 п.п.)385Только overall
Стандартный замер lift 2–3 п.п.500–1000Overall + крупная demo
Полная сегментация по demo/гео/frequency2000+Multi-cut analysis

Сегментация требует, чтобы каждый подсегмент имел достаточную базу для самостоятельных выводов. Если анализируются 4 возрастные группы × 2 пола × 3 региона = 24 ячейки, то при выборке 1000 на группу средний размер ячейки составит ~42 человека. Это ниже порога надёжности.

Правило: для каждого сегмента, по которому планируется отдельный вывод, нужно не менее 100–150 завершённых интервью. При 6 ключевых сегментах минимальная база — 600–900 только для сегментации, плюс overhead на overall-анализ.

Подробнее о проектировании анкеты под сегментацию — в статье Как подготовить анкету Brand Lift.


Типичные ошибки расчёта выборки §

Ошибка 1: Расчёт от общего охвата, а не от числа завершённых интервью. Охват 1 000 000 пользователей не означает 1 000 000 потенциальных респондентов. Реальный отклик на опрос — 2–5% от показанных приглашений.

Ошибка 2: Игнорирование дизайн-эффекта. При использовании взвешивания (weighting) для коррекции демографического перекоса эффективная выборка уменьшается. Дизайн-эффект 1.2–1.5 — типичный диапазон. Фактически нужная выборка умножается на этот коэффициент.

Ошибка 3: Единая выборка на кампанию без разделения на волны. Если кампания длится 3 месяца и измерение проводится однократно постфактум, выборка не отражает динамику lift во времени. Рекомендуется минимум две волны: mid-campaign и post-campaign.

Ошибка 4: Постфактум-корректировка. Дозапись выборки после промежуточного результата с низкой значимостью — методологическая ошибка. Она повышает риск false positive (тип I ошибки). Правило: размер выборки фиксируется до старта исследования. Подробнее о статистической значимости — в разделе Методология Brand Lift.


Главное §

  • Минимальный размер выборки для Brand Lift — 385 респондентов на группу при 95% confidence и margin of error ±5%.
  • Формула расчёта — Cochran: n = Z² × p × (1−p) / e²; при стандартных значениях даёт 385 на группу.
  • На практике используют 500–1000 на группу из-за dropout rate, отсева по качеству ответов и точности для малых lift.
  • Полная сегментация по демографии, гео и частоте контакта требует 2000+ респондентов на группу.
  • Каждый сегмент, по которому делается отдельный вывод, должен содержать минимум 100–150 завершённых интервью.
  • Размер выборки фиксируется до старта кампании — постфактум-дозапись повышает риск false positive.

Что дальше §