Базовая формула: n = Z² × p × (1-p) / e² §
Классическая формула Cochran (1977) для расчёта размера выборки при оценке доли:
n = Z² × p × (1-p) / e²
Где:
- Z — z-score для выбранного уровня доверия (1.96 при 95%, 1.645 при 90%)
- p — ожидаемая доля ответов (0.5 — консервативное значение, максимизирует выборку)
- e — допустимая погрешность (0.05 = ±5%)
Подстановка стандартных значений:
n = 1.96² × 0.5 × 0.5 / 0.05²
n = 3.8416 × 0.25 / 0.0025
n = 384.16 ≈ 385
385 — это минимум для одной группы (тест или контроль). Brand Lift исследует две независимые группы, поэтому суммарный минимум составляет 770 завершённых интервью.
Важный нюанс: формула рассчитывает размер выборки для финальной базы. Если ожидаемый response rate анкеты составляет 80%, то рекрутировать нужно 385 / 0.8 = 482 человека на группу.
Что значит «95% confidence interval» и «margin ±5%» §
Confidence interval (доверительный интервал) — вероятность того, что истинное значение показателя (например, доля знающих бренд) попадает в рассчитанный диапазон. При 95% confidence и awareness 62% диапазон будет 62% ± 5% = от 57% до 67%.
Margin of error ±5% — это допустимая ширина этого диапазона. Если margin слишком велик (например, ±10%), разница между тест-группой и контролем становится неотличимой от погрешности.
Применительно к Brand Lift это означает следующее: если awareness в тест-группе 62%, а в контроле 58%, и margin = ±5%, то диапазоны групп перекрываются. Lift +4 п.п. в этом случае статистически незначим. Именно поэтому малые lift (1–3 п.п.) требуют большей выборки.
Детали о методологии контрольной и тестовой групп — в статье Контрольная и тестовая группы в Brand Lift.
На практике: 500–1000 респондентов на группу §
Три причины, по которым реальные исследования превышают теоретический минимум в 385:
1. Dropout rate. Средний процент незавершённых анкет в онлайн-исследованиях — 15–25%. При dropout rate 20% выборка 500 даёт 400 завершённых интервью — чуть выше минимума, но с буфером.
2. Отсев по качеству ответов. Speeders (слишком быстрые ответы), straight-liners (одинаковые ответы на все вопросы) и duplicate IDs исключаются. Потери: дополнительные 3–8% от базы.
3. Точность для малых lift. Lift в 2–3 п.п. по purchase intent требует большей выборки, чем lift в 12 п.п. по awareness. При ожидаемом lift 3 п.п. и baseline 25% минимальная выборка возрастает до ~900 на группу.
Стандарт Kantar и Nielsen для digital Brand Lift — 500 на группу как минимум, 800–1000 как целевое значение для основных метрик. Для сравнения: исследования, проводимые через крупные российские рекламные платформы, используют выборки 600–1200 на группу в зависимости от охвата кампании.
Когда нужна сегментация: 2000+ на группу §
| Сценарий | Min sample / группа | Что меряем |
|---|---|---|
| Базовый замер крупного lift (≥8 п.п.) | 385 | Только overall |
| Стандартный замер lift 2–3 п.п. | 500–1000 | Overall + крупная demo |
| Полная сегментация по demo/гео/frequency | 2000+ | Multi-cut analysis |
Сегментация требует, чтобы каждый подсегмент имел достаточную базу для самостоятельных выводов. Если анализируются 4 возрастные группы × 2 пола × 3 региона = 24 ячейки, то при выборке 1000 на группу средний размер ячейки составит ~42 человека. Это ниже порога надёжности.
Правило: для каждого сегмента, по которому планируется отдельный вывод, нужно не менее 100–150 завершённых интервью. При 6 ключевых сегментах минимальная база — 600–900 только для сегментации, плюс overhead на overall-анализ.
Подробнее о проектировании анкеты под сегментацию — в статье Как подготовить анкету Brand Lift.
Типичные ошибки расчёта выборки §
Ошибка 1: Расчёт от общего охвата, а не от числа завершённых интервью. Охват 1 000 000 пользователей не означает 1 000 000 потенциальных респондентов. Реальный отклик на опрос — 2–5% от показанных приглашений.
Ошибка 2: Игнорирование дизайн-эффекта. При использовании взвешивания (weighting) для коррекции демографического перекоса эффективная выборка уменьшается. Дизайн-эффект 1.2–1.5 — типичный диапазон. Фактически нужная выборка умножается на этот коэффициент.
Ошибка 3: Единая выборка на кампанию без разделения на волны. Если кампания длится 3 месяца и измерение проводится однократно постфактум, выборка не отражает динамику lift во времени. Рекомендуется минимум две волны: mid-campaign и post-campaign.
Ошибка 4: Постфактум-корректировка. Дозапись выборки после промежуточного результата с низкой значимостью — методологическая ошибка. Она повышает риск false positive (тип I ошибки). Правило: размер выборки фиксируется до старта исследования. Подробнее о статистической значимости — в разделе Методология Brand Lift.
Главное §
- Минимальный размер выборки для Brand Lift — 385 респондентов на группу при 95% confidence и margin of error ±5%.
- Формула расчёта — Cochran: n = Z² × p × (1−p) / e²; при стандартных значениях даёт 385 на группу.
- На практике используют 500–1000 на группу из-за dropout rate, отсева по качеству ответов и точности для малых lift.
- Полная сегментация по демографии, гео и частоте контакта требует 2000+ респондентов на группу.
- Каждый сегмент, по которому делается отдельный вывод, должен содержать минимум 100–150 завершённых интервью.
- Размер выборки фиксируется до старта кампании — постфактум-дозапись повышает риск false positive.
Что дальше §
- Методология контрольной и тестовой групп — Контрольная и тестовая группы
- Полный разбор Brand Lift отчёта — Что показывает Brand Lift отчёт
- Методология Brandlifts.ru и стандарты исследований — Методология