В последнее десятилетие государственное управление всё чаще ссылается на показатели субъективного благополучия (SWB) как на конечную цель политики — наряду с ВВП на душу населения и продолжительностью жизни. Россия не исключение: в Указе Президента РФ № 474 от 21.07.2020 «удовлетворённость качеством жизни» включена в перечень национальных целей, а Минэкономразвития ежегодно публикует индекс качества городской среды, в котором SWB-показатели играют значимую роль. Но инструменты, на которые опираются эти решения, в большинстве своём остаются неизменными с 1980-х годов.
В настоящей статье мы систематизируем критику опросных методик SWB, обобщаем накопленный международный опыт перехода к инструментам реального времени и представляем результаты пилотного исследования, проведённого в Новосибирске в первом квартале 2025 года.
Что мы измеряем, когда измеряем благополучие
В академической литературе принято различать три компонента SWB [1]: оценочный (life satisfaction — ретроспективная оценка жизни в целом), аффективный (баланс положительных и отрицательных эмоций в реальном времени), эвдемонический (смысл, цель, реализация). Каждый компонент требует отдельного инструмента.
Наиболее распространённые шкалы:
- Cantril Self-Anchoring Ladder (1965) — одна шкала от 0 до 10, респондент сам определяет «лучшую» и «худшую» жизнь. Используется в Gallup World Poll и в World Happiness Report.
- Satisfaction With Life Scale (SWLS) Дайнера (1985) — пять утверждений по шкале Лайкерта. Психометрически наиболее проработана.
- PANAS (Watson, Clark, Tellegen, 1988) — раздельная фиксация позитивного и негативного аффекта.
- WHO-5 (1998) — краткая клиническая шкала, чувствительная к депрессивным состояниям.
- Индекс счастья ВЦИОМ — разница долей счастливых и несчастливых респондентов; используется в России с 1990 года.
В опросной практике эти инструменты часто смешиваются: один вопрос об удовлетворённости жизнью соседствует с вопросом о настроении «сейчас», что приводит к систематическим смещениям, описанным ниже.
Четыре проблемы опросных шкал
Эффект референтной группы
Классический результат Истерлина [2] показал, что в долгосрочной перспективе рост дохода в стране слабо связан с ростом средней удовлетворённости жизнью. Объяснение — калибровка шкалы: респондент сравнивает себя с референтной группой, и при общем росте благосостояния референтная планка смещается. Иначе говоря, шкала «10 баллов» в 1990 году и в 2025 году — это разные количества блага. Любое сравнение во времени без коррекции на референтный эффект искажено.
Социокультурное смещение
Сравнительные исследования [3] фиксируют устойчивое отставание восточноевропейских стран и России от западноевропейских аналогов на World Happiness Report (Россия в 2024 году — 72-е место с показателем 5,68; для сравнения — Финляндия 7,74). Часть разрыва объясняется реальной разницей в качестве жизни, но значительная часть — культурной нормой: в русскоязычной культурной традиции прямое объявление «у меня всё отлично» считается неуместным и потенциально несущим риск (классическое «не сглазить»). Эксперимент Inglehart и Klingemann показал, что коррекция на культурный фактор сужает разрыв на 25–30%.
Ретроспективное искажение
Канеман и Крюгер [4] на большой выборке американских домохозяйств показали, что ответ на вопрос «насколько вы удовлетворены жизнью в целом» определяется не интегралом эмоций за период, а пиковыми событиями («peak-end rule»). Респондент, у которого был один яркий неудачный эпизод, занижает оценку всего месяца. Это критично для решения, основанного на этих данных: политика, направленная на общее повышение SWB, и политика, направленная на устранение пиковых негативных эпизодов — это разные политики.
Однопозиционное измерение
Наиболее популярная Cantril Ladder использует один вопрос. С позиции психометрики этого недостаточно для устойчивой оценки латентного признака. Рекомендуется минимум 5–7 пунктов с последующим расчётом композитного индекса (как в SWLS). На практике 70% муниципальных опросов в РФ опираются на 1–2 пункта.
«Шкала, которой мы измеряем благополучие, сама становится частью того, что мы измеряем». — М. ВУЛЛИНГС, ВЕДУЩИЙ ИССЛЕДОВАТЕЛЬ OECD WELL-BEING
Российский контекст: RLMS-HSE и муниципальная практика
Российский мониторинг экономики и здоровья населения НИУ ВШЭ (RLMS-HSE) ведётся с 1992 года и остаётся самым длинным панельным исследованием благополучия в стране. Ключевая SWB-переменная (m20) формулируется как «насколько вы удовлетворены своей жизнью в целом», шкала 1–5. Данные RLMS-HSE [5] показывают, что:
- средняя удовлетворённость выросла с 2,8 в 1995 до 3,7 в 2023;
- наиболее сильный предиктор — здоровье (β = 0,42), затем — семейное положение (β = 0,28), доход (β = 0,21), занятость (β = 0,17);
- коэффициент U-shape по возрасту в России менее выражен, чем в США и ЕС: в кросс-секции российская модель ближе к линейному убыванию с возрастом.
На муниципальном уровне инструментарий разнороднее. Минэкономразвития РФ для индекса качества городской среды (ИКГС) использует 36 показателей, из которых субъективными являются 4: безопасность, чистота, благоустроенность дворов, доступность объектов. ВЦИОМ ведёт ежемесячный «Индекс счастья» с 1990 года, в 2024 году значение составило +66 пунктов [6] — исторический максимум, что входит в противоречие с показателями RLMS и World Happiness Report и иллюстрирует расхождение методик.
Новые инструменты: измерение в реальном времени
Experience Sampling Method (ESM)
Метод множественной выборки опыта — случайные напоминания в течение дня (5–8 в день) с коротким опросом «что вы делаете сейчас» и «как чувствуете себя по шкале». Реализуется через мобильное приложение. Преимущество — фиксация аффекта в момент возникновения, без ретроспективной реконструкции. Ограничение — участие требует мотивации, отсев участников за 14 дней может достигать 35%.
Day Reconstruction Method (DRM)
Канеман и коллеги (2004) предложили компромисс: респондент в конце дня структурирует прошедший день в «эпизоды» (15–20 типичных) и для каждого фиксирует тип активности и эмоциональный профиль. DRM значительно дешевле ESM, при этом удерживает гранулярность по ситуациям и временам суток. На DRM построен U-index — доля времени, проведённого в неприятном состоянии (отрицательный аффект превалирует над положительным). U-index лучше дискриминирует регионы и демографические группы, чем интегральная life-satisfaction.
Пассивная мобильная аналитика
Современные смартфоны фиксируют десятки косвенных индикаторов состояния: продолжительность сна, физическая активность, частота сердечных сокращений (если есть носимое устройство), социальные контакты, географическое перемещение, паттерны использования приложений. В ряде исследований [7] показано, что комбинация этих переменных даёт оценку текущего эмоционального состояния с точностью 0,68–0,74 (AUC ROC). Главный вызов — приватность и информированное согласие.
Анализ языка и цифровых следов
На уровне популяции возможна оценка SWB по текстам в социальных сетях с применением моделей сентимент-анализа, обученных на размеченных русскоязычных корпусах. Подход страдает от sampling bias (демографическая неоднородность пользователей), но даёт ежедневный временной ряд по любому географическому срезу. Хорошо подходит как ранний индикатор резких изменений (например, после введения локдаунов в 2020 году динамика негативного аффекта в текстах опередила динамику в опросах на 3–4 недели).
Пилотное исследование: Новосибирск, Q1 2025
В партнёрстве с НГУ и при поддержке Минэкономразвития Новосибирской области мы провели гибридное измерение SWB на выборке 412 человек, 18–65 лет, четыре района Новосибирска. Дизайн:
- Стандартная батарея SWLS + Cantril Ladder в день 0.
- DRM-протокол на 14 дней через мобильное приложение, разработанное командой.
- Пассивная аналитика геоданных и двигательной активности (с информированным согласием).
- Повторный замер SWLS на день 15.
Ключевые результаты:
Таблица 1. Расхождение между опросной и DRM-оценкой
| Подгруппа | SWLS (день 0) | U-index (DRM) | Корреляция |
|---|---|---|---|
| Все участники | 3,42 | 17,3% | −0,38 |
| Мужчины 25–45 | 3,51 | 14,8% | −0,44 |
| Женщины 25–45 | 3,29 | 21,1% | −0,29 |
| Старше 55 лет | 3,48 | 16,2% | −0,52 |
Корреляция между SWLS и U-index составила −0,38 (умеренная по модулю), что означает: почти 85% индивидуальной вариации не объясняется одной из шкал через другую. Это сильное подтверждение тезиса о многомерности SWB и недопустимости опоры на единственный инструмент.
Для женщин 25–45 расхождение оказалось наиболее выраженным: при средней самооценке выше нейтральной отметки реальная доля «неприятного» времени почти в 1,5 раза выше, чем у мужчин той же возрастной группы. Качественный анализ DRM-эпизодов показал, что причина — перегруженность бытовыми и уход-обусловленными эпизодами (children, elder care).
Что это значит для государственной политики
Из нашего пилота и обзора литературы вытекают четыре конкретных рекомендации для исполнительной власти, формирующей политику в области качества жизни.
- Никогда не опираться на один инструмент. Минимум — SWLS (оценочный компонент) + PANAS-C (аффективный) + один эвдемонический пункт. Композитный индекс рассчитывать после стандартизации.
- Обеспечить временную сопоставимость. Сопоставлять только данные одной методики и одного полевого подрядчика. При смене методики — переходный период с двойным измерением минимум 18 месяцев.
- Включать DRM-измерения для целевых групп. Для приоритетных категорий (родители маленьких детей, лица старше 65, жители удалённых территорий) добавлять DRM-протокол с частотой раз в два года. Стоимость — около 1 800 руб. на участника против 320 руб. за стандартный опрос; но информационная ценность несопоставимо выше.
- Отделять политику снижения «провалов» от политики повышения «среднего». Снижение U-index требует устранения регулярных стрессоров (транспорт, очереди в поликлиниках, бытовая нагрузка), повышение SWLS — достижений и статусных маркеров. Это разные бюджеты и разные исполнители.
Ограничения и направления дальнейшей работы
Наш пилот ограничен одним городом и 14-дневным окном. Сезонность и долгосрочные эффекты не тестировались. Не применялись эвдемонические шкалы (Ryff PWBS), которые могли бы добавить третье измерение анализа. Совместно с ЦСП «Платформа» и НИУ ВШЭ команда планирует расширение на три города с разной структурой экономики (Тюмень, Иваново, Махачкала) в 2026 году.
Отдельная задача — калибровка переходов между методиками. Существующие административные данные собираются десятилетиями по старым шкалам. Чтобы новые инструменты не обнулили накопленную панель, требуется построение системы перевода — как минимум на уровне квантилей распределений, а при возможности — через двойное измерение в течение 1–2 циклов опроса.
Заключение
Опросные шкалы благополучия не следует отбрасывать — они дёшевы, привычны для респондентов и дают сравнимые временные ряды. Но использовать их как единственный источник для решения, которое затрагивает миллионы людей, методологически некорректно. Сегодня доступны более точные инструменты — DRM, мобильная аналитика, цифровые следы. Их операционная стоимость снижается, а интерпретационная ясность — растёт. Государство, которое включит эти инструменты в систему мониторинга в ближайшие 2–3 года, получит существенное преимущество в качестве принимаемых решений.
В конечном счёте, мы возвращаемся к тезису, который лежит в основе всей нашей работы: наука — это инструмент, который меняет организации и города. Но только если её инструменты остаются откалиброванными к реальности, которую они должны описывать.