Энтропия для смены режима рынка: точнее, чем моменты

Искусственный интеллект в науке и исследованияхBy 3L3C

Эмпирическая относительная энтропия помогает ловить смену режима рынка точнее моментных тестов. Разбираем, как калибровать пороги и применять в AI-стратегиях.

change-point detectionэнтропиястатистикаквантовые стратегиириск-менеджментфинансовые временные ряды
Share:

Featured image for Энтропия для смены режима рынка: точнее, чем моменты

Энтропия для смены режима рынка: точнее, чем моменты

Рынок редко «ломается» красиво. Чаще он меняет характер исподволь: распределения доходностей становятся толще в хвостах, волатильность перестаёт быть «шумом», а корреляции внезапно перестраиваются. Если ваша модель (или торговая система) ловит это с задержкой, вы платите спредом, проскальзыванием и ошибочным риском.

В декабре 2025 это особенно заметно: многие команды закрывают годовую отчётность и пересобирают риск‑лимиты на 2026. И вот тут неприятная правда: большинство практик мониторинга режима рынка до сих пор завязаны на моменты (среднее/дисперсия) или на «информационные критерии» в духе подгонки моделей. Это работает… пока распределение ведёт себя прилично.

Свежая работа Matthieu Garcin и Louis Perot (публикация на 18.12.2025) предлагает более строгую статистическую базу для подхода, который я считаю недооценённым в инвестициях: детектирование точек смены режима (change-point detection) через эмпирическую относительную энтропию. Суть не в том, что «энтропия умнее», а в том, что авторы дают то, чего не хватает практикам: понятные приближения распределения статистики — для асимптотики, для конечных выборок и для «предасимптотики», где на деле и живут финансовые данные.

Почему моментные тесты часто опаздывают

Короткий ответ: моменты видят лишь небольшую часть изменений; рынок меняется в хвостах и форме распределения, и там «среднее и дисперсия» могут молчать.

Классические методы офлайн‑детекции смены режима часто сравнивают два окна данных через:

  • разницу средних,
  • разницу дисперсий,
  • тесты на корреляцию/ковариацию,
  • критерии качества подгонки (AIC/BIC) для смены модели.

Проблема: реальные финансовые ряды (доходности, спрэды, объёмы, волатильность) меняются не только по среднему или дисперсии. Часто меняется форма:

  • усиливается асимметрия (skew),
  • утяжеляются хвосты (tail risk),
  • меняется вероятность экстремальных движений,
  • появляется «двугорбость» из-за смешения режимов.

Я видел это десятки раз на внутридневных данных: средняя доходность почти нулевая до и после события, дисперсия меняется умеренно — а вот хвосты и кластеры волатильности перестраиваются резко. Моментные методы либо не реагируют, либо реагируют поздно.

Относительная энтропия: что именно измеряем

Короткий ответ: относительная энтропия (дивергенция Кульбака–Лейблера) измеряет, насколько два распределения «не похожи», учитывая всю форму, а не отдельные показатели.

В контексте change-point detection идея простая: берём последовательность наблюдений и ищем момент времени, после которого распределение данных другое. Вместо того чтобы сравнивать только средние/дисперсии, можно сравнивать распределения целиком.

На практике используют эмпирическую относительную энтропию в двух основных постановках:

Одновыборочный вариант (one-sample)

Есть эталон/база (например, распределение «нормального» режима рынка) и текущее окно данных. Мы оцениваем, насколько текущее распределение ушло от базы.

Двухвыборочный вариант (two-sample)

Сравниваем два окна: «до» и «после» потенциальной точки смены режима. Это удобно, когда эталона нет или он нестабилен.

Главная ценность подхода: он чувствителен к изменениям в хвостах и нелинейным перестройкам, которые моментные тесты не обязаны замечать.

Практичная формулировка для инвестора: «Если рынок поменял правила игры, это почти всегда отражается в распределении. Энтропия это видит раньше, чем среднее и дисперсия».

Что нового в работе: распределения статистики и контроль ошибок

Короткий ответ: авторы выводят приближения распределения эмпирической относительной энтропии и дают инструменты, чтобы корректно выставлять пороги срабатывания — даже на небольших выборках.

Чтобы сделать из «меры похожести» реальный статистический тест, нужно понимать:

  1. как ведёт себя статистика при отсутствии смены режима (ложные срабатывания),
  2. как быстро она растёт при наличии смены (мощность теста),
  3. как выбирать пороги под заданный уровень значимости.

В статье разбираются сразу три слоя приближений, которые важны именно для финансовых данных:

1) Неравенства концентрации для конечных выборок

Это способ сказать: «на таком объёме данных статистика с высокой вероятностью не улетит слишком далеко». Для риск‑контроля это полезнее, чем голая асимптотика.

2) Асимптотические распределения

Да, «при большом n» статистика стремится к предсказуемому распределению. Но рынок редко даёт вам по-настоящему большие и независимые выборки (особенно если вы работаете с режимами, которые живут недели, а не годы).

3) Berry–Esseen оценки в предасимптотическом режиме

Вот здесь начинается самое интересное для практики. Berry–Esseen‑типа оценки отвечают на вопрос: насколько хорошо нормальное (или другое асимптотическое) приближение работает на конечном n.

Авторы предлагают новый подход к получению таких оценок для нелинейных функций суммарных статистик при определённых условиях выпуклости. Звучит академично, но смысл прикладной: вы получаете более честные границы ошибки аппроксимации, а значит — более надёжные пороги.

Почему это критично в инвестициях:

  • вы не хотите «переобученный алерт», который срабатывает каждый день;
  • но и не хотите пропустить смену режима, когда ликвидность испаряется или волатильность меняет масштаб.

Как встроить change-point detection на энтропии в AI-инвестиции

Короткий ответ: энтропийный детектор — это датчик режима. Он не заменяет модель, а переключает её настройки, риск и допущения.

В серии «Искусственный интеллект в науке и исследованиях» мы постоянно возвращаемся к одной мысли: ИИ ускоряет анализ данных, но качество решений упирается в статистический фундамент. Детектор смены режима — ровно такой фундаментальный модуль.

Ниже — рабочая схема, как я бы внедрял её в инвестиционном пайплайне.

Шаг 1. Определите, что вы мониторите

Вместо одной доходности полезно мониторить несколько рядов:

  • доходности инструмента/индекса,
  • реализованную/имплицитную волатильность,
  • спрэды и глубину стакана (если есть микро‑данные),
  • факторные доходности (value/momentum/quality и т.д.).

Чем богаче представление, тем чаще смена режима проявляется «раньше».

Шаг 2. Выберите one-sample или two-sample

  • One-sample подходит, если у вас есть стабильный «базовый» режим (например, последние 6–12 месяцев без крупных стрессов) и вы хотите ловить отклонения.
  • Two-sample чаще практичнее в реальном рынке: сравниваете два соседних окна и ищете точку разрыва.

Шаг 3. Настройте окна и протокол решения

Практическая настройка (как отправная точка):

  • короткое окно: 50–150 наблюдений (для дневных данных это 2–7 месяцев; для минутных — несколько часов/дней),
  • длинное окно: 200–500 наблюдений,
  • проверка смены режима раз в фиксированный интервал.

Смысл двух масштабов: короткое окно ловит быстрые переломы, длинное снижает шум.

Шаг 4. Привяжите срабатывание к действиям

Типичная ошибка — сделать «алерт ради алерта». Лучше заранее прописать, что меняется при детекте:

  • снижение плеча/лимитов,
  • переключение модели (например, с mean‑reversion на trend‑following),
  • изменение частоты ребалансировки,
  • увеличение требований к ликвидности,
  • более консервативные предположения о хвостовых рисках.

Хорошее правило: детектор режима должен менять деньги или риск, иначе он превращается в красивую метрику в отчёте.

Шаг 5. Валидация: не только accuracy, но и стоимость ошибок

Для change-point detection в финансах метрики «точность» часто бесполезны. Смотрите на:

  • частоту ложных срабатываний (в месяц/квартал),
  • среднюю задержку детекта после реального перелома,
  • PnL‑эффект от переключения режима,
  • worst-case сценарии: что будет, если детектор промолчит в стресс.

Именно здесь ценны конечновыборочные оценки и Berry–Esseen‑границы: они помогают калибровать пороги под реальный объём данных.

Мини-кейс: волатильность индексов и «невидимая» смена режима

Короткий ответ: режим может смениться без драматического роста дисперсии; меняется структура распределения и хвосты — энтропия это фиксирует.

Авторы иллюстрируют практическую релевантность на данных температуры и волатильности фондовых индексов. Для нас важнее второй кейс: волатильность — это не просто уровень, это распределение состояний.

Представьте, что индексная волатильность переходит из режима «плавные кластеры» в режим «частые всплески». Средний уровень может измениться умеренно, но:

  • возрастает доля экстремальных значений,
  • меняется асимметрия,
  • распределение становится более «рваным».

Если ваша система риска опирается на предположение «примерно нормального поведения» или на стабильность момента второго порядка, она недооценит вероятность серии плохих дней. Энтропийный подход как раз заточен на такие изменения формы.

Частые вопросы от команд, которые внедряют детекторы режимов

Это работает в реальном времени или только офлайн?

В статье акцент на офлайн‑детекции, но сама статистика и логика сравнения окон естественно переносится в online‑режим. На практике делают скользящие окна и обновляют оценку регулярно.

Не получится ли так, что энтропия будет «слишком чувствительной»?

Получится, если не калибровать пороги и не учитывать конечновыборочное поведение. Поэтому вклад авторов в приближения распределений и границы ошибок — не «математика ради математики», а способ удержать ложные срабатывания под контролем.

Можно ли комбинировать с нейросетями и агентами?

Да, и это одна из самых сильных связок:

  • детектор смены режима даёт сигнал контекста (state),
  • модель прогнозирования/политика (RL) меняет поведение в зависимости от режима,
  • риск‑менеджмент получает формальный триггер для ужесточения.

Что делать дальше, если вы строите AI-стратегии

Если ваша инвестиционная система уже использует ИИ (прогнозы, кластеризацию, RL, факторные модели), добавьте слой статистического мониторинга распределений. Это дешевле, чем кажется, и часто даёт больший эффект, чем очередной «улучшенный» модельный блок.

Я бы начал с пилота на одном-двух рынках: взять two-sample постановку, выбрать несколько сигналов (доходности, волатильность, ликвидность), откалибровать пороги на истории и проверить, как меняется поведение портфеля при переключении режима.

Финансовые данные никогда не будут идеальными, зато можно сделать другое: чётко управлять ошибками детекта и понимать, насколько вы доверяете сигналу на реальном размере выборки. Именно это и делает обсуждаемая работа ценной для прикладного AI в инвестициях.

Если рынок сменит режим в первые недели 2026 — вы хотите узнать об этом по распределению уже сегодня, а не по отчёту через месяц. На какой сигнал вы сейчас опираетесь — на моменты или на форму распределения?

🇷🇺 Энтропия для смены режима рынка: точнее, чем моменты - Russia | 3L3C