Применение математических моделей ARIMA, SARIMA и GARCH в трейдинге

·

·

4

мин.

ARIMA-2

В большинстве случаев обычные трейдеры математический аппарат в трейдинге не используют. Высшую математику и статистику учат далеко не все, кто учил – скорее всего почти все уже забыл. Да и без математики у рядового трейдера достаточно технических инструментов и аналитики для анализа, тем более когда многие руководствуются интуицией и везением.

Аналитические порталы, чьи прогнозы по разным активам можно видеть в интернете, инвестиционные фонды наоборот чаще всего работают именно по математическим моделям. Они более точно описывают долгосрочные закономерности, сглаживая локальный ценовой шум.

Например, один из аналитических порталов (инсайдерская информация, потому без конкретики) изначально использовал для помесячных и годовых прогнозов волновую модель Эллиотта. все, что было в прошлом, повторится в будущем. Динамика изменения цены в январе 2024 года переносилась на прогноз января 2025 года. То есть, насколько выросла цена в январе 2024, на столько же она вырастет в январе 2025. Аналогично переносились данные по годам.

У этой модели оказалось несколько существенных недостатков:

  • Для прогноза по акциям физически не было годовых данных. Если компания вышла на IPO только в 2021 году, данные были только за 2021-2024 года.
  • Возник вопрос: в абсолютных или относительных значениях считать динамику? По логике – в процентах. Но возникла проблема. 100 USD роста в январе 2024 года относительно цены в 100 USD – 100%. И когда цена в декабре 2024 года составляла уже 500 USD, прогноз на январь составлял +100%, то есть 1000 USD. Такая проблема возникла на быстрорастущих акциях (Nvidia, MicroStrategy) и криптовалютах.
  • Модель использования абсолютных значений также оказалась неуниверсальной. Логично было бы для прогноза на январь 2025 к 500 USD добавить не 100%, а 100 USD. Но «вылезла» ошибка для криптовалют с небольшой ценой и резким падением – они ушли в отрицательную зону.

Было принято решение перейти к более профессиональным математическим моделям прогнозирования. И с помощью ChatGPT была построена модель ARIMA.

Задача этого обзора – познакомить вас с математическими прогнозными моделями в общих чертах. Чтобы вы помнили об их существовании, понимали их общую суть и при желании открыли для себя новый полезный инструмент.

1. ARIMA (Autoregressive Integrated Moving Average)

Суть модели:

  • Идея: текущее значение цены зависит от ее предыдущих значений (авторегрессия) и от прошлых ошибок прогноза (скользящее среднее). ARIMA моделирует временной ряд как комбинацию автопрогрессии (зависимости текущего значения от предыдущих), интегрированного (преобразование данных для обеспечения стационарности) и скользящего среднего (учет прошлых ошибок прогнозирования).
  • Зачем нужна интеграция: многие финансовые временные ряды не являются стационарными (их среднее, дисперсия меняются со временем). Применяя дифференцирование (вычитание предыдущего значения), ряд приводят к стационарному виду, что упрощает прогнозирование.

Как строится модель (общие этапы):

  1. Предварительный анализ: проверяется стационарность временного ряда (например, с помощью теста Дики–Фуллера).

Если ряд не стационарен, применяют дифференцирование (вычитание предыдущего значения) один или несколько раз.

2. Определение параметров:

Модель ARIMA(p, d, q) объединяет в себе три компонента: авторегрессию, интегрирование и скользящее среднее:

  • p (авторегрессия): число предыдущих значений, которые влияют на текущее значение.
  • d (интегрированная часть): количество раз, когда применяли дифференцирование для достижения стационарности.
  • q (скользящее среднее): количество прошлых ошибок, влияющих на текущее значение.

Эти параметры часто выбирают на основе анализа автокорреляционной (ACF) и частичной автокорреляционной (PACF) функций.

3. Оценка модели: используя исторические данные, с помощью методов, таких как метод максимального правдоподобия или наименьших квадратов, оценивают коэффициенты модели.

4. Диагностика: анализируются данные (разница между предсказанными и фактическими значениями) на предмет случайного характера, чтобы убедиться в корректности модели.

5. Прогнозирование: после валидации модель используется для предсказания будущих значений временного ряда.

Преимущества: простота реализации и интерпретации (в аналитическом ПО есть готовые шаблоны). Хорошо работает при наличии линейных зависимостей. Универсальность: модель может применяться к различным финансовым инструментам при условии стационарности ряда.

Недостатки: ограниченность для нелинейных зависимостей. Трудности в подборе оптимальных параметров. Неэффективность при наличии ярко выраженной сезонности или структурных сдвигов в данных.

2. SARIMA (Seasonal ARIMA)

Суть модели:

  • Идея: SARIMA расширяет модель ARIMA, добавляя компоненты, учитывающие сезонные (периодические) колебания временного ряда.
  • Сезонные компоненты: помимо стандартных параметров (p, d, q), модель включает параметры для сезонной части: PPP (авторегрессия для сезона), DDD (степень сезонного дифференцирования), QQQ (скользящее среднее для сезона) и сезонный период sss (например, 7 для недельной сезонности или 12 для месячной).

Как строится модель (общие этапы):

  1. Идентификация сезонности: анализируются данные на наличие повторяющихся паттернов (например, сезонные пики и спады).
  2. Сезонное дифференцирование: для устранения сезонного тренда применяется разностное преобразование с периодом sss.
  3. Определение параметров: проводится анализ как для не сезонной части (p, d, q), так и для сезонной (P, D, Q) с использованием графических методов (ACF и PACF).
  4. Оценка и диагностика модели: после оценки параметров проводится проверка случайности остатков для обоих компонентов.
  5. Прогнозирование: модель используется для прогноза будущих значений с учетом сезонных колебаний.

Преимущества: эффективно учитывает регулярные сезонные изменения, что может существенно повысить точность прогнозов. Полезна для инструментов, где наблюдаются явные сезонные паттерны (например, сезонные колебания в ценах на сырьевые товары или акции компаний с ярко выраженными отчетными периодами).

Недостатки: усложнение модели за счет добавления дополнительных параметров. Требует наличия длительной исторической выборки для корректной идентификации сезонности.

3. GARCH (Generalized Autoregressive Conditional Heteroskedasticity)

Суть модели:

  • Идея: GARCH-модель направлена не на прогнозирование самих цен, а на оценку волатильности – степени изменчивости цен.
  • Волатильность: в финансовых рынках наблюдается явление «скопления волатильности»: периоды сильных колебаний сменяются периодами относительного спокойствия. GARCH помогает моделировать такую изменчивость.

Как строится модель (общие этапы):

  1. Анализ базовой модели: обычно сначала строят модель для средних значений (например, ARIMA для доходностей), чтобы выделить «шум» (остатки).
  2. Построение модели для дисперсии: модель предполагает, что текущая волатильность (дисперсия ошибок) зависит от предыдущих ошибок (например, квадрат прошлой ошибки) и от предыдущей волатильности.

Типичная формула (без углубления в математику):

3. Оценка параметров: используется метод максимального правдоподобия для оценки параметров модели.

4. Диагностика: проверяется, насколько модель корректно описывает волатильность, и анализируются остатки.

5. Прогнозирование волатильности: на основе модели прогнозируется изменение дисперсии, что позволяет оценить будущий риск.

Преимущества: позволяет учитывать и прогнозировать волатильность, что особенно важно для управления рисками. Применима для расчета показателей риска (например, Value at Risk – VaR). Может быть использована для оценки поведения волатильности, что полезно для деривативов и опционных стратегий.

Недостатки: модель ориентирована исключительно на волатильность, а не на уровень цен. Подбор правильного порядка модели может быть нетривиальной задачей. Допущения модели (например, нормальное распределение ошибок) могут не всегда отражать реальное поведение финансовых данных.

Вывод.

Каждая из рассмотренных моделей обладает своими особенностями и применяется в трейдинге в зависимости от цели анализа:

  • ARIMA: оптимальна для прогнозирования трендов и уровней цен, если данные можно привести к стационарному виду.
  • SARIMA: расширяет возможности ARIMA, позволяя учитывать сезонные эффекты – полезно для активов с выраженной периодичностью.
  • GARCH: делает акцент на прогнозировании волатильности, что является ключевым аспектом в управлении рисками и ценообразовании деривативов.

Ни одна модель не является универсальной. Финансовые рынки подвержены воздействию множества факторов, и прогнозы, основанные только на исторических данных, всегда имеют неопределенность. Поэтому в практической торговле часто используют комплексный подход, сочетая статистический анализ с фундаментальными и техническими исследованиями.