Статьи

Популярное изложение сути коинтеграции временных рядов.. Разность между коинтеграцией и корреляцией и их применением в торговле  финансовыми активами. Стационарные и нестационарные, а также нестационарные интегрированные временные ряды. Концепция использования коинтеграции в парном трейдинге и статистическом арбитраже. История вопроса. Для широкого круга читателей.

 

Содержание:

 

 Введение. Не прогуливайте уроки математики

"Ценность образования не в том, 

чтобы выучить как можно больше фактов. 

А в том, чтобы натренировать мозг думать"

Альберт Эйнштейн

 

Современному инвестору не уйти от навыков в математике. В трейдинге она везде. Ей пронизаны все финансовые рынки. Бесконечные массивы данных: котировки, доходности, индикаторы, осцилляторы, процентные ставки. Статистические закономерности и графическая информация. Кто умеет грамотно обрабатывать финансовые (и не только) сведения и получать на выходе корректные торговые сигналы - всегда на шаг впереди. 

Математики, физики, прежде всего, физики-теоретики уже давно обжились в  инвестиционных компаниях и хедж-фондах, Подобная кадровая политика, например, у лидера высокочастотного трейдинга Citadel LLC Кеннета Гриффина. В Renaissance Technologies LLC[1] дешифровщика кодов СССР времен холодной войны Джеймса Саймонса, вообще избегают нанимать кого-либо с “малейшим запахом Уолл-стрит”[2]. Вероятно такой подход к персоналу позволяет Renaissance Technologies показывать астрономическую доходность вложений в 66% (до уплаты налогов) за тридцать лет, 1988-2018 гг. 

К сожалению, одним курсом математического анализа, которым обычно ограничивается знакомство с высшей математикой в обычном ВТУЗе, не обойтись. Нужны знания, хотя бы начального характера, из теории вероятности и математической статистики. Не говоря уже об общих экономико-математических моментах. Особенно трудно гуманитариям, которые учили производные и интегралы только в старших классах средней школы. Если не прогуливали уроки математики. 

Одной из целей публикаций на нашем сайте является, своего рода, проведение ликбеза в данном направлении. Другими словами, толкование достаточно сложных вещей максимально простым языком, не теряя точности и последовательности изложения. 

Предлагаемый текст, посвященный коинтеграции временных рядов, из этой серии. Он развивает темы, затронутые в опубликованной ранее статье о временных рядах

 

Понятие коинтеграции и авторы идеи

Одно из определений коинтеграции звучит так.

“Коинтеграция — свойство нескольких нестационарных (интегрированных) временных рядов, заключающееся в существовании некоторой их стационарной линейной комбинации”[3].

Затрагиваются сразу несколько явлений, нашедших отражение в упомянутом выше материале о временных рядах. 

Итак, вспомним.

По наличии тенденции, временные ряды делятся на стационарные и нестационарные. Стационарный ряд отличается постоянством средних значений и их дисперсий. В нестационарном ряде максимум, что можно сделать - отследить его тренд.

Графическая иллюстрация некоего стационарного ряда приведена на заставке к статье. Здесь значения ряда колеблются вокруг нуля, вдоль горизонтальной линии, не отходя от нее более, чем на 1,5 единицы в обоих направлениях на протяжении от 0 до 500 единиц измерения времени по оси абсцисс. 

Нестационарные временные ряды - это почти все ценовые графики финансовых активов, столь широко знакомые любому трейдеру. Бычий тренд, медвежий тренд, экстремумы. Исключение составляет боковой дрейф курса на каком-то периоде. 

В особый класс нестационарных рядов выделяют интегрированные, они же разностно-стационарные или DS-ряды (англ. Difference Stationary). 

Для интерпретации интегрированного ряда вводят понятие разности k-го порядка. Под ней понимают новый ряд, каждый член которого равен разности i-го и (i-k)-го членов исходного ряда: Xi-X(i-k). Разность нулевого порядка трактуется, как сам исходный ряд, разность первого порядка - ряд с членами Xi-X(i-1) и т.д.

Если процедура взятия разности k-го порядка приводит к образованию стационарного ряда, при том, что все разности меньшего порядка давали только нестационарные ряды говорят, что мы имеем дело с интегрированным рядом k-го порядка. Обозначают ряд Xt〜I(k).

Подводя итог можно сказать, несколько перефразируя вышеприведенное определение, что 

коинтеграция рядов - возможность получения стационарного ряда через линейную комбинацию двух (или более) нестационарных интегрированных рядов. Главная мысль состоит в том, чтобы, применяя линейную зависимость, получить из нескольких нестационарных интегрированных рядов, стационарную зависимость.

Надеюсь, что вспоминать, что такое линейная комбинация нет нужды. На всякий случай, линейная функция по аргументу х имеет вид:

y=kx+b

(формула 1)

где: k - угловой коэффициент, b - свободный член.

График линейной зависимости - прямая линия, пересекающая ось абсцисс (ось Х) под углом наклона, тангенс которого равен угловому коэффициенту k.

Новое “коинтеграционное” направление в эконометрике было развито двумя экономистами - американцем Робертом Фраем Энглом III, Robert Fry Engle III (1942 г.р.) и англичанином, сэром Клайвом Уильямом Джоном Грэнджером, Clive William John Granger (1934-2009). Оба лауреаты Нобелевской премии по экономике 2003 года. 

 

1 КоинтЭнгл Грэнд

Р. Энгл (справа), К. Грэнджер (слева)

(“Прикладная эконометрика” ,2015 г.)

 

Р. Энгл получает Нобеля “за разработку метода анализа временных рядов в экономике на основе математической модели с авторегрессионной условной гетероскедастичностью (ARCH)”. Ученый уже упоминался у нас в разделе об ARCH и GARCH моделях статьи о временных рядах. 

К. Грэнджер удостаивается премии по экономике памяти А. Нобеля с прямой формулировкой: “За разработку метода коинтеграции для анализа временных рядов в экономике”[4]. Именно К. Грэнджер выступил пионером в области коинтеграции временных рядов, предложив концепцию еще в 1981 году. Автор знаменитого принципа “причинности по Грэнджеру”[5].

Заметный след в развитии темы оставил профессор Копенгагенского университета Сорен Йохансен, Søren Johansen (1939 г.р.)[6].

 

Корреляция, как смежное явление

Часто в литературе и в обмене мнениями коинтеграцию временных рядов сравнивают с корреляцией цен финансовых активов. Корреляции в теории вероятности и на финансовых рынках посвящен отдельный текст нашего ресурса. Для удобства дальнейшего восприятия сгруппируем в данном разделе ключевые моменты, относящиеся к теме корреляции.

Википедия[7] вводит понятие следующим образом.

“Корреляция или корреляционная зависимость - статистическая взаимосвязь двух или более случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом, изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин”.

Как-будто ясный на бытовом уровне термин “случайная величина” также имеет строгую математическую трактовку, приведенное в профильном материале нашего сайта.

Корреляция характеризуется знаком (положительная, отрицательная и нулевая) и степенью, интенсивностью, определяемой коэффициентом корреляции.

Характер знака корреляции хорошо виден на предлагаемом рисунке[8]:

 

2 КоинтКоррел 1

 

Положительная корреляция имеет место, когда одна случайная величина в среднем возрастает при увеличении другой, отрицательная - убывает, нулевая, нет ни той, ни иной тенденции.

Самый известный показатель корреляции - коэффициент корреляции Пирсона. 

Коэффициент корреляции Пирсона rxy двух случайных величин x и y рассчитывается так:

rxy=cov(xy)/(σxσy)

(формула 2)

где: cov(xy) - ковариация двух случайных величин x и y;                 

σx и σy - дисперсии x и y.

Что такое ковариация и дисперсия также можно понять из упомянутой выше статьи о введении в теорию вероятностей. 

У коэффициента корреляции Пирсона есть два замечательных свойства. Во-первых, по модулю он не превосходит 1. Во-вторых, равен нулю для независимых величин. Что понятно и на интуитивном уровне. Независимые величины никак не коррелируют друг с другом. 

Для более ясного, а может быть и более глубокого уяснения (тут, уж как кому) сути коэффициента приведем одну из формул для его вычисления:

3 КоинтФ 3

где: xi, yi - ряд значений (выборка) случайных величин x и y;

<X> и <Y> - средние значения (матожидания), обычно средние арифметические величин x и y.

Формула 3 позволяет наглядно увидеть, как выглядят и работают ковариация и дисперсия, что весьма полезно.

На практике нет необходимости выстраивать подобные суммы. Посчитать коэффициент корреляции Пирсона по силам и начинающему пользователю Excel. Сервис включает все необходимые статфункции.

В заключении раздела о корреляции отметим, что коэффициент корреляции Пирсона для случайных величин, связанных линейной зависимостью (формула 1) равен плюс или минус 1. Таким образом, имеем максимальную степень положительной или отрицательной корреляции (антикорреляции).

 

Корреляция в парном трейдинге

Википедия[9] определяет парный трейдинг, именно через корреляцию:

“Парный трейдинг- рыночно-нейтральная инвестиционная стратегия, основанная на использовании феномена корреляции стоимости некоторых ценных бумаг”.

Каковы этапы парного трейдинга с точки зрения корреляции активов (ценных бумаг, акций)?

1. Выявляются пары акций с высоким положительным коэффициентом корреляции. Высокая положительная корреляция обеспечит, в среднем, синхронное движение курсов пары акций.

2. В онлайн-режиме вычисляются Бета(β)-коэффициенты каждой акции по данному рынку (фондовому индексу) и спред между ценами акций.

3. По достижению размера спреда некоего, заранее принятого максимального значения  составляется рыночно-нейтральный (Бета-нейтральный) портфель.

Простейший Бета-нейтральный портфель из двух акций формируется путем открытия короткой позиции по переоцененной (более дорогой) акции и длинной - по недооцененной бумаге.

Доли (веса) акций в портфеле рассчитываются путем решения простейшей системы двух линейных уравнений:

4 КоинтКоррел 2

Очевидно, что у β1 и β2 разные знаки. Лонг по X1- β1>0, шорт по X2 - β2<0.

 

4. Позиции закрываются, когда спред уходит в нужный минимум, идеально в ноль или в минус.

Теоретически Бета-нейтральный портфель позволяет инвестору избежать рыночный риск и получать доходы на любом тренде. К сожалению, это совсем не Грааль, и запустить станок по печатанию денег (доходов) на фондовом рынке он вряд ли позволит. По крайней мере, на постоянной основе. Пара может и разойтись, несмотря на высокий, ранее выведенный коэффициент корреляции. Спред может болтаться довольно долго вне приемлемых минимумов и портфель не принесет ни цента дохода.

Аксиома: “Исторические данные не могут служить железным обоснованием будущих доходов” выбита “на камне” Предупреждений о рисках для клиентов в любой инвестиционной компании. Рыночно-нейтральные стратегии не исключение. 

 

Проверка на коинтеграцию

Использование коинтеграции стало очередной попыткой извлечения дохода, построенного на изучении динамического равновесия финансовых активов. Сторонники подхода считают, что он более тонок и полезен, чем классическая корреляция.

Как работает коинтеграция временных рядов (читай котировок акций) на фондовом рынке?

Заметим, как правило, коинтеграторы (назовем так последователей методики коинтеграции в практическом трейдинге) не идут глубже интегрированного ряда первого порядка. Ограничиваются разностями нулевого и первого порядков. 

Как уже отмечалось выше, при k=0  имеем сам ряд Xt , при k=1 получаем ряд:

5 КоинтФ 4

(формула 4)

где: L - лаговый оператор первого порядка (L1).

Ниже приведена последовательность исследования двух временных рядов Xt и Yt на коинтеграцию.

1. Анализируются на стационарность исходные ряды. Если они стационарны, то на этом все заканчивается. Коинтеграция тут ни к чему. Пусть ряды Xt и Yt нестационарны. 

2. Далее на стационарность тестируется разность первого порядка исходных рядов. Если она нестационарна, коинтеграторы также прекращают работать над таким сырьем. В том случае, когда разности первого порядка стационарны и получаются интегрированные ряды первого порядка I(1) (они еще называются нестационарными рядами со стационарными приращениями) процесс продолжается и переходит к пункту 3.

3. Составляется линейная комбинация:

yt-axtt

(формула 5)

где: εt - итог линейной комбинации, остаток (спред), новый ряд. Часто его  именуют ошибкой равновесия.

Формула 5 - простейший случай коинтеграционного уравнения, учитывающего связь только двух временных рядов. Бывает, что ее дополняют свободным членом - неотъемлемой компонентой линейной зависимости в полном виде (см. формулу 1). Для единообразия обозначим его тоже через b. Тогда формула 5 перейдет в формулу 6:

yt-axt-b=εt

(формула 6)

Иногда и ряд переменных yt умножают на некий коэффициент. 

Более сложные модели учитывают также составляющую линейного тренда, член вида c*t, где c - коэффициент тренда,  t - время. 

4. Конечной целью алгоритма является решение задачи о стационарности ряда εt. Здесь возникает вопрос о коэффициенте “а”. Его подбирают так, чтобы значения εt максимально близко лежали вокруг среднего нулевого уровня, другими словами, обладали минимальным разбросом (дисперсией) относительно него. Процедура получила название “коррекции ошибок”.

Для нее задействуют метод наименьших квадратов (МНК). Математики-статистики говорят: “Получают состоятельную оценку коэффициента “а”. 

Применение МНК по формуле 5 состоит в минимизации суммы:

∑εt2=∑(yt-axt)2

 t          t

(формула 7)

путем подбора коэффициента “а”. 

Для формулы 6 МНК работает следующим образом:

∑εt2=∑(yt-axt-b)2

 t          t

(формула 8)

5. Подобрав по МНК оптимальный коэффициент “а”, ряд εt проверяют на стационарность. В этих целях широко используется тест Дики-Фуллера[10,11]

Если ряд εt  - стационарный, вида I(0), то имеет место коинтеграция исходных нестационарных рядов (вида I(1)) Xt и Yt

Изложенное приблизительно укладывается в так называемый, тест Энгла-Грэнджера на коинтеграцию. Проведение теста возможно в пакете прикладных программ MATLAB[12]. При отработке коинтеграции трех и более рядов более уместен тест (подход) Йохансена[3]

Если исходные временные ряды Xt и Yt котировок акций признаются коинтегрированными, то они вполне готовы для парного трейдинга или статистического арбитража

 

Коинтеграция в парном трейдинге

Стационарность остатков εt - залог успеха коинтеграции в трейдинге. 

 

6 КоинтUT 1

(источник изображения - сайт UTMagazine)

 

Отклоняясь от среднего значения (от нуля), ряд остатков εt почти неизбежно (с высокой степенью вероятности) возвращается в нулевое состояние равновесия, что позволяет строить инвестиционные стратегии по столь хорошо известному принципу возврата к среднему. 

На практике работают не с εt, а с его стандартизированной оценкой (Z-оценкой, Standard Score, Z-score). Общепринятое в статистике измерение разброса случайной величины[13]:

Zt=εt/σ(εt)

(формула 9)

где: σ(εt) - среднеквадратичное (стандартное) отклонение остатков εt

Zt показывает, сколько стандартных отклонений случайной величины εt содержится в ней самой. Удобный, понятный и безразмерный (не имеющий размерности) показатель.

Пусть для нашей пары акций (рядов) yt и xt график Zt выглядит так:

 

7 КоинтUT 2

(источник изображения - сайт UTMagazine)

 

В торговле подобная графическая информация задействуется достаточно предсказуемо.

Исходя из того, что: εt=yt-axt (см. формулу 5), то, при:

  1. Ztt/σ(εt), превышающем, допустим +2 (предположим, что это верхняя красная пунктирная линия) следует открывать шорты по акции “y” и лонги по акции “x”.
  2. Zt<-2 (ниже нижнего красного пунктира) - переворачиваемся, покупаем акцию “y” и продаем акцию “x”.
  3. Zt пересекает ноль (средняя зеленая пунктирная линия) - закрываем позиции, открытые по пунктам 1 и 2. 

Важно, что коинтеграция тех или иных финансовых активов может работать на одних периодах и таймфреймах и не работать на других. Коэффициенты приведенных зависимостей (регрессий) и статпоказатели (дисперсии и пр.) должны периодически обновляться. Желательно, не реже, чем каждую торговую сессию. То есть “окно значений” величин необходимо сдвигать, как минимум, ежедневно. 

 

Заключение. Что еще почитать и вновь о математике

Все приведенное выше - не более, чем самое предварительное, весьма и весьма упрощенное знакомство с темой коинтеграции временных рядов и ее применения на финансовых рынках. Цель - вид на предмет “в первом приближении”. Разбудить любознательность и любопытство читателя. Предложить некую навигацию, вектор для дальнейшего углубленного изучения проблематики. 

Для более глубокого погружения в коинтеграцию полезно ознакомиться с первоисточником. В этом качестве можно рекомендовать, заслужившую большую популярность,  объемную статью непосредственно от авторов концепции Р. Энгла и К. Грэнджера “Коинтеграция и коррекция ошибок: представление, оценивание и тестирование” (“Co-Integration and Error Correction: Representation, Estimation, and Testing”), опубликованную в русском переводе в журнале “Прикладная эконометрика” в 2015 году.

Также полезной будет лекция о коинтеграции курса “Анализ временных рядов” Г.Г. Канторовича (не путать с советским академиком, Нобелевским лауреатом Л.В. Канторовичем) в “Экономическом журнале Высшей школы экономики (ВШЭ)” за 2003 год. 

Оба материала, выложенные в удобном PDF-формате доступны в сети. Особую ценность представляют опубликованные перечни литературы.

Конечно, для того, чтобы читать такие вещи нужен определенный уровень подготовки в математической статистике. Что ж… Главное - начать и не комплексовать. Как говорил процитированный в начале статьи Альберт Эйнштейн: “Не беспокойтесь о ваших трудностях в математике. Поверьте, мои все равно больше”. 

 

Владимир Наливайский

 

При подготовке статьи использованы материалы порталов UTMagazine и Habr.

Источник изображения на заставке статьи - сайт UTMagazine.

Примечания и ссылки (источник – Википедия/Wikipedia или авторский комментарий, если не оговорено иное).

  1. Под управлением $68 млрд, вторая позиция в перечне крупнейших хедж-фондов во II квартале 2019 г., “List of hedge funds”.
  2. “Renaissance Technologies”.
  3. “Коинтеграция”.
  4. “Список лауреатов премии по экономике памяти Альфреда Нобеля”
  5. “Причинность по Грэнджеру”.
  6. “Søren Johansen”.
  7. “Корреляция”, цитируется Википедией по “Общей теории статистики”, учебника под редакцией Р. Шмойловой, Москва, 2002.
  8. Е. Вентцель “Теория вероятностей”, Москва, 1999.
  9. “Парный трейдинг”.
  10. “Тест Дики-Фуллера”.
  11. Большинством экспертов ставится под сомнение корректность применение теста Дики-Фуллера для исследования коинтеграции в комплексе с МНК. В противовес ему используют, в частности, данные Маккиннона и Девидсона, полученные с помощью имитационного моделирования[3].
  12. “MATLAB”.
  13. “Z-оценка”.

Используемые сокращения

МНК - метод наименьших квадратов