Статьи

Вводный материал о временных рядах. Адаптированный перевод[1] статьи “Beginner's Guide to Time Series Analysis” ресурса Quantstart.

 

Содержание:

 

Предисловие переводчика

Текст продолжает серию публикаций переводов-рерайтов по различным аспектам алготрейдинга от сайта Quantstart.

В этом цикле смотрите:

Наш сайт уделяет значительное внимание теме временных рядов в трейдинге. Здесь можно упомянуть базовую, развернутую статью Временные ряды, а также Введение в коинтеграцию временных рядов. Предлагаемый материал - своего рода, памятка по анализу временных рядов для новичков от автора ресурса Quantstart, 

Изложение от первого лица.

 

Что такое анализ временных рядов

Под временным рядом (Time Series) понимается величина, последовательно измеряемая во времени в течение некоторого интервала.

В самом широком смысле, анализ временных рядов заключается в том, чтобы сделать вывод о том, что произошло с линейкой данных в прошлом, и попытаться предсказать, что с ними произойдет в будущем.

Мы собираемся применить количественный статистический подход к временным рядам, сформированный на реализации последовательности случайных величин. Будем исходить из того, что существует некий базовый процесс генерации для временных рядов на основе одного или нескольких статистических распределений из которых взяты эти переменные.

Исследователь временных рядов пытается понять прошлое и предсказать будущее.

Такая последовательность случайных величин известна как стохастический процесс с дискретным временем (Discrete-Time Stochastic Process, DTSP). В количественной торговле мы стремимся подогнать статистические модели к DTSP, чтобы вывести главные взаимосвязи между рядами или предсказать будущие значения для торговых сигналов.

Временным рядам в целом, в том числе и не относящимся к финансовой сфере, присущи следующие особенности:

  • Тенденция, тренд. Последовательное направленное движение во временном ряде. Может быть детерминированным или стохастическим. Первое позволяет понять ключевой вид тенденции <рост или убывание>[2], второе - случайные, трудно объяснимые особенности ряда. Пример тенденции в  финансовых рядах - цены на сырьевые товары. Фонды Commodity Trading Advisor (CTA) используют сложные модели идентификации тренда в своих торговых алгоритмах.
  • Сезонная вариация. Многие временные ряды содержат сезонную компоненту. Наиболее ярко это проявляется в коммерческих продажах или смене погодных условий. В количественном финансировании мы видим сезонные колебания в товарах, подверженных вегетационным периодам или годовым изменениям температуры (допустим - природный газ).
  • Серийная зависимость. Одна из наиболее важных характеристик временных рядов, особенно финансовых. Выражается в том, что данные временного ряда, близкие друг к другу по времени, имеют тенденцию к корреляции. Кластеризация волатильности - один из аспектов серийной корреляции, который крайне важен в количественной торговле.

 

Как применяется анализ временных рядов в количественных финансах

Наша цель как количественных аналитиков, задействуя методы статистических временных рядов, выявить тенденции, сезонные колебания и корреляцию. Цель - создание на их основе фильтров и торговых сигналов.

Базовые направления:

  • Прогнозирование будущих значений. Для успешной торговли необходимо точно предвидеть будущие цены на активы, по крайней мере, в статистическом смысле.
  • Моделирование рядов. Как только мы определим статистические свойства финансовых временных рядов, мы сможем использовать их для моделирования будущих сценариев. Это позволяет оценить количество сделок, ожидаемые торговые издержки, профиль будущей доходности, технические и финансовые инвестиции в инфраструктуру, и, как следствие - профиль показателя доходность/риск конкретной стратегии или портфеля.
  • Определение взаимосвязей между временными рядами и другими количественными характеристиками для улучшения торговых сигналов с помощью фильтров. Например, если мы изучим как спред в валютной паре изменяется в зависимости от объема спроса/предложения, то получим шанс фильтровать сделки, происходящие в период широкого спреда, для снижения транзакционных издержек.

Кроме того, можно применять стандартные статистические тесты к моделям временных рядов для оценки влияния смены ситуации на фондовом рынке и иных внешних факторов.

 

Программное обеспечение анализа временных рядов

На сегодняшний день для реализации наших торговых стратегий мы почти исключительно пишем на C ++ и Python. Оба языка представляют собой “первоклассные среды” для создания всего торгового стека. Оба содержат множество библиотек и позволяют “сквозное” построение торговой системы только на этих языках.

К сожалению, C ++ и Python не обладают обширными статистическими библиотеками. Это один из их недостатков. Для исследования временных рядов мы предпочтем статистическую среду R. Преимущество R - наличие полноценных библиотек временных рядов, широкая адаптация в статметодах и возможности простого построения графиков.

<Вставка переводчика>

Из Википедии:

R - язык программирования для статистической обработки данных и работы с графикой, а также свободная программная среда вычислений с открытым исходным кодом в рамках проекта GNU (Unix-подобной операционной системы).

 

Дорожная карта в изучении временных рядов от QuantStart

Корреляция. Абсолютно фундаментальным аспектом моделирования временных рядов является концепция последовательной корреляции. Отмечу, что корреляция далеко не всегда подразумевает причинно-следственную связь.

Прогнозирование будущего направления и/или числовых уровней временного ряда.

Стохастические модели, включая модели с белым шумом и авторегрессионные модели.

Регрессия. Имеет место при наличии детерминированных (не стохастических) тенденций в рядах данных, с их экстраполяцией через регрессионные модели. Существует как линейная, так и нелинейная регрессия.

Стационарные модели  предполагают, что статистические свойства (а именно среднее значение и дисперсия) ряда постоянны во времени. Мы можем применять модели скользящего среднего (MA), а также комбинировать их с авторегрессией для формирования моделей ARMA.

Нестационарные модели. Многие финансовые временные ряды нестационарны, то есть характеризуются изменяющимся средними значениями и дисперсиями. В частности, цены на активы часто входят в периоды высокой волатильности. Для этих серий нам нужны нестационарные модели, такие как ARIMA, ARCH и GARCH.

Многомерное моделирование. Тесно связано с понятием коинтеграции временных рядов и моделью векторной авторегрессии (VAR).

Модели пространства состояний. Заимствует долгую историю современной теории управления, используемой в инженерии, для моделирования временных рядов с быстро меняющимися параметрами.

  

перевод, обработка, комментарии и примечания

 Владимир Наливайский

 

В основе изложения статья “Beginner's Guide to Time Series Analysis”, опубликованная на сайте Quantstart.

Источник изображения на заставке - Habr.com

Первоисточниками определений, терминов, понятий, явлений, вводимых по тексту, являются профильные статьи Википедии/Wikipedia, указанные в Списке источников к публикации (для переводов - возможны трактовки автора исходного материала), если не оговорено иное.

Примечания

  1. Под адаптированным переводом понимается достаточно точное следование исходному материалу, с возможными отступлениями и пояснениями.  Конкретные вещи - формулы, скрипты, графики и пр. (а также авторские комментарии к ним) изложены максимально близко к оригиналу (часто скопированы). Ответственность за их корректность и ясность интерпретации несет автор исходника.
  2. Записью <курсив> обозначены вставки и комментарии переводчика.

Список источников (Википедия/Wikipedia, если не оговорено иное)

  1. “R (язык программирования)”.
  2. “GNU”.

Используемые сокращения

DTSP - Discrete-Time Stochastic Process, стохастический процесс с дискретным временем