Статьи

Инвестиционная компания Two Sigma Investments (Two Sigma). История развития, структура, персоналии, подходы в алгоритмическом трейдинге. Математические основы инвестстратегий. Продолжение цикла материалов о ведущих квантовых игроках современных финансовых рынков: Citadel Кена Гриффина, Renaissance Technologies Дж. Саймонса (часть I и часть II), Bridgewater (Рея Далио).

 

Содержание:

 

Two Sigma Investments. Краткое досье

Согласно Wikipedia (источник 1), на середину 2019 года первую пятерку компаний, управляющих хедж-фондами, замыкает Two Sigma Investments с Assets Under Management (AUM, активами под управлением) в размере $42,9 млрд. 

 

1 TSрейтинг

 

Что такое Two Sigma Investments сегодня?

Материнское предприятие - Two Sigma Investments, LP (Limited Partnership).

Штаб-квартира в Нью-Йорке по адресу 100 Avenue of the Americas, 16-ый этаж.

В холдинг входят дочерние компании в Лондоне, Токио, Шанхае, Гонконге, а также в Хьюстоне, штат Техас. Интересно, что Лондонский офис находится в City Tower на 16-ом этаже, как и в Нью-Йорке.

Персонал - свыше 1700 сотрудников, Две трети из них, включая около 200 докторов наук, занимаются научными исследованиями.

Текущие активы под управлением Two Sigma превышают $60 млрд.

Ниже представлена динамика AUM хедж-фондов компании за 2011-19 гг.[1]

 

2 TSAUM

 

В структуре Two Sigma Investments три звена, отвечающие за направления инвестирования.

 

3 TSстр ра

 

Two Sigma Securities, учрежденная в 2009 году, отвечает за работу на рынке ценных бумаг. Two Sigma Securities - лицензированный SEC брокер-дилер, член ключевых фондовых бирж США и маркет-мейкер по более, чем 8000 акций. Проводит операции объемом свыше 300 млн бумаг в день.

Two Sigma Ventures - венчурный фонд, инвестирующий в проекты на ранних стадиях, от посевного раунда до раунда B, с последующим долгосрочным партнерством. 

С 2012 года Two Sigma Ventures проинвестировал свыше 50 стартапов. Профили самые разнообразные. объединяющее начало - инновационные, цифровые подходы в своих отраслях. В их числе - сбор, обработка и контроль сведений для госструктур, изучение клиентского поведения, применение искусственного интеллекта для планирования встреч, управление страхованием для малого бизнеса, биотехнологии и т.д.

В компании заняты 16 штатных сотрудников, возглавляемые четырьмя партнерами. Привлекаются 10 сторонних венчурных партнеров и консультантов с опытом венчурного инвестирования в различных секторах. 

22 января 2020 г. Two Sigma Ventures объявила о закрытии (полном использовании средств) Two Sigma Ventures III, венчурном фонде на $288 млн. Первый фонд, запущенный в 2012 г. - Two Sigma Ventures I поддержал 20 новых предприятий только за счет капитала Two Sigma и ее сотрудников. Второй, Two Sigma Ventures II от 2014 года смог закрыть уже одну треть заявок за счет небольшой группы внешних инвесторов. Two Sigma Ventures III на 80% состоялся на сторонних деньгах.

Sightway Capital специализируется на прямых инвестициях[2]. Отраслевое предпочтение - финансовые услуги, транспорт, природные ресурсы и специализированная недвижимость. Задействуются все инструменты прямого инвестирования, включая предоставление кредитов, консалтинг и участие в кадровой политике. Инвестируемая компания получает поддержку со стороны Sightway Capital на каждом этапе жизненного цикла бизнеса. 

 

Этимология названия, история и создатели Two Sigma

Two Sigma Investments основана в 2001 году. 

Имя компании дает широкие возможности для толкования. Sigma (σ) в инвестировании - мера волатильности, риска. База ее расчета - среднеквадратичное отклонение цены финансового актива за выбранный период. 

Источник 2 интерпретирует “Two Sigma” как Σ(σi) - сумму волатильностей. Ориентируясь на правило трех сигм, заключающееся в том, что с вероятностью 0,9973 значения нормально распределенной величины отличаются от ее математического ожидания не более, чем на 3σ в обе стороны, можно говорить и о “правиле двух сигм”. А именно - значения нормально распределенной величины отличаются от ее математического ожидания не более, чем на 2σ в обе стороны, но уже с вероятностью примерно в 95,4%.

У истоков компании стояли трое. Дэвид Марк Сигел (David Mark Siegel), Джон Альберт Овердек (John Albert Overdeck) и Марк Пикард (Mark Pickard). М. Пикард занимал пост президента компании пять лет - с момента ее создания до выхода на пенсию в 2006 году. О нем мало, что известно. Общепризнанными главными идеологами и драйверами Two Sigma признаются Д. Сигел и Дж. Овердек.

Дэвид Сигел родился в 1961 г. в Бронксе, Нью-Йорк. Программированием увлекся в 12 лет. Уже в средней школе преподавал старшеклассникам компьютерные дисциплины по учебным планам Нью-Йоркского университета. 

 

4 TSСигел

Дэвид Сигел

(фото с сайта Two Sigma Investments)

 

Закончил Принстонский университет по специальностям электротехника и информатика. Докторскую степень получил в Массачусетском технологическом институте (МТИ). Научные интересы - в области искусственный интеллекта.

После МТИ Д. Сигел применяет свои математические способности в трейдинге. Вместе с Дж. Безосом, окончившим тот же факультет Принстона, работает в известной инвестиционной фирме DE Shaw & Co. Место совсем не случайное для математика. С самого основания (1988 г.) DE Shaw славилась сложными матмоделями и алгоритмами для поисков рыночной неэффективности. В компании Дэвид Сигел дослужился до должности директора по информационным технологиям. 

В дальнейшем создает веб-ресурс FarSight Financial Services, предоставлявший персональные финансовые услуги. На FarSight Financial Services впервые[3] организуется розничная интернет-торговля акциями. Позже Д. Сигел продает сервис  Merrill Lynch.

Следующим этапом в инвестиционной карьере Сигела стала еще одна заметная структура в трейдинге - Tudor Investment Corporation Пола Тюдора Джонса. В Tudor Investment Дэвид Сигел также проходит в топы - занимает кресло технического и управляющего директора. 

Непосредственно перед проектом Two Sigma Д. Сигел разработал поисковик Blink.com.

Личное состояние на 07.08.2020 - $6,5 млрд. Позиции в рейтингах Forbes: 

108-ое место в списке Forbes400 (американские миллиардеры), 253-я строчка в мировом перечне миллиардеров и № 5 среди управляющих хедж-фондов. 

Джон Овердек родился в 1969 г. в городке Миллберн, штат Нью-Джерси, в очень “математической” семье. Отец - математик Агентства национальной безопасности США, мать - занимала должность директора Computer Sciences Corporation (CSC), одной из крупнейших IT-корпораций в Соединенных Штатах.

 

5 TSОвердек

Джон Овердек

(фото Forbes)

 

В 17 лет Дж. Овердек становится серебряным призером Международной математической олимпиады. Достижения на этом интеллектуальном турнире весьма высоко ценятся математической общественностью в Штатах, причем не только в молодежной среде. Даже когда возраст победителя переваливает далеко за 40, в числе своих главных профессиональных успехов он обязательно подчеркнет наличие награды международной матолимпиады, добытой много лет назад. Сайт Two Sigma Investments отдельно на видном месте отмечает тот факт, что у них трудятся 17 золотых и серебряных медалистов Международной математической олимпиады.

В Стэнфорде Джон Овердек получает степень бакалавра математики и магистра статистики. В дальнейшем пути Овердека и Сигала пересекались. Так они, очевидно, и познакомились. В DE Shaw & Co Дж. Овердек поднимается по служебной лестнице до поста управляющего директора. Отметился он и в Amazon у Джеффа Безоса, будучи некоторое время вице-президентом компании. 

Далее - 2001-ый год и учреждение Two Sigma Investments, которая принесла Джону Овердеку солидное состояние и весомые позиции в рейтингах Forbes. 

На 07.08.2020 состояние серебряного медалиста Международной математической олимпиады 1986 года оценивается в те же $6,5 млрд. Место в рейтингах Forbes абсолютно идентично позиции партнера по Two Sigma Д. Сигела: 108-ое, 253-е и 5-ое соответственно

Откуда такое совпадение? Возможно, основная компонента активов обоих - доля в Two Sigma Investments. Как бы там ни было, неплохая монетизация математических знаний. Не добыча нефти, газа и прочих полезных ископаемых. 

 

Машинное обучение

Как любой квантовый фонд[4], Two Sigma Investments использует в трейдинге самые передовые методы фундаментальной и прикладной математики, теоретической физики и смежных дисциплин.

Особенности математических (количественных) подходов соперников уже находили свое отражение в материалах нашего сайта. Например, марковские модели, компьютерная лингвистика и теория струн у Renaissance Technologies Дж. Саймонса. 

Согласно профильной статье Wikipedia, Two Sigma отрабатывает три магистральных научных направления: машинное обучение, распределенные (параллельные) вычисления и элементы искусственного интеллекта. 

Применение подобного “коктейля” позволило компании Сигела и Овердека войти в элиту мировой хедж-индустрии и составить достойную конкуренцию таким лидерам, как упомянутые выше DE Shaw & Co и Renaissance Technologies. Пятое место в табели о рангах хедж-фондов по AUM (2019) - наглядное тому подтверждение. Если участники несут деньги в Two Sigma, значит она их грамотно и эффективно вкладывает, лучше (по крайне мере, не хуже), чем компании, расположившиеся ниже. 

Краткое знакомство с математическими предпочтениями Two Sigma Investments начнем с машинного обучения, непосредственно связанного с написанием и отладкой торговых алгоритмов.

Машинное обучение, Machine Learning (ML) - “Изучение компьютерных алгоритмов, которые автоматически улучшаются по мере накопления опыта”.  

Базовые принципы машинного обучения изложены в тексте о нейронных сетях. Вспомним, искусственная нейронная сеть - “Математическая модель с ее программным/аппаратным воплощением, выстроенная по принципу организации и функционирования биологической нейронной сети”.

Ключевое место в процессе ML - виды обучения алгоритмов: с учителем (Supervised Learning), без учителя (Unsupervised Learning) и обучение с подкреплением (Reinforcement Learning).

Входные данные для обучения должны удовлетворять признакам репрезентативности, непротиворечивости и нормализации (единой размерности). Путем прохождения “эпох обучения” и минимизации ошибок, обучающийся алгоритм должен выдавать более или менее приличные прогнозы на будущие ситуации. Например - диапазон котировок или наклон тренда финансового инструмента. 

Сложность гипотезы должна соответствовать сложности заложенной в алгоритм функции. 

Машинное обучение многогранно и многовекторно. Помимо искусственных нейронных сетей оно включает генетические алгоритмы[5], правила ассоциаций, регрессионный анализ, интеллектуальный анализ данных с обнаружением аномалий (выбросов), что критично важно для трейдинга, и многое другое.  

 

Распределенные (параллельные) вычисления и системы

Количественный фонд сталкивается с фундаментальной задачей обработки огромных массивов данных. Рабочие объемы достигают Петабайт информации. Two Sigma просеивает десятки тысяч источников сигналов на сотнях тысячах процессоров, с памятью 2000 терабайт[6] и выше.

Организация столь сложных процессов требует построения особой компьютерной архитектуры и применения соответствующих разделов прикладной (вычислительной) математики. 

Главное направление - организация распределенных или параллельных вычислений.

Разные источники дают различные толкования распределенных систем. 

Источник 14 делает это лаконично, а значит красиво: 

Распределенные вычисления - “Область компьютерных наук, изучающая распределенные системы”.

Правда, подобное определение использует дополнительный термин “распределенная система”, который в свою очередь, трактуется следующим образом:

Распределенная система - “Система, компоненты которой расположены на разных компьютерах сети, которые взаимодействуют и координируют свои действия, передавая сообщения друг другу”.

Распределенные системы (РС) обладают рядом свойств, в числе которых:

  • параллелизм;
  • синхронизация времени компьютеров/процессоров, участвующих в РС;
  • устойчивость к отказам отдельных компонент РС;
  • структура РС заранее неизвестна;
  • каждый элемент (компьютер, узел) РС имеет только ограниченное, неполное представление о системе.

Под “параллелизмом” здесь понимается применение параллельных алгоритмов.

С точки зрения процедуры исполнения, алгоритмы делятся на последовательные и параллельные. 

Последовательный алгоритм (Sequential/Serial Algorithm) - “Алгоритм, выполняющийся последовательно, от начала до конца, без иного исполнения”.

Параллельный алгоритм - “Алгоритм, который может быть реализован по частям на множестве различных вычислительных устройств с последующим объединением полученных результатов и получением корректного результата”. 

Противопоставляется обычным последовательным алгоритмам.

Подтип параллельного алгоритма - распределенный алгоритм.

Распределенный алгоритм (Distributed Algorithm) - “Параллельный алгоритм, отдельные части которого выполняются одновременно на независимых процессорах и имеют ограниченную информацию о том, что делают другие части алгоритма”.

Параллелизм в информатике вводит понятие “параллельные вычисления”.

Параллельные вычисления - “Способ организации компьютерных вычислений, при котором программы разрабатываются как набор взаимодействующих вычислительных процессов, работающих параллельно (одновременно)”.

Между терминами “распределенные вычисления” и “параллельные вычисления”, а также “распределенная система” и “параллельная система”  нет четкой границы. Одна и та же система может быть охарактеризована как параллельная и как распределенная. Процессоры в типичной распределенной системе работают одновременно, параллельно. Параллельные вычисления можно трактовать как сравнительно сильно связанную форму распределенных вычислений. И напротив, стандартный случай распределенных  вычислений выглядит как слабо связанный вариант параллельных вычислений.

Тем не менее, в известной степени, данные понятия разделяются по признаку соответствия общей и частной памяти компьютера (системы):

  • При параллельных вычислениях все компьютеры/процессоры[7] имеют доступ к общей памяти системы для обмена.
  • При распределенных вычислениях каждый процессор оперирует со своей собственной (частной) памятью. Обмен данными происходит между процессорами.

Изложенное наглядно иллюстрирует приведенный ниже рисунок.

 

6 TSраспр выч

(источник 14)

 

Фрагмент a - схема типовой распределенной системы. Сетевая топология представлена четырьмя узлами (компьютерами/процессорами). Соединяющие их линии - каналы передачи данных. 

Фрагмент b - та же РС, поданная подробнее. По каждому компьютеру выделена его частная память.

Фрагмент c - параллельная система, в которой любой процессор имеет прямой выход на общую память.

Распределенная сеть наинизшего уровня реализуется путем соединения нескольких компьютеров кабелями. Возможна реализация РС на печатной плате. РС более высокой ступени предполагает наличие специального коммуникационного софта. 

Архитектурой РС занимается, так называемое, “распределенное программирование” (Distributed Programming). 

Не вдаваясь в подробности, описание которых выходит далеко за рамки предлагаемого материала, необходимо отметить, что к базовым видам построения распределенных сетей относятся: клиент-серверная, трехуровневая, n-уровневая и пиринговая (P2P) схемы. Последняя известна также как одноранговая или децентрализованная сеть. Кстати, биткоины обращаются в пиринговой платежной системе.

Различают сильные и слабые связи между узлами сети.

 

Искусственный интеллект

Завершает математическую линейку от Two Sigma Investments грандиозное явление в современной науке, именуемое “искусственным интеллектом”.

Собственно, понятие искусственного интеллекта (ИИ) в трейдинге, в той или иной степени, включает в себя и машинное обучение с искусственными нейронными сетями, и генетическими алгоритмами, и вопросы архитектуры распределенных сетей, и всю алгоритмическую торговлю в целом. Цель алготрейдера - использовать как можно больше элементов ИИ при создании алгоритмов, усиливая процесс все возрастающими вычислительными мощностями.

Тема ИИ бесконечна и крайне разнообразна. В данном разделе остановимся на определении предмета, тесте Тьюринга и поверхностно - на некоторых областях применения ИИ в финансовом деле.

Искусственный интеллект (Artificial Intelligence, AI) - “Свойство интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека; наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ”.

В свою очередь, интеллектуальная система (Intelligent System) - “Техническая или программная система, способная решать задачи, традиционно считающиеся творческими, принадлежащие конкретной предметной области, знания о которой хранятся в памяти такой системы”.

Для того, чтобы выяснить, насколько интеллектуальная система (компьютер) соответствуют требованиям ИИ, английский математик Алан Тьюринг предложил в далеком 1950 г. простой тест, известный, как “тест Тьюринга”.

Понять суть теста может человек весьма далекий от IT. В этом его прелесть и безусловная научная глубина. У американского писателя Курта Воннегута в романе “Колыбель для кошки” (1963) есть следующий фрагмент: “Доктор Хониккер любил говорить, что, если ученый не умеет популярно объяснить восьмилетнему ребенку, чем он занимается, значит, он шарлатан”[8].

Алан Тьюринг смог. Вот его тест.

“Человек взаимодействует с одним компьютером и одним человеком. На основании ответов на вопросы он должен определить, с кем он разговаривает: с человеком или компьютерной программой. Задача компьютерной программы - ввести человека в заблуждение, заставив сделать неверный выбор.”

 

7 TSтест Тьюринга

(источник 20)

 

Если человек, играющий роль судьи (C), не уверен кто его собеседник - другой человек (B) или компьютер (A), считается, что интеллектуальная система A прошла тест на ИИ.

Возможности искусственного интеллекта - объект пристального внимания финансистов и инвесторов уже не один год. 

О концептуальной связи алгоритмического трейдинга и ИИ написано выше. В будущем, развитие алготроговли будет дрейфовать все дальше и дальше в сторону искусственного интеллекта.

Для обработки сигналов крупные игроки давно задействуют интеллектуальный анализ данных. Обрабатываются терабайты текстовой, аудио и видеоинформации, размещенных на бумажных и электронных носителях: статьи, отчеты, соцсети, научные публикации. Все, что может, хоть в малейшей степени, повлиять на рыночные тенденции. Темы компьютерной лингвистика, текстового майнинга и анализа настроений уже поднимались на страницах сайта Rusforexclub.

Перспективы интеллектуального анализа данных (ИАД) в банковском деле лежат, в том числе, в плоскости определения кредитного риска заемщика, а на рынке облигаций - оценки эмитента долговых ценных бумаг. Компания ZestFinance разработала платформу, которая с помощью ИАД присваивает кредитный рейтинг заемщику с короткой кредитной историей или вовсе без нее.

“В меру интеллектуальные”, автоматизированные финансовые и инвестиционные советники помогают инвестору сопровождать инвестпортфель, а обычному физическому лицу - оперировать с личными финансами.

Одна из разработок в области личных финансов - приложение Digit. После изучения предшествующих доходов и расходов человека, его привычек и предпочтений, Digit может самостоятельно (если ему доверят) сделать необходимые транзакции: оплаты, инвестиции и сбережения. Как минимум - рекомендовать подобные действия.

Конечно, перечисленные приемы и подходы используются всеми квантовыми фондами, а далеко не только Two Sigma Investments. 

Вот только результаты получаются разными.

 

Владимир Наливайский

 

На заставке - официальный логотип компании Two Sigma Investments, LP.

В подготовке статьи использованы материалы официальных сайтов Two Sigma Investments и ее структурных подразделений.

Первоисточниками определений терминов, понятий, явлений, вводимых по тексту, являются профильные статьи Википедии/Wikipedia, указанные в Списке источников к публикации, если не оговорено иное.

 

Примечания

  1. Источник 2 дает AUM Two Sigma Investments свыше $50 млрд на октябрь 2017 и $60 млрд уже на май 2019 г.
  2. Прямые инвестиции - вложения (инвестиции) денежных средств в материальное производство и сбыт с целью участия в управлении предприятием или компанией, в которые вкладываются деньги, и получения дохода от участия в их деятельности. Прямые инвестиции обеспечиваются владением контрольным пакетом акций, см. источник 5.
  3. По информации источника 3.
  4. Здесь и далее по тексту, под Two Sigma Investments могут пониматься как управляющая компания, так и ее хедж-фонд (хедж-фонды).
  5. Генетический алгоритм - “Алгоритм решения задач по оптимизации и моделированию путем случайного подбора с привлечением механизмов естественной эволюции”, см. источник 11.
  6. 1 Терабайт (Тбайт) = 1012 байт, 1 Петабайт (Пбайт) = 1015 байт, 1 Пбайт=103 Тбайт.
  7. Для простоты здесь и далее по тексту, при описании компьютерных систем, термины “компьютер” и “процессор” принимаются как синонимы. Другими словами, рассматриваются однопроцессорные компьютеры.
  8. Авторство цитаты ошибочно приписывается физикам-теоретикам А. Эйнштейну или Р. Фейнману. 

 

Список источников (Википедия/Wikipedia, если не оговорено иное)

  1. “List of hedge funds”.
  2. “Two Sigma”.
  3. “David Siegel (computer scientist)”.
  4. “John Overdeck”.
  5. “Прямые инвестиции”.
  6. “Безос, Джефф”.
  7. “DE Shaw & Co.”
  8. “Paul Tudor Jones”.
  9. “Machine learning”.
  10. “Искусственная нейронная сеть”.
  11. “Генетический алгоритм”.
  12. “Распределенные вычисления”.
  13. “Параллельные вычисления”.
  14. “Distributed computing”.
  15. “Sequential algorithm”.
  16. “Параллельный алгоритм”.
  17. “Distributed algorithm”.
  18. “Интеллектуальная система”.
  19. “Ричард Фейнман”, материал из Викицитатника.
  20. “Тест Тьюринга”. 
  21. “Биткойн”.

 

Используемые сокращения

AUM - Assets Under Management, активы под управлением

ML - Machine Learning, машинное обучение

SEC - The United States Securities and Exchange Commission, Комиссия по ценным бумагам и биржам США

ИАД - интеллектуальный анализ данных

ИИ - искусственный интеллект

МТИ - Массачусетский технологический институт

РС - распределенная система