Эксперимент: Создание Алгоритма Прогнозирования Поведения Фондовых Индексов



Эксперимент: создание алгоритма прогнозирования поведения фондовых индексов

Ученые факультета компьютерных наук Исламского университета Азад, расположенного в ОА?, опубликовали
работа , посвященный прогнозированию поведения фондовых индексов на основе технологий нейронных сетей, генетических алгоритмов и интеллектуального анализа данных с использованием машин опорных векторов.

Представляем вашему вниманию основные идеи этого документа.



Введение

Одним из популярных направлений финансового анализа в последние годы является прогнозирование цен на акции и поведения фондовых индексов на основе данных предыдущих торговых периодов.

Для получения каких-либо значимых результатов необходимо использовать подходящие инструменты и правильные алгоритмы.

Ученые поставили перед собой цель разработать специальное программное обеспечение, которое могло бы генерировать прогнозы поведения фондовых индексов с помощью предсказательных алгоритмов и математических правил.

Фондовые индексы сами по себе непредсказуемы, поскольку зависят не только от экономических событий, но и находятся под влиянием политической ситуации в разных частях мира.

Поэтому чрезвычайно сложно разработать математическую модель для обработки таких непредсказуемых, нелинейных и непараметрических временных рядов.

При работе на фондовом рынке используются два вида анализа.

1) Технический анализ Используется для краткосрочных финансовых стратегий.

Он используется для прогнозирования изменений цен на основе закономерностей и аналогичных изменений цен в прошлом.

Как правило, анализируются ценовые графики, на которых выделяются закономерности определенных закономерностей в динамике цен.

Помимо изучения динамики изменения цен, технический анализ использует информацию об объемах торгов и другие статистические данные.

2) Фундаментальный анализ Для долгосрочных инвестиционных стратегий используется фундаментальный анализ.

Он предполагает использование информации о финансовых и производственных показателях ее деятельности для прогнозирования цены акций конкретной компании.

Также при прогнозировании возможных движений цен необходимо понимать риски, существующие на финансовом рынке для действующих на нем игроков:

  • Торговый риск — сумма средств, которой рискует трейдер.

    Например, если он покупает финансовый актив за тысячу долларов, то торговый риск будет равен этой сумме.

  • Рыночный риск - что может произойти на рынке под влиянием, в том числе, мировых экономических событий или событий в конкретной стране, где расположен финансовый рынок или акции компаний, акции которых торгуются на фондовой бирже.

  • Маржинальный риск — если для совершения сделок используются заемные средства, возникает маржинальный риск.

    Деньги, взятые в долг, например, у брокера, в конечном итоге придется вернуть, и если у трейдера недостаточно свободных средств на счету для этого, то его позиции будут принудительно закрыты, даже если это не подразумевалось его торговая стратегия.

  • Риск ликвидности — не из каждого финансового инструмента можно быстро «выйти».

  • Риск переноса позиций на ночь — сохранение позиций между торговыми днями или в течение нескольких торговых дней сопряжено с риском, поскольку трейдер не может знать, что произойдет, когда биржа не работает. Возможно, какое-то событие повлияет на открытие торгового дня, и цена акций тут же сместится в невыгодную для инвестора сторону.

  • Риск волатильности — цена акции колеблется в определенных пределах.

    Чем шире диапазон колебаний цен, тем выше волатильность конкретного финансового инструмента.



Прогнозирование поведения фондовых индексов

Одним из популярных инструментов, используемых для решения задач прогнозирования цен на акции, является дерево решений.

В свою очередь, наиболее эффективным методом сбора и анализа данных является интеллектуальный анализ данных.

Существует несколько моделей использования интеллектуального анализа данных, реализующих разные подходы к сбору и анализу полученной информации.

В нашем случае исследователи выбрали модель CRISP-DM (стандартный процесс перекрестной идентификации для интеллектуального анализа данных).

Этот метод был разработан консорциумом европейских компаний в середине девяностых годов прошлого века.

Модель включает семь основных этапов:

  1. Определение целей поиска информации (данных о том, какие акции необходимы).

  2. Находим необходимые данные.

  3. Организация данных в модели классификации.

  4. Выбор технологии реализации модели.

  5. Оценка модели с использованием известных методов.

  6. Применение модели к текущим рыночным условиям для выработки рекомендаций по целевому действию, например покупке или продаже акций.

  7. Оценка полученных результатов.

После сбора данных для принятия решений используется дерево классификации.

У этого подхода есть три основных преимущества: он быстрый, простой и очень точный.

В данном случае параметрами модели были предыдущая цена, цена открытия, максимум, минимум, закрытие и целевое действие (предыдущее, открытие, макс, мин, последнее, действие).

Генетические алгоритмы также используются для прогнозирования.

Они используются для решения сложных задач в тех случаях, когда точные связи между участвующими элементами неизвестны и могут отсутствовать в принципе.

Задача формализована так, что ее решение можно закодировать в виде вектора генов («генотипа»), где каждый ген может представлять бит, число или какой-либо другой объект. Далее случайным образом создаются множество генотипов исходной «популяции», которые оцениваются с помощью специальной функции приспособленности.

В результате каждому генотипу присваивается значение «приспособленности», которое определяет, насколько хорошо он решает задачу.

Методы оптимизации используются для постоянной оптимизации параметров торговой стратегии.

Например, ген можно представить в виде вектора, и соответствующий алгоритм оптимизации применяет к нему механизм промежуточной рекомбинации.

Одним из методов прогнозирования будущих движений цен является машинное обучение.

В этом случае исследователи использовали машины опорных векторов.

Исследователи собрали финансовые данные с биржи NASDAQ, а также некоторых финансовых инструментов и индексов.

В результате точность прогнозов системы для NASDAQ составила 74,4%, для индекса DJIA 77,6% и для S&P500 76%.

Для машинного обучения использовались следующие формулы: Прежде всего, х я (t), где i ∈ {1, 2, …}.

F = (Х 1 , ИКС 2 , … ИКС н ) Т , Где

Эксперимент: создание алгоритма прогнозирования поведения фондовых индексов

Для оценки используемой модели использовался метод расчета среднеквадратической ошибки (RMSE, Root of Mean Square Error):

Эксперимент: создание алгоритма прогнозирования поведения фондовых индексов



Многоклассовая классификация

Для минимизации рисков и увеличения прибыли используется машина опорных векторов.

Он предполагает классификацию данных на три категории: положительные, отрицательные и нейтральные.

Это помогает выявить наиболее рискованные прогнозы и отвергнуть их.

Для создания такого мультиклассового классификатора необходимо определить ширину центральной зоны:

Эксперимент: создание алгоритма прогнозирования поведения фондовых индексов

ТП: истинно положительный результат ФП: ложное срабатывание фн: ложноотрицательный результат


Предлагаемая модель

Как отмечалось выше, собранные данные имели шесть атрибутов.

Для использования в дереве решений данные необходимо преобразовать в дискретные значения.

Для этого можно использовать критерий, основанный на цене закрытия рынка.

Если значения open, max, min и Last превышают предыдущее значение атрибута в течение текущего торгового дня, то положительное значение должно быть заменено предыдущим атрибутом.

Напротив, вместо предыдущего атрибута устанавливается отрицательное значение, и если значения равны, то устанавливается соответствующий атрибут. Вот как выглядит набор данных для шести атрибутов до их преобразования в дискретные значения:

Эксперимент: создание алгоритма прогнозирования поведения фондовых индексов

А вот после перевода:

Эксперимент: создание алгоритма прогнозирования поведения фондовых индексов

После получения такого набора дискретных значений необходимо построить модель классификации с помощью дерева решений.

В данном исследовании рассматриваются два возможных сценария действий.



Сценарий №1
Вам необходимо сделать следующее:
  1. Собирайте финансовые данные по сделкам за 30 дней.

  2. Выберите данные для шести атрибутов в 9 моментов времени в течение одного торгового дня.

  3. Для каждого набора сформировать матрицу.

  4. Вычислите XX^T и примените машины опорных векторов для генерации собственного значения.

  5. Расчет среднего объема продаж и покупок.

  6. Рассчитайте среднее значение каждого торгового дня.

  7. Присвоение разных весов первому дню, седьмому дню, тридцатому дню и среднему месячному значению.

  8. Чтобы сформировать рекомендацию к действию, необходимо сравнить текущее значение с первым, седьмым, тридцатым днем, а также со средним значением за весь месяц.

  9. Если результат прогноза одинаков в течение 4 торговых дней, то вам следует совершить покупку; если есть совпадение в течение трех торговых дней, то риск покупки будет 25%, в течение двух дней риск составит 50%.

Для каждого торгового дня из тридцати необходимо сформировать матрицу, в которой Си представляет девять различных моментов в течение одного дня:

Эксперимент: создание алгоритма прогнозирования поведения фондовых индексов

После этого рассчитывается R = XX Т — каждую матрицу необходимо умножить на ее транспонированную версию.

Затем вычисляются опорный вектор и его собственное значение.



Сценарий 2
В этом случае выполняются все те же действия, но машина опорных векторов применяется не к «сырым» данным, а к матрице, полученной после автокорреляции.

Для каждого торгового дня формируется матрица автокорреляции:

Эксперимент: создание алгоритма прогнозирования поведения фондовых индексов

Здесь используется следующая формула:

Эксперимент: создание алгоритма прогнозирования поведения фондовых индексов

После автокорреляции мы получаем новую матрицу ( Матрица Теплица ):

Эксперимент: создание алгоритма прогнозирования поведения фондовых индексов

И для него уже рассчитаны опорный вектор и собственное значение.

Чтобы сравнить отклонение от среднего значения в разные торговые дни, среднее значение, дисперсия и стандартное отклонение рассчитываются и сохраняются в векторе.



Заключение

Чтобы получить наилучшие результаты, исследователи применили все описанные методы шаг за шагом: начиная с фундаментального анализа, используя генетический алгоритм, нейронные сети, машинное обучение и машины опорных векторов.



Эксперимент: создание алгоритма прогнозирования поведения фондовых индексов

При этом добиться 100% точности прогнозирования изменения значений фондовых индексов не удалось.

Для различных финансовых инструментов точность прогнозирования поведения индексов на период одного торгового дня весьма различна:

Эксперимент: создание алгоритма прогнозирования поведения фондовых индексов

Лучшим результатом стала точность 70,8% для немецкого индекса DAX. Для достижения большей точности долгосрочных прогнозов (периоды более 30 дней) использовалась следующая формула: Пр{в т+1 –v т > с т }, где c т = -(v т-тс – в т ) При этом лучший результат точности прогноза составил 85,0%.



Другие материалы о прогнозировании цен на акции и использовании алгоритмов на фондовом рынке:

Теги: #фондовые индексы #фондовый рынок #алгоритмическая торговля #онлайн-трейдинг #прогнозирование цен #прогнозирование цен #индексы #Алгоритмы #Разработка сайтов
Вместе с данным постом часто просматривают: