В нашем блоге мы неоднократно писали о программное обеспечение для торговли акциями различные инструменты, используемые для анализа ситуации на фондовом рынке и создания прогнозов возможных обвалов и изменений цен (в этот материал собраны все рассмотренные алгоритмы и инструменты).
Одними из самых популярных инструментов анализа являются различные технологии работы с большими данными — например, Hadoop, NoSQL. Сегодня мы рассмотрим два эксперимента, в которых исследователи использовали большие данные для создания прогнозов движения фондового рынка.
Прогнозирование волатильности с помощью анализа настроений инвесторов
Исследователи из Технологического института в Коимбаторе, Индия, опубликовали работа , посвященный использованию механизмов анализа больших данных для определения настроения общественного мнения и использования этих данных для создания прогнозов движений на фондовом рынке.В частности, были проанализированы сообщения и отзывы, которые инвесторы и трейдеры оставляли на сайтах бирж и финансовых организаций.
Процесс анализа включал сбор данных и последующую идентификацию на их основе маркеров, которые указывают, является ли утверждение положительным или отрицательным.
При этом необходимо учитывать особенности естественного языка, которые необходимо учитывать во избежание ошибок – например, словосочетание «неплохо» является положительной характеристикой.
Такая классификация может осуществляться различными способами – на уровне документа, предложения или фразы.
Для этого также можно использовать различные механики машинного обучения — например, алгоритмы обучения.
с «учителем» И без учителя , которые противостоят друг другу.
В последнем случае для определения общего тона высказывания часто используется анализ лексики — система ищет слова, выражающие мнение (слова-мнения), например, прилагательные.
В случае обучения с учителем используются обучающие выборки, содержащие входные данные и желаемый результат анализа.
Для сравнения этих данных вы можете использовать наивный байесовский классификатор или поддержка векторного машинного алгоритма.
Линейный классификатор с использованием алгоритма машины опорных векторов
Данные о настроениях инвесторов также сравниваются с историческими данными для определения финансовой волатильности, что затем позволяет спрогнозировать, каким может быть это значение в будущем.
Волатильность здесь относится к изменению стоимости финансового актива за определенный период времени.
Модели используются для анализа временных рядов.
авторегрессионная условная гетероскедастичность (ARCH) – предназначены для анализа процесса кластеризации волатильности на финансовых рынках.
Что выражается в том, что периоды высокой волатильности сменяются периодами низкой волатильности.
При этом средняя волатильность остается относительно стабильной – все это позволяет нам прогнозировать, какой может быть волатильность в будущем.
При этом модель ARCH предполагает, что условная дисперсия зависит только от квадратов прошлых значений временного ряда.
Эта модель была обобщена, когда было высказано предположение, что условная дисперсия зависит также и от самих прошлых значений — в результате появилась модель GARCH (Generalized ARCH).
Схема работы
Исследователи разработали систему, которая применяет машины опорных векторов к модели GARCH для прогнозирования условий фондового рынка.Работает по следующей схеме:
- Сначала с популярных финансовых сайтов загружаются обзоры аналитиков, отзывы инвесторов и трейдеров, а также логи их открытых чатов во время торгов в текстовом формате; кроме того, в систему загружаются новости с сайтов компаний, акции которых торгуются на биржах;
- С помощью алгоритма опорных векторов определяется тональность высказываний (эксперименты показали, что этот алгоритм позволяет создать более точную классификацию, чем в случае использования байесовского классификатора);
- Также за этот же период времени загружаются исторические данные о значениях анализируемого фондового индекса – эта информация используется для расчета волатильности по модели GARCH;
- На основе полученных данных строятся прогнозы тенденций волатильности для отдельных акций (для акций небольших компаний модель работает лучше, чем для крупных).
Система выбора перспективных акций на основе данных Twitter
Исследователи из Имперского колледжа Лондона, в свою очередь, опубликовали история о создании инструмента для анализа публикаций в социальных сетях и выявления корреляций этих данных с тенденциями фондового рынка для формирования портфеля перспективных акций.
Различные исследования, в том числе ученых Стэндфордский Университет , демонстрируют наличие корреляции между индексом Доу-Джонса и настроениями пользователей Twitter:
Анализ этой информации позволяет строить прогнозы относительно дальнейшего движения цен.
Английские исследователи создали приложение, которое загружает твиты, связанные с компаниями, включенными в индекс S&P 500, запускает задание Hadoop для создания совокупного показателя настроений для каждого заявления и набора акций (портфеля), а затем ранжирует портфель, чье положительное настроение баллы выше, чем у других.
Архитектура приложения
Демонстрационная система работает на кластере Hadoop 1.1.2 и IBM GPFS 3.6. Каждый узел оснащен восемью процессорными чипами Intel Xeon 2,5 ГГц, 8 ГБ памяти и 250 ГБ накопителя, ОС — RedHat Linux.
По словам создателей приложения, инвесторы могут использовать его для выбора наиболее перспективных акций для торговли на данный момент — этот инструмент не предназначен для точного прогнозирования цен на акции, но помогает выбрать те, от которых можно ожидать движения в том или ином направлении.
.
Подробнее о прогнозировании цен на акции в блоге ИТинвест :
- Методы машинного обучения для прогнозирования цен на акции: функции индикаторов и анализ новостей
- Как предсказать цену акции: алгоритм адаптивной фильтрации
- Обнаружение инсайдерской торговли: алгоритмы и закономерности нелегальной торговли
- Машинное обучение как способ анализа микроструктуры рынка и его применение в высокочастотном трейдинге
- Алгоритмы и торговля акциями: сокрытие крупных сделок и прогнозирование цен на акции
-
Что Такое Веб-Хостинг Wordpress?
19 Oct, 24 -
Пул Подключений К Базе Данных
19 Oct, 24 -
Замена Стандартных Селекторов В Браузере
19 Oct, 24