当深度学习遇上量化交易——图与知识图谱篇

栏目: IT技术 · 发布时间: 3年前

内容简介:©PaperWeekly 原创 · 作者|桑运鑫学校|上海交通大学硕士生

当深度学习遇上量化交易——图与知识图谱篇

©PaperWeekly 原创 · 作者|桑运鑫

学校|上海交通大学硕士生

研究方向|图神经网络在金融领域的应用

本文主要回顾三篇 将图和知识图谱应用到量化交易 上的文章。

当深度学习遇上量化交易——图与知识图谱篇

NeurIPS 2019

当深度学习遇上量化交易——图与知识图谱篇

论文标题: Exploring Graph Neural Networks for Stock Market Predictions with RollingWindow Analysis

论文来源: NeurIPS 2019

论文链接: https://arxiv.org/abs/1909.10660

这篇文章指出除了从股票的历史交易数据中产生的各种指标,专业的投资者在选择股票时还会考虑与该股票相关的企业,比如供应商、消费者、股份持有者等,我们应该想办法将这些信息利用起来用于股价预测。那么到了需要建模这种图关系数据的时候,自然就轮到图神经网络出场了。

对于一个图而言,最重要的就是点的表示和边的构建。

在点的方式方面,作者使用 LSTM 从原始的技术因子中生成结点的 embedding。

当深度学习遇上量化交易——图与知识图谱篇

论文将企业间的关系分为下面七类。其中第一序列关系(first order)是两个企业间的直接关系,但这种关系是比较稀疏的,并且已经被股票投资者广泛使用了。第二序列关系则是将具有共同特点的两个企业连接起来。

当深度学习遇上量化交易——图与知识图谱篇

最后将构建好的图通过一种称为 Temporal graph convolution 的方式进行训练,得到结点的 embedding。

当深度学习遇上量化交易——图与知识图谱篇

这个公式最重要的改进就是加入了作为系数来表示两个企业之间关系的动态变化。因为两只股票最近在价格上的走势也接近,那么就越大,他们之间的关系也就越强。

论文中使用 Nikkei 225 market 上的 176 只股票,利用 Nikkei Value Search dataset 来抽取企业之间的关系。利用回报率和夏普率作为衡量指标。实验结果如下图所示。

当深度学习遇上量化交易——图与知识图谱篇

实验证明了 customer-of 是企业间几种关系中最为重要的一种,对企业股价具有比较好的预测作用。具有这种关系的两家企业的股价在时序上具有比较好的相关性。此外,在不同的时间跨度上,不同的关系对于不同时期股价的预测作用不同。

从上图可以看出,customer-of  关系对于股价的预测作用在 1-day 时是最好的。此外,同一种关系在不同的跳数(hop)上预测作用的时间长短也是不同的,这是一个可以扩展的方向。

当深度学习遇上量化交易——图与知识图谱篇

CIKM 2018

当深度学习遇上量化交易——图与知识图谱篇

论文标题: Incorporating Corporation Relationship via Graph Convolutional Neural Networks for Stock Price Prediction

论文来源: CIKM 2018

论文链接: https://dl.acm.org/doi/10.1145/3269206.3269269

与上篇论文的出发点相似的,这篇论文也将企业间的关系纳入考虑。但与之不同的是,这篇论文更多地将其作为一种数据增强的手段,而不是直接在图上进行股价预测。文章使用如下方式建图:

图中的每个点代表一个企业,他们之间的边代表两家企业间的持股关系,变得权重表示持股比例。之后提出两个模型利用图进行股价预测:Pipeline Prediction Model、Joint Prediction Model Based on GCN。

当深度学习遇上量化交易——图与知识图谱篇

Pipline Prediction Model 使用 DeepWalk, node2vec 和 LINE 三种方法生成节点的 embedding。之后计算两个结点之间的 cos 相似度选出与目标公司最相似的家企业,把它们的特征取平均拼接到目标企业的特征向量上:

当深度学习遇上量化交易——图与知识图谱篇

最后将输入到 LSTM 中进行预测。

当深度学习遇上量化交易——图与知识图谱篇

Joint Prediction Model Based on GCN 则是用 LSTM 获得结点的向量表示,从前面构建的图中获取邻接矩阵,之后输入到一个三层的 GCN 中完成预测。

当深度学习遇上量化交易——图与知识图谱篇

对 2017 年的 CSI 300 的验证结果表明 LSTM+GCN 的预测准确率更高(这里的评价指标选的相当不专业,一般来说我们要选择回报率以及能够排除掉整个市场趋势的一些指标来衡量模型的实际盈利能力)。在所有图表示学习的方法中,LINE 方法的表现更好。

当深度学习遇上量化交易——图与知识图谱篇

当深度学习遇上量化交易——图与知识图谱篇

COLING 2016

当深度学习遇上量化交易——图与知识图谱篇

论文标题: Knowledge-Driven Event Embedding for Stock Prediction

论文来源: COLING 2016

论文链接: https://www.aclweb.org/anthology/C16-1201/

在股票市场上,各种 event 对于股价是有较大影响的。这篇文章使用知识图谱来抽取 event embedding,之后用于股价预测。

对于event可以将其看作一个三元组,其中是行动者(actor)或主体(subject),是行动或谓语(predicate),是被施加行为的客体。首先可以使用预训练的词向量做平均来分别表示,之后使用 neural tensor network (NTN) 来计算隐向量。

当深度学习遇上量化交易——图与知识图谱篇

为了合理的训练,采用随机替换中单词的方式来获得负样本(corrupted event tuple),损失函数如下:

当深度学习遇上量化交易——图与知识图谱篇

当深度学习遇上量化交易——图与知识图谱篇

但上述方式训练出的 event embedding 存在两个的问题:

1. 不能获取两个在语义或语法上相似事件的关系,如果两者没有相似的词向量;

2. 同样地,有两个相似词向量的事件不一定是相关的。

这两个问题出现的原因是在训练 event embedding 的时候没有加入背景知识。而想要获取背景知识就要利用知识图谱,知识图谱中存在两种知识:关系知识(relational knowledge)和和类别知识(categorical knowledge)。

当深度学习遇上量化交易——图与知识图谱篇

这两种关系同样可以使用简单的 NTN 网络来计算,其中是两个实体,是某种关系:

当深度学习遇上量化交易——图与知识图谱篇

通过随机替换获得负样本,极小化如下的目标函数:

当深度学习遇上量化交易——图与知识图谱篇

最后将两个模型组合起来进行训练,就可以获得包含知识的event embedding。

当深度学习遇上量化交易——图与知识图谱篇

目标函数为:

当深度学习遇上量化交易——图与知识图谱篇

实验从 Reuters News 和 Bloomberg News 抽取结构化事件,使用 YAGO 作为知识图谱,对标准普尔 500 指数和单个股票进行预测。使用 Acc 和 MCC (Matthews Correlation Cofficient) 作为指标。结果如下:

当深度学习遇上量化交易——图与知识图谱篇

当深度学习遇上量化交易——图与知识图谱篇

总结

这三篇论文是近五年图神经网络和知识图谱在量化投资上的应用尝试,主要集中与挖掘企业之间的相关关系,但也存在一些问题,如三篇文章都没有很好的解决市场的动态性,企业间的关系是随时间不断变动的,并且使用一个静态的知识图谱或数据集来抽取关系是否会造成数据泄露的问题也没有指明。

因为相关的资料确实相当匮乏,我在 GitHub 上新建了一个 repo 用于收集、整理相关的研究论文、书籍、数据、网站等,欢迎 star。

https://github.com/sangyx/deep-stock

如果您对深度学习在量化交易中的应用感兴趣,欢迎加我微信一起学习探讨。

当深度学习遇上量化交易——图与知识图谱篇

当深度学习遇上量化交易——图与知识图谱篇

点击以下标题查看更多往期内容:

当深度学习遇上量化交易——图与知识图谱篇

# 投 稿 通 道 #

让你的论文被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢? 答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是 最新论文解读 ,也可以是 学习心得技术干货 。我们的目的只有一个,让知识真正流动起来。

:memo:  来稿标准:

• 稿件确系个人 原创作品 ,来稿需注明作者个人信息(姓名+学校/工作单位+学历/职位+研究方向) 

• 如果文章并非首发,请在投稿时提醒并附上所有已发布链接 

• PaperWeekly 默认每篇文章都是首发,均会添加“原创”标志

:mailbox_with_mail:  投稿邮箱:

• 投稿邮箱: hr@paperweekly.site 

• 所有文章配图,请单独在附件中发送 

• 请留下即时联系方式(微信或手机),以便我们在编辑发布时和作者沟通

:mag:

现在,在 「知乎」 也能找到我们了

进入知乎首页搜索 「PaperWeekly」

点击 「关注」 订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击 「交流群」 ,小助手将把你带入 PaperWeekly 的交流群里。

当深度学习遇上量化交易——图与知识图谱篇

当深度学习遇上量化交易——图与知识图谱篇


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

运营其实很简单:互联网运营进阶之道

运营其实很简单:互联网运营进阶之道

郑文博 / 人民邮电出版社 / 2018-2 / 49.80元

为了帮助从事运营或即将从事运营的广大读者更好、更快地了解运营、学习运营、入职运营,本书详细阐述运营对于用户、企业的帮助,同时以单个理论点 单个实战案例的方式详细分析了社群运营、活动运营、新媒体运营、内容运营、渠道运营、精细化运营、场景化运营、用户化运营、商业化运营等模块及运营工作、渠道整合、社群知识、渠道优化、SOP流程等细节,力求让读者在求职路上快速上手,在迷茫途中快速定位。 《运营其实很简单 ......一起来看看 《运营其实很简单:互联网运营进阶之道》 这本书的介绍吧!

XML、JSON 在线转换
XML、JSON 在线转换

在线XML、JSON转换工具

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具

RGB CMYK 转换工具
RGB CMYK 转换工具

RGB CMYK 互转工具