五个经验教训:机器学习应用量化策略的那些坑!

栏目: IT技术 · 发布时间: 4年前

五个经验教训:机器学习应用量化策略的那些坑!

标星★ 置顶 公众号      爱你们    

作者:IAN J. HISSEY  编译:方的馒头

1

前言

五个经验教训:机器学习应用量化策略的那些坑!

2

在量化研究中引入机器学习

五个经验教训:机器学习应用量化策略的那些坑!

五个经验教训:机器学习应用量化策略的那些坑!

3

自动化机器学习

五个经验教训:机器学习应用量化策略的那些坑!

五个经验教训:机器学习应用量化策略的那些坑!

五个经验教训:机器学习应用量化策略的那些坑!

4

建立和测试模型

为了表明机器学习可用于增强传统的量化因子,我们建立了中国A股的股票预测模型。我们为2012年12月至2019年8月编制了中证800指数的股票表现和各种因子数据的月度概况。我们将目标变量设置为股票的未来一个月收益,并使用原始投资组合模型中的因子。

五个经验教训:机器学习应用量化策略的那些坑!

五个经验教训:机器学习应用量化策略的那些坑!

五个经验教训:机器学习应用量化策略的那些坑!

5

不要混淆样本内和样本外

五个经验教训:机器学习应用量化策略的那些坑!

五个经验教训:机器学习应用量化策略的那些坑!

6

屏蔽噪音并一次建模

与机器学习的典型用例(如预测同店销售额或个人银行贷款违约的可能性)不同,股票收益数据是嘈杂的。众所周知,时间序列金融数据受复杂行为困扰,包括异方差性、黑天鹅和尾部相关性。在我们的案例中,我们并不试图预测市场收益,而只是预测要投资的股票。为了最大程度地减少这些现象的影响,我们可以仅关注基准相对或同级相对表现,以将噪声降至最低。

7

简化问题陈述以产生更好的模型

五个经验教训:机器学习应用量化策略的那些坑!

五个经验教训:机器学习应用量化策略的那些坑!

8

解释你的模型与构建模型一样重要

五个经验教训:机器学习应用量化策略的那些坑!

五个经验教训:机器学习应用量化策略的那些坑!

此图表解释了特征与预测的关系。这些可以是并且通常是非线性的。就价值而言,公司的风险敞口越高,我们模型中的预测就越高。

五个经验教训:机器学习应用量化策略的那些坑!

然后,我们可以从理论到实践的理解,并研究该策略的交易方式。下图显示了该模型推荐的公司的SWS行业。Y轴在1到5的范围内显示一个行业的相对重要性,其中1表示最高,气泡的大小表示观测的频率。我们的模型在收购电子行业的公司时避免了金融和公用事业。

五个经验教训:机器学习应用量化策略的那些坑!

然后,我们根据之前强调的国有企业标志将预测分为两组。通过分析各组股票收益的相关性,我们发现该模型根据公司是否为国有企业给出了截然不同的建议。对于国有企业,我们的模型更倾向于价值股票,而对于民营企业,我们的模型倾向于对成长型公司进行更多投资。

五个经验教训:机器学习应用量化策略的那些坑!

9

尝试多种方法并快速失败

五个经验教训:机器学习应用量化策略的那些坑!

五个经验教训:机器学习应用量化策略的那些坑!

10

结论

2020年第 66 篇文章

量化投资与机器学习微信公众号,是业内垂直于 Quant、MFE、 Fintech、AI、ML 等领域的 量化类主流自媒体。 公众号拥有来自 公募、私募、券商、期货、银行、保险资管、海外 等众多圈内 18W+ 关注者。每日发布行业前沿研究成果和最新量化资讯。

你点的每个“在看”,都是对我们最大的鼓励


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

高性能网站建设指南

高性能网站建设指南

Steve Souders / 刘彦博 / 电子工业出版社 / 2008年 / 35.00元

本书结合Web 2.0以来Web开发领域的最新形势和特点,介绍了网站性能问题的现状、产生的原因,以及改善或解决性能问题的原则、技术技巧和最佳实践。重点关注网页的行为特征,阐释优化Ajax、CSS、JavaScript、Flash和图片处理等要素的技术,全面涵盖浏览器端性能问题的方方面面。在《高性能网站建设指南》中,作者给出了14条具体的优化原则,每一条原则都配以范例佐证,并提供了在线支持。《高性能......一起来看看 《高性能网站建设指南》 这本书的介绍吧!

URL 编码/解码
URL 编码/解码

URL 编码/解码

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器