AQR最最最新 | 计量经济学应用投资失败的7个原因

栏目: 数据库 · 发布时间: 6年前

内容简介：作者：

标星★公众号 爱你们 ♥

作者： Marcos López de Prado

编译：公众号编辑部

近期原创文章：

♥ Two Sigma用新闻来预测股价走势，带你吊打Kaggle

♥ 预测股市 | 如何避免p-Hacking，为什么你要看涨？

♥ 优化强化学习Q-learning算法进行股市

大家之前一定看过我们发表的这篇文章：

机器学习应用量化投资失败的7个主要原因

很多机构投资者、研究员与相关自媒体都转发和学习过此文。

近期，Marcos López de Prado大神又发新作了， 公众号 以最快的速度拿到pepper，以最快地的速度进行解读 。

AQR最最最新 | 计量经济学应用投资失败的7个原因

话不多说，进入正题！

文中涉及的所有参考论文

我们已全部下载

请在文末获取

什么是计量经济学？

“[T]he concept of multiple regression and the linear regression model in particular constitutes the underlying platform of most econometric modeling, even if the linear model itself is not ultimately used as the empirical specification.”

William Greene, Econometric Analysis (2012, p.7)

至于其历史和学科介绍网上有很多，在此不再敖述。

计量经济学的停滞

1、《科学网》报道，截至2018年11月，“经济学”和“统计与概率”交叉学科共发表了13772篇期刊文章。

2、在这些出版物中， 只有89篇文章（0.65％） 包含以下术语：

分类器，聚类，神经网络，机器学习

3、相比之下，在“生物学”和“统计与概率”交叉的40283篇文章中， 有4049篇（10.05%） 包含了上述任何一个术语。

4、在“化学、分析”和“统计与概率”交叉的4994篇文章中，共 有766篇（15.34％） 包含了上述任何一个术语。

AQR最最最新 | 计量经济学应用投资失败的7个原因

原因一：结构化数据

计量经济数据相对乏味

1、信息最丰富的数据集 适用于机器学习，但不适用于计量经济学 。

非结构化数据：所有可用数据中只有不到20％是结构化的。来自（IDC [2014]， https://www.emc.com/leadership/digital-universe/2014iview/index.htm ）。

高维数据集：变量的数量往往超过观测值的数量。

稀疏/噪声数据集：每单位信号中有很大比例的零或噪声。

等级关系：经济系统往往涉及agents网络。

AQR最最最新 | 计量经济学应用投资失败的7个原因

来自非结构性在线价格的通胀估计，可以准确预测美国的年度通胀数据

来自：《THE BILLION PRICES PROJECT: USING ONLINE PRICES FOR MEASUREMENT AND RESEARCH》， 论文文末下载。

2、标准计量经济学转换以牺牲平稳性为代价。具体详见：《 Advances in Financial Machine Learning: Lecture 2/10》， 论文文末下载。

同时参考我们之前的一篇文章： Advances in Financial Machine Learning第二章解读

3、计量经济学方法有效地为无趣数据建模。

非结构化数据示例：

在下面的图中，算法已经识别出与特斯拉相关的新闻文章。

蓝色bar：每日统计文章总数。平均每天458篇，最多5000篇。
绿色bar：每日统计表达积极情绪的文章数量。
红色bar：每日统计表达负面情绪的文章数量。

即时的价格反应与强烈的情绪失衡同时发生。尽管如此，在最初的突发新闻之后，似乎仍存在一些残余影响。可以训练机器学习算法以识别价格何时对情绪不平衡最敏感。

AQR最最最新 | 计量经济学应用投资失败的7个原因

原因二：相关性/贝塔系数

金融相关性噪声很大

1、计量经济学不包括对相关矩阵进行去噪和去音的方法。

2、因此，大多数计量经济学研究得出的结论都是错误的，其依据是噪音，而不是信号！

金融相关矩阵中包含的几乎所有特征值都与噪声有关，而与信号无关。计量经济学研究估计反映虚假关系的贝塔系数。

AQR最最最新 | 计量经济学应用投资失败的7个原因可以确定哪些特征值必须进行数值处理，以防止错误的发现，但这些方法很少用于计量经济学研究（N.B：收缩率无法区分信号和噪声）

来自：《Noise Dressing of Financial Correlation Matrices》，论文文末下载。

AQR最最最新 | 计量经济学应用投资失败的7个原因

2、鉴于金融体系的复杂性，这些要求是不切实际的。

3、即使研究人员能够猜出一个现象所涉及的相关变量是什么，往往也无法事先确定准确的功能形式，包括所有的交互作用（interaction effect）。

虚假的计量经济学的结论

考虑具有交互作用的简单流程生成的数据，例如：

假设我们得到了正确的变量，但是我们无法识别交互作用，而是进行了测试

预测和实现之间的关系只有0.04，尽管我们已经提供了正确的变量模型( 1, 2)。

AQR最最最新 | 计量经济学应用投资失败的7个原因

传统的计量经济学模型并不“学习”数据的结构。

除非我们提供确切的（未知的）说明，否则我们将得出错误的结论。

我们可以采用机器学习方法：通过引导估计1000个决策树，并形成一个集成预测。

和以前一样，我们没有告诉算法交互作用的存在。与以前不同，该算法“学习”了所提供变量的正确模型规范。

由于算法能够“学习”数据结构，而不是我们指导搜索，因此预测的和实际之间的样本外相关性上升到0.98。

AQR最最最新 | 计量经济学应用投资失败的7个原因

原因五：p值

在p=0.05时，大多数策略是错误的

假设一个经过回测的策略，盈利的概率是1%。

然后，在5%的显著性和80%的power的标准阈值下，研究员预计将在1000次试验中做出58项发现，其中8项为真阳性，50项为假阳性。

在这种情况下， p值为5%意味着至少86%的发现是假的！

AQR最最最新 | 计量经济学应用投资失败的7个原因

在实际中，金融中的错误发现率远高于86％ ，因为：

由于多次测试，familywise的显著性水平远远大于5%
由于竞争，发现新策略的概率低于1%
策略的保质期很短。策略在几个月或几年之内不会保持true
规范错误和其他违反假设的行为进一步增加了错误发现率

计量经济学陷入了p<0.05的时代

1、尽管金融经济学的大多数研究结果都依赖于p<0.05的论点：

p值需要强有力的假设，如正确的规范，不相关的回归，遵循正态分布的白噪声残差等。

在多线性回归的一般情况下，p值不能被鲁棒估计。

p值评估不相关的概率，p[ > | 0]：

https://www.nature.com/news/scientific-method-statistical-errors-1.14700

AQR最最最新 | 计量经济学应用投资失败的7个原因

我们真正关心的是p[ 1| > ]：

https://royalsocietypublishing.org/doi/pdf/10.1098/rsos.140216

（文末下载论文）

AQR最最最新 | 计量经济学应用投资失败的7个原因

p值评估样本内的显著性，而不是样本外。

2、通过p值发现的“统计显著”因素包括：

价值、动量、质量、规模、流动性、防御性等。

对p值的滥用如此普遍，以至于美国统计协会（American Statistical Association）已经不鼓励将p值作为统计重要性的衡量标准（Wasserstein等人[2019]）。

https://www.tandfonline.com/doi/pdf/10.1080/00031305.2019.1583913?needAccess=true&

（文末下载论文）

AQR最最最新 | 计量经济学应用投资失败的7个原因

使人们怀疑数十年的计量经济学研究：

（文末下载论文）

AQR最最最新 | 计量经济学应用投资失败的7个原因

p值实验

考虑一个包含40个特征的二元随机分类问题，其中5个特征是有用的，30个特征是冗余的，5个特征是噪声的。

1、 有用特征 （用“I_”前缀标记）：用来生成标签。

2、 冗余特征 （以“R_”前缀标记)：指通过向随机选择的有用特征添加高斯噪声而形成的特征。

3、噪声特征（用“N_”前缀标记）：那些不用于生成标签的特征。

AQR最最最新 | 计量经济学应用投资失败的7个原因

水平条表示从Logit回归得到的p值，垂直虚线表示5%的显著性水平。

这些p值歪曲了基本事实：

在35个非噪声特征中，只有4个被认为是重要的
噪声特征被评为相对重要
排名最不重要的14项特征中，没有噪声特征

特征重要性的现代方法

我们可以重复相同的实验，而不是计算p值，我们应用平均精度下降方法（MDA）：

1、在训练集上拟合机器学习算法，并估计样本外的准确性

2、一次改变一个变量，并重新估计样本外的准确度

3、通过改变每个变量来评估样本外精度的衰减

AQR最最最新 | 计量经济学应用投资失败的7个原因

MDA结果与实际情况一致：

MDA总体上在分离噪声特征方面做得很好。噪声特征排在最后。
噪声特征在量级上也不重要，MDA值基本为0。
通过将相似的变量聚类（一种无监督学习方法），可以进一步改善结果。

原因六：训练集过拟合

1、统计模型可能在两方面过拟合：

训练集过拟合：规范非常灵活，可以解释噪声（而不是信号）
测试集过拟合：根据测试集性能来选择模型（同时隐藏了其他较差性能的模型）

2、计量经济学正在很大程度上无法解决和量化这两个问题。

AQR最最最新 | 计量经济学应用投资失败的7个原因

相比之下，机器学习的研究员已经开发出方法来解决和量化这两种形式的过度拟合。

理想情况下，应该同时使用所有方法，而不是使用其中的一种。

举例：集成学习Bootstrap Aggregation

1、选择一个子集的数据，通过随机抽样与其替换。

2、将机器学习算法拟合到步骤1。

3、使用步骤2对不包含在步骤1中的数据点进行预测（此预测中的误差称为 out of bag error）。

关于 out of bag error这里有两个参考：

https://stackoverflow.com/questions/18541923/what-is-out-of-bag-error-in-random-forests

AQR最最最新 | 计量经济学应用投资失败的7个原因

h ttp://blog.sina.com.cn/s/blog_4c9dc2a10102vl24.html

AQR最最最新 | 计量经济学应用投资失败的7个原因

4.、多次重复步骤1—步骤3

AQR最最最新 | 计量经济学应用投资失败的7个原因

Bootstrap Aggregation（bagging）实现了两个目标：

1、减少预测误差的方差见上图。

2、如果单个估算器的准确度最低， 则组合预测的准确性超过了各个分类器的平均准确度。

原因七：测试集过拟合

金融公司如何进行研究

1、假设你正在寻找一种投资策略。运行了多个计量经济学回归模型，并找到实现高夏普比率的结果，其中一些高于3。

2、你把这些结果展示给你的老板，他决定在几周内用 Paper Trade进行测试。幸运的是， Paper Trade表现似乎与回测一致，因此准备拿这个模型进入实盘阶段。

3、给该策略分配了1亿美元，但不幸的是，不久后就出现了20%的亏损。

4、策略永远不会像之前那样保持业绩，没有永远的圣杯！

金融中最重要的环节

看下图，y轴显示给定试验次数（x轴）的最大夏普比率(max {SR})的分布。

颜色越浅表示获得该结果的可能性越大，而指示线表示期望值。

例如，仅经过1000次回测（试验）， 即使策略的真实夏普比率为0 ，预期的最大夏普比率(E[max{SR}])为3.26 !

来自：《利用无监督学习方法检测虚假投资策略》， （文末下载论文）。

AQR最最最新 | 计量经济学应用投资失败的7个原因

最好的回测结果不能代表基本事实（ 选择性偏差 ）。

将回测限制在一些规范内并不是一个解决方案。（ 确认性偏差 ）

大多数计量经济学投资之所以失败，是因为资产管理公司和学术期刊无法控制选择性偏差和确认性偏差。

AQR最最最新 | 计量经济学应用投资失败的7个原因

克服计量经济学的局限性

金融公司和学术作者可以使他们的统计方法更加现代化。而且是可以实现的：计量经济学分析的每一步，都有一个对应的机器学习工具包。

AQR最最最新 | 计量经济学应用投资失败的7个原因

计量经济学应用量化投资案例

我们在网上找了很多。发现 Wind 有一个课程，系统的把计量经济学的概念、 Python 应用和量化集合了起来，推荐大家收看。

主要是 免费， 对用户比较友好！

这是课程的视频：

AQR最最最新 | 计量经济学应用投资失败的7个原因

这个课程的notebook：

AQR最最最新 | 计量经济学应用投资失败的7个原因

<<向左滑动>>

学习地址：

www.windquant.com >> 学院 >> 中级课程

MATLAB EXPO 2019 微信直播

免费！免费！免费！

AQR最最最新 | 计量经济学应用投资失败的7个原因

文中所有论文下载

在后台输入（严格大小写）

Econometric_LHTZ

—End—

量化投资与机器学习微信公众号，是业内垂直于 Quant 、 MFE 、 CST 等专业的主流自媒体。公众号拥有来自 公募、私募、券商、银行、海外 等众多圈内 10W+ 关注者。每日发布行业前沿研究成果和最新资讯。

AQR最最最新 | 计量经济学应用投资失败的7个原因

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

TCP/IP网络编程

[韩] 尹圣雨 / 金国哲 / 人民邮电出版社 / 2014-7 / 79.00元

第一部分主要介绍网络编程基础知识。此部分主要论述Windows和Linux平台网络编程必备基础知识，未过多涉及不同操作系统特性。第二部分和第三部分与操作系统有关。第二部分主要是Linux相关内容，而第三部分主要是Windows相关内容。从事Windows编程的朋友浏览第二部分内容后，同样可以提高技艺。第四部分对全书内容进行总结，包含了作者在自身经验基础上总结的学习建议，还介绍了网络......一起来看看《TCP/IP网络编程》这本书的介绍吧!

码农工具

AQR最最最新 | 计量经济学应用投资失败的7个原因

♥ 基于无监督学习的期权定价异常检测（代码+数据）

♥ 5种机器学习算法在预测股价的应用（代码+数据）

♥ 深入研读：利用Twitter情绪去预测股市

♥ Two Sigma用新闻来预测股价走势，带你吊打Kaggle

♥ 利用深度学习最新前沿预测股价走势

♥ 一位数据科学PhD眼中的算法交易

♥ 基于RNN和LSTM的股市预测方法

♥ 人工智能『AI』应用算法交易，7个必踩的坑！

♥ 神经网络在算法交易上的应用系列（一）

♥ 预测股市 | 如何避免p-Hacking，为什么你要看涨？

♥ 如何鉴别那些用深度学习预测股价的花哨模型？

♥ 优化强化学习Q-learning算法进行股市