设为首页 收藏本站 切换语言

15年量化投资生涯,我总结了15条经验

| 发表于 2023-9-8 10:41:10 | 显示全部楼层 |复制链接

1、Risk cannot be destroyed, only transformed.

风险无法被消灭,只能被转移

我在卡耐基梅隆大学获得了计算机金融的硕士学位,这是一门跨领域的交叉学科,他涉及了计算机、数学、统计学和金融,但从实际上来讲,它是一门关于定价的学科。

不知从什么时候开始,我意识到我们对产品定价其实是转移风险,我们的目标是识别风险,然后想办法隔离和提取它,把它打包成适当的产品类型,然后定价出售。

风险驱动了整个方程式——定价的本质在于理解潜在回报的分布。然后找到各种风险和假设的补偿,对于每一个买方而言,都有一个卖方作为对手方,每一个想要转移风险的卖方,都要对承担风险的买方做出补偿。

所以,归根结底,你的投资组合其实是在表达你愿意承担的风险。

我把风险比喻成一团橡皮泥,当你的投资组合变得多样化时,你所面临的风险像橡皮泥一样也在铺散开来。

打个比方说,如果你从满仓股票变成股票和债券相结合的投资组合,那么经济收缩的风险会减小,但是通货膨胀的敞口会增加,这个过程就像一团橡皮泥,他没有消失,只是散开了。

风险是一个老生常谈的话题。Chris Cole曾写到:波动无法创造或者销毁,只能转化;2008年James Saft写到:经济的波动类似于能量,它不会消失,只会转移;2007年Swasti Kartikaningtyas评论印度尼西亚市场:金融的一个简单熵定律是风险无法销毁,只能在各方之间转移。

在这里,我依然把风险列为第一条,怎么强调它都不为过。

2、“No pain, no premium”
没有痛苦,就没有溢价

“没有痛苦,就没有溢价”的理念提醒我们,从长远来看,我们获得报酬是因为承担了风险。但是风险很可能会表现出来,然后给我们的头寸造成损失。毕竟没有风险的话,我们凭什么期望赚取无风险利率以上的收益呢?

现代金融在很大程度上基于这样的原则:你承担的风险越大,预期回报越高。当大多数人买股票时,似乎本能地理解了这个想法。

那么对于那些不一定基于风险的策略来说如何呢?比如像动量策略这种可以从行为上解释的策略?

我的观点是从根本上说,一个投资策略必须足够难以坚持,否则的话,它的超额收益就会被套利掉。如果一个投资方法特别轻松的就能赚到钱,那么很多人都会采用,然后大量资金的涌入就会稀释掉超额收益。

所以可以说,某些策略——特别是低频交易策略,必须足够难坚持才能保证超额的存在。痛苦在这里起到的作用是:让策略不那么拥挤,让超额存在。

3、Diversifying, cheap beta is worth just as much as equally diversifying, expensive alpha.

分散的、便宜的的beta,与同等分散的、昂贵的alpha一样有价值

我把这条经验归类在“显而易见,但还是一定要说的事”。

我们这个行业痴迷于寻找alpha,但实际上,投资组合不关心到底是beta还是alpha。

如果你给你的投资组合引入了一个新的、分散的beta,那你会对它带来的风险溢价更有信心。

打个比方说,相比于挑选出更好的股票,不如在你的投资组合里引入债券,这从长远来看可能对你产生巨大而确定的影响。

对于大多数的投资组合来说,长远来看beta驱动了绝大部分利润。因此,在寻找新的alpha来源之前,最值得做的事是先把beta榨干。

4、Diversification has multiple forms
分散的形式多种多样
2007年,Meb Faber发表了《A Quantitative Approach to Tactical Asset Allocation》这篇论文,文中提出在各种资产上,应用10个月移动平均线作为择时模型。

这可能是在金融史上发表时机最好的论文——因为紧接着就是2008年的金融危机,10月移动平均线模型在保护资产方面表现的非常出色,正好验证了他的模型。

2013年我在博客里写到,这个模型的表现极度依赖rebalance date的选择。而Med最初写这篇文章时,采用月末那一天作为rebalance date。我在博客里展示了用一个月内每个交易日作为rebalance date下,这个模型的表现。我发现即使长期来看收益在统计上没有区别,但短期的分歧令人震惊。

不久之后,我的好友Adam Butler跟我说10个月的平均线选择也是任意的,为什么不是9个月?为什么不是11个月?为什么不是200天?为什么是简单移动平均线,而不是指数移动平均线或简单时间序列动量?这些选择带来的结果,长期看来没有区别,但短期会出现很大的分歧。

最后,我形成了关于分散投资的观点——分散由3个维度组成:买什么、怎么买、什么时候买。
买什么,是由你投资的内容决定的。

怎么买是做出投资决策的过程。包括不同的投资风格,如价值与动量。你怎么衡量价值?或者你用什么趋势模型?
什么时候买,就是决定你的rebalance date。

我们的目标应该是极力对所有无补偿的赌注进行多样化分散。

5、The philosophical limits of diversification: if you diversify away all the risk, you shouldn’t expect any reward.

多样化的哲学:如果你分散了所有风险,你就不会有任何收益

“这个策略能work到什么时候?”这是确保你理解任何策略本质的一个重要问题。

事实上是,如果一个策略一直有效,那所有人都会去做,最后的结果是这个策略不再赚钱。
如果你建立了一个投资组合,你就需要承担风险,不管是什么样的风险,它都会一直在那儿,你无从避开。

如果你追求一个在任何情况下都没有风险的策略,那么只能是花大价钱复制无风险利率。换句话说,如果你把投资组合中的所有风险都分散掉了,那么你的收益只会向无风险利率收敛。

6、It’s usually the unintended bets that blow you up.

让我们倒霉的通常是那些无意的赌注
让我们倒霉的很少是我们有意去做的事,而是那些无意的赌注——那些很晚才意识到的错误。

举个例子,在2010年年中的时候,大家普遍认为欧洲股票比美国股票便宜很多,然而,贸然涉足欧洲股票的投资者受到了惩罚。

简单地将美国股票换成外国股票就引入了巨大的货币风险,欧洲可能确实被低估了,但考虑到估值回归通常需要多年才能实现,任何对此交易的分析都应该包括对冲货币风险的成本,或者说,至少要对为什么隐性做空美元是一个值得下的赌注有所判断。

也可以说欧洲被低估这个结论本身就是错误的。Lawrence Hamtil 多次写过这个话题,他指出跨国和时间序列的估值比率分析都可能因行业差异而产生错觉。例如,美国股票指数倾向于科技行业,而欧洲指数倾向于必需消费品。调整行业差异后,估值差距显著缩小。

7、It’s long/short portfolios all the way down

投资组合说白了就是多头和空头

每一个投资组合,都可以解剖成做多一些资产,做空另一些资产。

听起来很简单,但却非常有力量。我举几个例子:

a.你在评估一个多头主动管理型基金时,可以用该基金的持仓减去其基准的持仓(例如对应市值加权指数),然后你得到一个多空组合,这个多空组合就是基金管理人的主动投注:多头主动基金中超配基准的资产,空头主动基金中低配基准的资产。这能帮助你判断管理人的主动投注类型、规模大小、是否可能覆盖管理费等。

b、当你考虑卖出一个资产,再买入另一个资产时,这笔交易等同于在你现有的组合头寸上,再叠加一个多/空交易:做多你要买的,做空你要卖的。这样你可以把这笔交易作为一个整体来看待,更全面地审视它。

c、当你分析投资组合的构建过程中,不同步骤是如何影响组合的风险和收益时,你可以把构建过程的每一步,都看作是一个多空组合。打个比方说,你构建了一个由标普500中50只股票等权组合的头寸,你应该把这笔交易拆成2个步骤来看,第一步是等权标普500指数减去标普500指数,第二步是等权50只股票减去等权标普500指数。
从这种多空组合的视角来评估投资组合,你能发现更有意义的洞见。

8、The more diversified a portfolio is, the higher the hurdle rate for market timing

投资组合越多元化,择时的门槛越高

不要在时机不合适的时候做事情。

在2010年多因子投资流行起来之后,因子择时也走入了视野。我读到许多文章建议在经济周期的某些阶段使用某些因子,其中有一篇文章使用了一系列经济指标来定义当时的经济周期位置,然后根据当时所处的环境轮换因子。

为了验证这个想法,我准备反着来做个实验。我不再区分经济周期,所有的经济周期一视同仁,然后在每个经济周期中随机使用一些因子。你猜结果怎么着?这只是一个简单的等权因子组合,结果表现依然亮眼。

想要做的比简单的分散更出色,是一件非常、非常难的事。

择时是一种非常狭隘的做法。与其去提高市场择时的预测准确性,不如把精力放在寻找增加投资组合分散性的方式上,而后者相对来说更容易实现。

在这条经验上,我还想加一点,那就是一个事情越容易预测,你从中获利的可能性越小。

9、Certain signals are only valuable at extremes
一些信号只有在极端情况下才有意义
我手上有一张图表,上面绘制了美国大盘股、中盘股和小盘股的估值水平。表中使用了价格与盈利率(PE)、价格与账面价值率(PB)以及价格与销售率(PS)三种指标,来衡量大中小盘股的估值水平。图中的结论是大盘股的估值高于历史平均水平,中小盘股的估值低于历史平均水平。

根据相对估值,轮换至中小盘股可能是明智之举。

但是这些估值指标在当前环境下是否仍然适用呢?2008年之前,大盘股中有大量金融和能源股票,现在主要是科技和通信服务股票;过去10年被零利率环境主导,如今利率超过5%;高利率环境下,大盘股和小盘股的再融资机会是否会有不同?大盘股和小盘股的行业构成差异大吗?利润率差距呢?来自海外的收入占比如何?负盈利公司如何处理?在整个企业都在贡献销售额的情况下,价格与销售率这一指标合适吗?

除此之外,可能还有其他你没有想到的因素,这些因素就是噪音。

几乎每个信号都存在噪音,问题是有多少噪音?我们认为一个信号的噪音越大,就需要更强的信号才能相信它的有效性。

10、Under strong uncertainty, “halvsies” can be an optimal decision
在巨大的不确定下,「二分法」是最优决策
在2010年代中期的因子大战中,公司之间就投资组合构建方法是混合法还是集成法发生了争论:

混合法:
  • 每个因子单独进行股票评分和选股
  • 形成不同的因子组合,例如一个价值组合,一个质量组合
  • 然后把这些因子组合混合在一起形成整体portfolio
集成法:
  • 不分因子,直接让每只股票在各因子上得到一个综合得分
  • 然后根据这个综合得分来选股
  • 选出得分最高的股票形成整体portfolio

这场论战双方实力强大,高盛支持混合法,AQR支持集成法。

我花了几个月的时间痛苦地思考哪种方法才是正确的。我读了论文,做了实证分析,我甚至推导了每种方法中的预期收益率。

最后,我无法说服自己选择某一边。所以我选择了二分法:组合的一半以混合法管理,一半以集成法管理。

此后,每当我面临选择,而各个选择存在很大的不确定性时,我经常会退回到“二分法”:当我无法判断应该使用哪种期权结构时,我会用二分法;当我无法判断使用哪种建模方法时,我也会用二分法。

11、Always ask: “What’s the trade?”

经常问:这笔交易做的是什么?

2019年7月,希腊10年国债的收益率与美国10年国债近乎相同。

到了12月,希腊10年国债收益率已低于美国10年国债40个基点。这怎么可能呢?像希腊这样的国家,它的国债收益率怎么可能比美国还低?

当某事看起来荒谬时,问一个简单的问题:交易是什么?如果这件事真的荒谬,我们如何从中获利?

在这种情况下,你可能考虑做多美国10年期国债,同时做空希腊10年期国债,进行一笔利差收敛套利交易。但你很快会意识到一个事:收益是不同货币支付的(欧元和美元),这之间存在汇率风险,而对冲掉汇率风险后,这笔交易的套利空间就非常小了。

当市场上出现明显荒谬的事情时,多问问自己:这笔交易做的是什么?思考如何从荒诞中获利,往往能够让我们看清楚荒诞的原因。

12、The trade-off between Type I and Type II errors is asymmetric

1类错误和2类错误的代价是不对称的

学术界痴迷于1类错误,文献中到处都是alpha显著性在5%水平的策略,他们刻意回避1类错误(假阳性)。

1类错误的代价是什么?我们交易一个1类错误的代价是随机噪音减去交易成本,再减去机会成本(错过了其他更好的投资机会)。

2类错误的代价是什么?我们会错过alpha。

这两类错误的成本是不对称的。1类错误的成本有限,主要是交易成本和机会成本,2类错误的成本会更大,因为会完全丢失有效的 Alpha。

一旦你意识到这2类错误的不对称性,稍微放宽统计要求将有利于发现真正的alpha。

13、Behavioral Time is decades longer than Statistical Time
行为时间远远长于统计时间


在现实生活中管理资金与在研究中管理资金非常、非常、非常不同。

在回测中,你看到一个低sharp策略的多年回撤期,你可能会信誓旦旦地说“我可以度过那段时期”。当它是一个十几年的回测时,几年看起来只是一个小起伏——仅仅是通往成功之前的一个小波动。当你的眼睛从左边底部巡视到右上角的净值曲线时,你在脑海中只花了几秒钟就经历了那个多年的回撤期。

然而在现实世界中,哪怕一年的回撤感觉起来都会像几十年。单纯地跟客户解释“策略的表现依然在置信区间内,没有任何证据表明我们的策略失效了”  是无济于事的。客户会要你做归因分析,销售会急刹车,客户会赎回。

14、Jensen’s Inequality

詹森不等式

詹森不等式说:一个函数作用在均值上的结果,和先作用再取均值的结果是非常不同的。

比如你构建了一个简单的动量组合,你对每只股票的动量进行打分排序,然后选取前100只股票进行等权重组合。
你想起了第4条经验,决定使用多个动量信号来使你的方法多样化。

现在的问题是:是先对所有动量信号取平均,然后根据平均动量信号的排名选择动量最高的前100只股票,还是用每个动量信号分别构建一个组合,然后对这些组合取平均。

詹森不等式告诉我们,这两种方法会导致不同的结果。函数的非线性程度越高,结果的差异可能越大。试想如果选取前20只或前5只股票,使用不同动量信号的结果可能有多不一样。

另外一个简单的例子,假设你有一些买入/卖出的信号,如果信号为正就做多,为负就做空。

如果你对信号取平均,那么你的头寸会是二元的:要么买入,要么卖出(比如分别有信号ABC,你取算术平均得到D=(A+B+C)/3)。

但是如果你根据每个信号分别决定头寸,然后再对这些头寸取平均,你会得到一个渐变权重分布的头寸(比如信号A买入,B卖出,C买入,根据这些信号分别买入头寸后,再取平均,得到综合头寸)。

你可以看到,詹森不等式在组合构建中起着巨大的作用。为什么?因为非线性无处不在。组合优化是非线性的,最大或最小仓位是非线性的,基于排序的截断是非线的。

总之,詹森不等式告诉我们,为了多样化而对事物取平均,会导致完全不同的结果。

15、A backtest is just a single draw of a stochastic process

回测只是随机过程的一次抽样
俗话说,没有人见过不好的回测。

我们这个行业,有充分的理由对回测保持怀疑态度。每位量化老前辈,都能讲几句在年轻时天真地运行回测,拼命过拟合和过度优化,以寻找圣杯策略的故事。

但这并不是说回测一点用没有。我们要意识到的事,每一次回测,其实是对随机过程的一次抽样。历史数据只能告诉我们当时发生了什么,而当时可能会发生不同的情况。

我们回测的目的,是了解随机过程的底层是什么样子的。

比如,我们改变参数会怎么样?改变出入场的时间会怎么样?改变滑点的影响会怎么样?

我常用的一个技巧是随机去掉回测期中的一段时间,看策略是否对特定时间段过于敏感或者依赖。如果去掉某段时间后,策略的效果变差,说明这个策略很可能过拟合了。

我也会让策略具有“预见性”,也就是人为地引入未来信息,然后找到最佳回测结果,以这个结果作为参考标准,来评估原策略应该达到怎样的预期。

做得不好的回测比不回测还糟,但做得好的回测,可以让你更深刻的理解策略的本质。

16、The Market is Usually Right
市场总是对的

在前面15条的基础上,我又添加了一条,那就是——市场总是对的。我用了很久很久才学到这个道理,久到我都不愿意承认。

市场总是对的。但并不是说没有例外。

我想到了在2021年时,加密货币现货和期货之间存在的套利机会。因为机构投资者投入有限,而个人投资者的杠杆需求无法满足,所以比特币、以太坊等主流加密货币的期货合约的利率超高,达到了20%以上。我觉得这应该是我能碰到的,最接近免费挣钱的机会了。

而这种事情往往是可遇而不可求的。

我认识到“市场总是对的”这个道理后,心态上发生了巨大转变。我不再一看到某事就说“市场错了”,而是先假设市场先生是对的,是我自己遗漏了某些信息,我必须列出我可能遗漏或忽视的潜在因素,并逐一排查解释,才能建立起市场确实错了的自信。
如果有帮助,就支持一下我呗
举报

评论 使用道具

发新帖
EA交易
您需要登录后才可以评论 登录 | 立即注册

简体中文
繁體中文
English(英语)
日本語(日语)
Deutsch(德语)
Русский язык(俄语)
بالعربية(阿拉伯语)
Türkçe(土耳其语)
Português(葡萄牙语)
ภาษาไทย(泰国语)
한어(朝鲜语/韩语)
Français(法语)