因果性和相关性 (相关性因果性例子)

因果关系,是预测未来的最终级的*器武**,属于“硬逻辑”。因果关系更加可靠。理解了因果关系,你才能更坚定地执行你的交易系统。相关关系属于“软逻辑”,统计学得出的规律揭示了相关性,但是不能揭示因果性,任何在统计学上有意义的规律,都可能只是“软逻辑”,这就是为什么技术指标这个东西时而有效时而无效的原因。我们做量化策略的时候经常回测各种各样的因子有效性,但是回测只能发现数据之间的相关性,因果关系还要你自己去做判断。当因果关系不存在了,相关关系就会变得很脆弱。

一、相关性不等于因果性

相关性指的是两个事情同时出现了而且都被观察到了。而因果性指的是一个因素导致了另一个事件的发生。有相关关系的两个事件不一定有因果性,从相关性去推导因果关系的时候容易犯三个错误:

1、误解随机性

小概率事件无缘无故发生了,巧合的发生没有什么道理。单纯的随机性可以导致虚假相关,说明两个变量在这段时间恰好有同涨同跌的趋势。这种趋势“恰好”发生在了同一时间段。我们总是把一些随机事件碰巧发生当做是一件事情导致另一件事情的发生,这样我们就会对未来有了掌控感,殊不知,巧合事件就是巧合事件,两件事根本没什么因果关系。

2、倒果为因

人们总是习惯将先后发生的两件事强行加上因果关系,将发生在前的事情当做是原因,把发生在后面的事情当做是结果,从而颠倒了因果顺序。

雄鸡一唱天下白,但是鸡叫并不导致日出。

游泳运动员都身材好,是因为游泳有塑形的效果吗?不一定。二者是有相关关系,但有可能由于国家队的游泳健将选拔的时候,身材不好的那一波人已经落选了,是因为身材好才导致的这个人适合游泳,留下的都是身材好的,这就跟名校和好的生源的因果关系一样。看似相关的数据,其实跟结论没关系,相关性和因果性在此处被模糊了。

家里面存放了20年的老物件都没有坏,能否推出,过去制造的物品质量比现在的高?进而推出市场经济使得人们唯利是图,不注重质量把控了?其实也有可能是因为老物件质量太好了,它才能流传下来,质量不好的物件不会变“老”,它们早就被你扔到垃圾桶里面了。

一个胖子总是喝可乐,但是你无法判定到底是他喝可乐变胖的,还是因为他本身是个胖子,胖子本身就倾向于爱喝可乐。

又或许,是他体内某个特殊的基因,决定了他会变胖,而且这个基因决定了他爱喝可乐?这可能就引出了第三个错误——

3、混杂因子影响

在《为什么》一书中,作者探讨了影响因果关系成立的大敌——混杂因子,并且探讨了如何去除混杂因子的一些方法,混杂因子,可以简单理解为“他因削弱”,因为某个第三方的原因,原来的因果关系的认知被削弱了。比如说,你感冒了,既吃了中药,又吃了西药,然后你感冒好了,你就不能判定到底是中药起了作用还是西药起了作用。

喝红酒的人很健康,我们却不能得出多喝红酒有助于保持健康,因为买得起红酒喝的人一般都很富裕,富裕的人群医疗环境好,更健康长寿。是富裕这个因素导致了“喝红酒”和“身体健康”两个事件同时发生。富裕就是混杂因子。我们可以说,红酒中的某种物质软化血管,有益健康,也可以说,天天喝的起红酒的人是富人,富人本身健康状况就比一般人要好。

那么只要这个世界不发生变化,那么我们为什么要执着于找到到底是哪个原因导致人的身体健康?我们只需要保证喝红酒和身体健康一直保持强相关性,我就能用“喝红酒”这个因子,把身体健康的人“大概率”筛选出来,尽管这样会漏掉一些不喝红酒身天健康很好的人,但是这样做只要是保证大概率是对的就已经很成功了,那么还要探求因果关系作甚?我只是从黑箱外部观察这些因子,用数理统计的方法就足以得到我想要的结果了。这也是为什么很多量化模型抵抗不了黑天鹅对策略的冲击,因为这样的思维是线性外推,忽略了现实世界的易变性。当然,这样的方法有时候会短期有效。

车祸都在离家近的地方发生。如果这句话是真的,那么你能否得出“在离家近的地方驾驶比在远处驾驶出车祸的可能性要高”的结论?当然不能!因为人们本身就是在离家近的地方驾驶频率和时间都要远大于出远门的时间和频率。

森林大火和冰激凌的销量看起来有正相关关系,殊不知其实二者数量上升都是因为炎热的夏天来临了。

当然,混杂因子还会以另外一种因果链条影响你的判断。以市场上常见的日历效应为例:

①春节将至————>②结果:股市上涨

①春节将至————>②银根紧缩,银行释放流动性————>③结果:股市上涨

如果你不理解①因子春节将至和结果股市上涨之间还会有②因子流动性影响,那么当你单单使用①因子来预测股市,而②因子并没有发挥作用的时候,那么你的①因子就有随时失效的风险。每周四为什么会有“法定下跌”一说?可能是因为周四卖出,周五银证转账,周六就可以消费,这样会造成周四抛盘加大。

我们说不清这到底是为什么,只是对统计学有这样的规律感到惊诧。

我们会因为什么原因出金呢?还房贷?还信用卡?大额消费?就医?其中大额消费的日子可能会有一定的规律性(周末),其他需要出金的日子分布的就会很随机,说不好是哪天。

并不是时令和股票涨跌有什么因果关系,而是有一个中介因素在影响着股市的涨落。

因果链条不清晰,我们就无法直接使用相关性

反过来讲,有因果关系的两个事件,就一定具有相关关系吗?也不一定。举一个例子:*爱做**能导致怀孕。但是如果统计学家去统计“*爱做**”和“怀孕”两件事发生的相关性,可能只能统计出正相关性,但是相关系数很低,或者没有相关性,因为人们会避孕,而且*爱做**的频次和怀孕的频次线性相关的程度不强。

综上所述,相关性不等于因果性,因果性也推导不出来相关性。

我们处理数据和信息的方法到相关性就戛然而止了,相关关系并不能直接证明因果关系的存在,寻找因果关系这件事,并不像我们想象的那么容易。

那到底该如何判断因果关系呢?

相关性与因果性区别,因果性和相关性哲学