在知乎上看到一个类似的提问,大概的意思是,是否可以运用数据、统计、机器学习或者人工智能等技术方法,来玩香港赛马并且保证一定盈利呢?
这是个很有意思的问题,于是写了一点自己的体会,也发在这里和大家分享一下。
知乎原提问:
有人用机器学习来赌香港赛马并且成功赢钱的吗?
我的回答如下:
难得有个赛马的问题有这么多人关注
看了一下目前的回答, 大部分人都是不懂赛马的,所以都是从数据的角度出发泛泛而谈,
下面我从赛马的角度谈谈个人的看法
首先说结论,用机器学习研究赛马,世界上当然有人尝试过,但成功盈利的例子,目前还没有。
至于未来,我不敢说百分百没有,毕竟未来的人类有可能比我们高明到不知道哪里去了,但我敢说,这件事很难,很难,很难。
至于其他答案里有人说自己或者某某某已经有一套成功的方法,我只想说,假如你的方法真的有效,你还跑来知乎宣传什么,直接去赌赢钱不就行了。
这和那些宣传自己买股票一定赢的股票大师为什么不自己买,其实一个道理。
要知道,赛马产业发展至今三百多年了,破解赛马来赚钱这个想法,我们肯定不是第一个,在机器学习还没有被发明的时候,已经有那么多人尝试过用统计,数据或这样那样的方法尝试,然而,三百多年过去了,你听说过有谁靠这个发家致富了吗?
并没有。
下面具体说说这件事难在哪里。
首先,样本数量不够大。
这一点,目前最高票答案 @腾天已经提到,我就不赘述了。
其次,数据变量难以量化。
熟悉数据在体育中的应用的朋友,一定会知道麦克·路易斯在2003年出版的《Moneyball: The Art of Winning an Unfair Game》,此书大致介绍了美国职业棒球联盟的波士顿红袜队是如何运用数据明显改善球队战绩,并且用这一方法改变了整个棒球联盟甚至整个职业体育对于数据的看法。
但这套方法能获得成功,很大程度上就在于做回归分析时,球员的很多关键参数都可以用数字量化,比如篮球,我们说克里三分球牛逼,不仅是一种直观的感觉,还有很多细化数字,比如出手次数,命中率等等。
而在赛马中,很多决定比赛胜负的关键因素是无法用数字量化,而只能大概描述的,比如天气,比如跑道的软硬程度,而影响比赛最关键的因素马匹,就是一个最大的无法量化的变量。
赛马运动一个很大的特点就是,正式比赛的运动量远远大于平时训练。
什么意思?
打个比方,刘翔跑110米栏,我可以在赛前让他完全按照比赛的激烈程度去训练,这点运动量他最多一两天就恢复了,正式比赛跑下来,和训练水平,应该差不多。
我1月1号完全模拟比赛训练,得到很多参数,1月3号比赛,时间差不多,体能消耗不大,按训练水平去预判,基本八九不离十。
而赛马不同,因为赛马的正式比赛运动量是超过马匹的体能极限的,跑一场比赛至少要调整两个星期。所以平时马匹的训练只能按照基本的量去做,所以,即使是练马师和骑师,也只能根据平时运动量的表现去猜比赛的表现。
总而言之,巧妇难为无米之炊,你连基本的变量都没有,你怎么建模,怎么找规律。
最后,数据的解读需要专业的赛马知识,而同时在赛马和数据领域都拔尖的人才或团队少之又少。
即使数据的样本够大,可以量化的参数也多,这些总归是死的材料,解读这些数字,将其转化成有用的结论,需要对赛马运动的特性和规则极其熟悉和了解。
打个比方,闸门。对于赛马运动来说,跑内道还是外道这个数据是十分重要的,跑内道距离短,很多人认为是优势,但大家都跑内道,一般来说赛道的内道会更烂,有的人认为是劣势。
那问题来了,建模的时候,闸门这个因素,到底是加分还是扣分呢?
类似例子还有很多。
最后总结一下,样本少,参数模糊,解读不统一,破解赛马,一个字,很难!
版权说明
本文由赛马查理王原创,媒体转载前先获得作者授权。
赛马查理王
微信号horse-1984
PS
虽说通过数据破解赛马,达到一定可以赢钱,几乎是不可能。
但用数据改善投注,增加赢面是否可能呢,答案当然是肯定的。
下次有空,我再继续分享一些我在这方面做出的尝试。