数据科学与商业分析对比 (数据科学是骗局吗)

本篇Marco Blume的广播采访文字分为五部分(Part .1- 5)

Marco与Hugo讨论了数据科学在大规模的赌注与*彩博**市场的作用。

Marco Blume,Pinnacle Sports的交易总监谈到他如何培訓数据科学家

Hugo:Marco,欢迎来到Dataframed。

Marco:您好,Hugo,感谢您的邀请…

Hugo:非常荣幸邀您参加这个栏目,我真的很高兴能与您讨论运动*彩博**,作为交易总监,数据科学如何扮演在运动*彩博**中扮演重要角色的。在您的工作中运动*彩博**不仅仅是运动本身,在Pinnacle您做了很多不同品种的产品(Bets),我很高兴能够揭开面纱。但在我们完成所有这些之前,我想先了解一下你的情況,所以我想知道你的同事会认为你做的什么?

Marco:我的同事们?风险管理,我想这是最好的评价,我负责Pinny所有相关交易的风险管理,囊括所有运动,滚球,赛前盘,交易的方方面面,我负责Pinnacle的风险管理。

Hugo:太棒了,您的同事是否认为您做了很多量化的事情,他们对您的日常生活有所了解,或者认为这就是全部,比如短讯跟白板,笔与纸,或者撸代码或者烤模型。

Marco:这对他们来说很多像个黑盒子。一天结束,他们中大多数都有自己专业的领域,交易部门的内部工作过于复杂与具体。如果你深度视角看对其他领域了解多少,但我认为大多数领域都是如此。对他们来说日常工作不为人所知,所以,我的日常工作是什么…

1.Pinnacle

Hugo:是的,我认为你是对的,这么多学科专业化程度越来越高。当我们沿着这条路走下去,事情也越来越变得越黑盒子。所以,也许我们可以退后一步,你可以告訴我一点,Pinnacle事实上做了什么…

Marco:2018年是我们成立20周年。我们是世界上最大*彩博**公司之一,我们以高效的价格反馈而闻名,我们被定义……有些人认为拿我们与纳斯达克的市场价格比较,人们熟知的传统*彩博**公司通常处于休闲娱乐领域。而Pinnacle是一家真正的*彩博**公司,这意味着我们的低利差(Margin,抽水优势),高可交易额度(Limit),我们网站没那么花哨,但我们有一个与人互动的API,我们是一个真正,真正的*彩博**网站,试图将体育比赛与其他活动进行量化分析,并允许其他人建立对立模型向我们下注。

Hugo:那么作为交易总监,您的日常工作是怎样呢,你的实际工作内容是什么呢?

Marco:我觉得,这很大取决于赛季。所以,运动非常有季节性,你有大型活动。比如今年夏天有世界杯,大大改变了我的工作,但整体上会与我们的经理人坐下来,持续一周,甚至一个月,讨论我们想要推出的产品计划,讨论我们需要的模型,讨论我们尝试的新策略。总体上讲,就像我们不断改进我们的产品,显然需要对我们要尝试的事情进行分析,这就是*日我**常工作的面包与黄油。

Hugo:那么,你是如何进入数据科学领域的。

Marco:纯粹的力量,我一直是一个数学客。但我从没有参加数据科学,一旦我们建立量化团队,我们量化开始,之前使用Excel做任何事,然后量化团队使用R,他们在R里写代码,我们发现他们的效率快我几个数量级,他们可以轻松访问这些数据,因为Excel的限制,我无法访问这些数据。所以我开始上Coursera课程,开始上课与写R代码

Hugo:您参加过那个Coursera课程?

这是很好的第一堂课。他们被认为是数据科学的启蒙。

Hugo:那是Roger Peng和Jeff Leek。

Marco:是的,Roger Peng和Jeff Leek。這是我学习的第一门课程。

Marco:难以置信的坚持,我不是码农,所以对我是全新的,我认为对我来说是一个非常艰难的过程,实际上我有很多挣扎。事情上我知道我们的团队有足够的专业知识,如果我有疑问,我可以得到答案。我完全知道我的目标,所以我脑海里目标清晰,我想要达到什么目标?我想要直接与我们数据交互,我想要直接访问我们的数据库并进行分析,不必向某人询问数据。数据有些缺失的列与缺少属性,需要再次询问他们,并将需要提供給分析团隊。我只是想減少流程并且亲力亲为。

2.分析与数据科学对市商的作用。

Hugo:有些人可能会围绕着数据科学与运动*彩博**的维恩图表提出问题。到目前为止我很想知道,分析与数据科学对市商的作用是什么?

Marco:在*彩博**世界,你有一些数据载体,这将变得很有趣。你有经典的体育分析,这项运动是如何展开的,赛伯计量学是了解Baseball的人,他们在很多地方都是领先的。但是现在很多运动都有指标,想法与理念,特别是欧陆足球,都有高水准的运动分析,这都是围绕体育数据分析的领域。因为我们是交易所,我们有进进出出的流水账。因此我们根据风险管理与博弈策略进行了财务分析。我们在这两个世界有很好的重合,并且必须分开管理,并最终完成交互,这是最困难的地方。

Hugo:我确定,当我们今年早些时候第一次对话时,一直以为体育*彩博**只是关于体育,你睁开眼睛可以在Pinnacle可以进行各种各样的下注。所以我想你可以用你的思维方式让我们了解一下在Pinnacle的体育品种内外更有意思的投注。

Marco:你可以下注你想象中所有的运动,包括飞镖与国际象棋以及你看到所有的东西,显然是电竞。非常视觉化的运动,非常受到欢迎。但还有选举(政治),政治(选举)是一个非常大的投注市场。你有一些更奇特和有趣的東西。既然是在纽约录制的,我们可以开吃Nathan熱狗的比赛,我确定Kobayashi很能吃,我记得我们的那个教皇选举是一个有趣,为教皇选举定价。

Marco:所以这几乎是世界上所有的事件,你甚至可以去做有关《权力的游戏》的事情,我们有一个《权力的游戏》的盘口,谁将在赛季结束时在铁王座上。奥斯卡,金球奖,你的名字,字面上你能想到的任何事件你都可以下注。

Hugo:这太不可思议了,当然,我不希望你放弃你的IP,当然你不会,但我想知道,让我们参与吃热狗比賽或权力游戏,或者谁是下一任教皇?我想知道你的确切说法,我的意思是我知道你专业,但在局部领域我不那么认为。

Marco:这显然是零专业知识,我们谈谈教皇,我们读了民粹主义作家的专栏,人们相信什么是真相,我们根据这个定价,我们没有内幕消息,我们对此一无所知。但我们读了一下,我们试着更好的定价,用你的影响力让群体塑造价格的市场效率。《权力的游戏》也是,本身我们是狂热的粉丝,所以我们推测自己。但我们不知道,我们沒有内幕。我們不认识George RR Martin或任何人。这是在猜測。

Marco:公平坦率的讲,这些都是泛化的赌博,比如A,比方说在一场足球比赛中,你可以做50万甚至百万美元的交易,另一些Limit可能就很低,可能只有1000刀,有些可能5000刀。不同品种的价格审查程度存在差异。

Hugo:所以在定价规则方面,我的猜想,我认为你有一些模型最终产生概率分布或者概率质量函数或是密度函數,根据这个结果的分布进行定价。你能告诉这个过程中辨识的困难,但也许你可以在一個特定的例子中说一下。

Marco:这个需要看情况,真的,真的需要看情况。所以是的,这显然正像你说的那样,在某些方面,他可能是市场价格,因此市场有了价格,但我的意思是,打开交易所交易苹果股票,我们并不用进行所有的分析。我的意思是苹果股票能在很多交易所交易,所以你应该知道价格的多少。运动*彩博**市场也有相同的情况,太多太多公司存在,他们的工作是相互关联的。

Marco 特别当你提起滚球时,我们有大量的模型在运行,并且需要提供大量的输入,对数字进行处理会吐出一些东西。还有几层模型,各种人工智能与机器学习的元素。复杂程度这取决于运动的品种与投注量,投注量越多,越复杂,因为另一端的人更复杂。