0.<序>
直接T+0的ETF作为国内ETF的特殊品种,受到很多T0团队的青睐,其低成本无底仓的特点,对于小资金量的个体交易员尤具吸引力。但是直接T+0的ETF操作起来并不容易,上下盘口移动速度很快,冲击成本极高,一般都采用提前挂单操作,高频超短套利经常就赚一个档位,能否比别人更快的判断出买卖点,是策略成败的关键。本篇从定量角度来分析豆粕ETF和豆粕期货的相关性,然后设计一个均值回归的策略。
回到量化这个主题,发现有很多事情要说,各种概念、方法、策略、数据接口乃至编程语言都千奇百怪、丰富多彩,条件单算不算量化?不会编程能不能搞量化?学习量化,数学要不要补补课?同为量化爱好者,不同的经历会带来不同的见解和答案。但是个人认为,量化是有门槛的,虽然一直推崇普适化的大众化的量化,道友们可以不懂朴素贝叶斯,也可以不会matlab或者python,但是对于量化的认知和逻辑一定要有,量化不是只有数学博士或者诺贝尔奖得主才能搞,也不是买个券商的AI交易模块就可以迈进量化交易的大门。
实践是检验真理的唯一标准。量化不能只做回测不做实盘,有想法就要尝试,真金白银的去尝试,入行十余年,任何赚钱的策略都不是拍脑袋凭空想出来的,而且想要跨越牛熊、保持稳定盈利更是难上加难。
1.<数据接口比较>
书归正传,探讨豆粕ETF和豆粕期货的相关性,首先要获取二者的数据,本来构思的是用wind或者iFind作为数据接口,用matlab作为编程语言,秀一把小众的matlab,奈何wind现在巨贵,iFind也不便宜,用自己的钱来买确实肉疼,于是乎四处化缘,从机构的朋友那里借账号,最后借到iFind的试用账号(这里感谢一下某岛某财证券的于总),程序也编好了,数据也*载下**了,然后iFind销售打电话来问要不要买正式版,不到两万一套。不买,绝对不能买,能白piao为什么要花钱?所以今天要写文章,发现账号权限被取消了。
付费的数据接口确实好用,机构本来就有钱,而且集体采购价格会有优惠,个人量化交易者花个几万来买数据接口确实没必要。有需要搞wind和iFind数据接口二次开发的道友,可以联系我们。
考虑到大部分道友都没有这两个比较贵的数据接口,所以我们用免费的数据接口,方便大家复现数据处理过程。
其实爬虫应该也可以,爬虫技术用于非商业场景的研究还是可以的,技术无罪,各位道友不要用于非法用途,特此声明。本号后续会专门写一篇文章介绍一下,python爬虫如何在套利场景中应用。
这里要特别提一下,国内有一个伪免费的T**share接口,打着免费的名义,行会员收费积分制之时,花钱买积分才能使用有用的数据,不然只能获取垃圾数据,不要上当,花钱事小,浪费时间不值当。
我们来试一下AKshare。
2.<AKshare的安装和使用>
为什么是AKshare?因为数据丰富,关键完全免费。做可转债量化的朋友在伪免费数据接口T**share对可转债数据收费后,大都被迫交了钱冲会员积分,这种绑架很无奈,换成AKshare吧,有任何问题可以咨询在下。
开发平台建议使用Pycharm社区版,Python版本使用python3.9,这里默认大家都已经成功安装并会使用,如果确实不会,还是可以咨询在下。
AKshare包的安装代码:pip install akshare
在命令行窗口输入,用管理员身份启动窗口。
3.<AKshare数据获取代码>
如下简要给出豆粕ETF和豆粕期货在AKshare上的数据获取代码。
import akshare as ak
#豆粕ETF数据获取
doupoETF = ak.stock_zh_a_minute(symbol='sz159985', period='1')
print(doupoETF)
#豆粕期货数据获取
doupoQH = ak.futures_zh_minute_sina(symbol="M2308", period="1")
print(doupoQH)
下一篇将详细讲解数据清洗和预处理过程,敬请期待。
本篇是ETF系列到量化系列的过渡之作,量化既不神秘也不复杂,很多人喜欢把量化神化妖魔化,其实大可不必,即使没有超级计算机,即使没有获得过诺贝尔奖项的顶级科学家,同样可以研究并使用量化,关键在于思维逻辑,现阶段还远未达到拼毫秒算力的时候。