前言
自1969年互联网开创以来,伴随着互联网的快速发展,直到今天我们已然步入了大数据时代,大数据时代的到来对金融学术界带来了巨大的影响,金融数据分析已然成为众多学者研究的热点话题之一。
而目前人们对投资者关注度是否与金融市场存在一定的相关性的认识还不够清晰,特别是对投资者关注度与黄金白银现货价格、股票市场之间的相关性还有待进一步深入研究。
本文将以百度指数的搜索量数据作为投资者关注度的代理变量,运用
DCC-GARCH模型来研究黄金、白银的投资者关注度与其现货价格、股票市场的相关性。
一、数据来源
其中所选取的数据跨度为2012年6月5日到2019年4月22日,数据频率为每天。由于百度指数数据只能在线查看,没有提供*载下**功能,因此运用Python对百度指数数据进行爬取。沪深300指数和白银数据均来源于东方财富。黄金现货数据来自于世界黄金协会。
二、趋势图
本文利用得到的原始数据绘制了黄金、白银现货价格、黄金百度指数和沪深300指数的趋势图。如图所示我们可以看出:首先,从整体上看,尤其是在较为大的转折点上,黄金价格和黄金百度指数的趋势整体上存在一定关联。
图中我们可以看出在2013年,由于黄金价格的持续下降,导致百度黄金搜索量大幅度上涨,而在接下来一段时间黄金价格呈现上涨趋势,百度对黄金的搜索量也逐渐下降到正常水平。
这些现象说明了黄金现货价格与黄金的网络搜索量存在一定的相关性,也就是说黄金的投资者关注度与黄金价格存在一定的相关性。
其次,从图中我们可以看出在2015年股票市场经历了疯狂的上涨和下跌,而在股市疯狂的下跌期间,黄金作为避险商品在股票市场下跌期间能够分散一定的风险。
为了寻求更加稳定的收益,投资者的关注度大多集中在黄金上,导致黄金的百度指数和黄金价格有所上涨,这些现象表明变量之间很可能存在一定的动态相关性。
最后,在2013年6月份左右白银价上涨对应着白银百度指数的上升。因此,从整体趋势来看百度指数与黄金、白银价格及沪深300指数可能存在一定的相关性,在接下来的实证分析中我们会继续验证这一点。

(以“黄金”为关键词百度指数数据趋势)

(黄金现货价格数据趋势图)

(沪深300指数数据趋势图)

(白银价格数据趋势图)

(白银百度指数搜索量数据趋势图)
三、收益率序列
本文选取黄金现货价格、白银现货价格以及沪深300指数收盘价数据,对收益率定义为:

其中Rt为在t时的收益率,It为t时的收盘价,下文三图分别为黄金、白银及沪深300指数的收益率序列。

(黄金收益率时序图)

(白银收益率时序图)

(沪深300指数收益率时序图)
根据上文三图的黄金、白银和股票市场的对数收益率图我们可以看出,数据序列在某些时间段内波动幅度较小,有些时间段波动的幅度则相对较大,在较大的波动后还跟随着一些较小的波动。
由此可以看出数据序列存在明显的波动集聚性,因此本文考虑采用DCC-GARCH模型来研究投黄金、白银的投资者关注度与其现货价格以及股票市场间的动态相关性。

(DCC-GARCH模型)
四、描述性统计
为了了解研究所选取的数据的数值特征,本文对样本数据进行了统计特征的描述性分析。具体为均值(Mean)、中位数(Median)、最大值(Maximum)、最小值(Minimum)、标准差(Std.Dev.)、偏度(Skewness)和峰度(Kurtosis)等统计量。


(百度指数数据、黄金、白银及沪深300指数的描述性统计量)
上表则为所研究的样本百度指数数据、黄金现货价格、白银现货价格以及沪深300指数的描述性统计量,以及金融数据的对数差分后收益率序列的描述性统计量。
根据表中的统计量我们可以得知:首先,百度指数数据有着最大偏度、最大峰度,其中最大值为128093和535759,最小值为3366和14671,最大最小值之间的相对差也高于其他变量。
百度指数数据与其他数据的偏差表明了其并不是金融数据。其次,从最大值和最小值来看,黄金、白银、沪深300指数的最大值为与最小值相差较大,数据波动比较大。
因此本文对黄金价格和沪深300指数进行对数差分处理,最终得到数据较为稳定。从均值和中位数来看,黄金和沪深300指数数据的中位数和均值都相差不大,表明其分布比较均匀。
从偏度来看,所样本原数据偏度均大于0,呈现右偏。而在对黄金价格和沪深300指数数据进行对数差分后,呈现左偏,且其绝对值趋近于0,更加接近正态分布。
最后,我们通过描述性统计直方图能够更加清晰的看到样本数据的峰度,峰度用于分析数据分布对于正态分布而言的陡峭或平滑程度。

(白银描述性统计直方图)

(沪深300指数描述性统计直方图)

(黄金描述性统计直方图)
从上文三个描述性统计直方图和统计量来看,相比于正态分布更加陡峭尾部更厚;根据每个样本数据JB统计量的P值来看,所有数据的P值均为0,均拒绝为正态分布的原假设,是完全的非正态分布,并呈现出明显尖峰厚尾的特征。
五、单位根检验
在对金融时间序列数据进行分析之前,为了避免相应的伪回归问题,我们将对时间序列数据进行平稳性检验,数据平稳则意味着时间序列的统计特征将不会随着时间的变化而不同。
因此本文运用ADF检验(趋势项和截距项)对数据的平稳性进行检验,并且将不平稳数据进行差分得到平稳数据。检测结果如下表所示:

(ADF检验结果)
从上表可以得出如下几点结论:第一,黄金和沪深300指数序列ADF值为-2.04946和-2.377177均大于5%显著水平所对应的临界值,不拒绝原假设,存在单位根,为非平稳数据。
- 百度指数数据序列均拒绝原假设,不存在单位根,为平稳数据。第三,在对黄金、白银和沪深300指数数据进行对数差分后得到数据序列DLAU、DLAG和DLHUSHEN300。
- 在进行单位根检验后得到ADF为-41.71476、-39.8912和-39.0951,均小于1%显著水平所对应的临界值,拒绝原假设,不存在单位根,为平稳数据。最后,各变量的数据都能够得到平稳数据,可以进行模型的建立。
六、滞后阶数
1、黄金滞后阶数
模型的阶数越大,就越能反应其动态特征。但是,滞后阶数过大又会影响到自由度和参数的有效性,所以我们应当选取最优的滞后阶数。
本文使用6种评判指标准则(LogL、LR、FPE、AIC、SC和HQ)来选择最优滞后阶数。得出结果如下表所示,根据如下结果选取,百度指数、黄金及沪深300数据的最优滞后阶数为6。

(黄金滞后阶数)
2、白银滞后阶数
输入最大滞后阶数后得出白银滞后阶数如下表所示,经过综合考虑,选取“*”最多的阶数做为白银的最优滞后阶数。因此,最优滞后阶数为8。

(白银滞后阶数)
七、格兰杰因果检验
为了更好地判断时间序列之间的相关性,可以通过格兰杰检验来判断序列之间的引导关系。
在经过平稳性检验之后,本文对百度指数数据、黄金数据、白银以及沪深300指数数据进行了格兰杰因果检验。得出结果如下表所示:


(投资者关注度-黄金价格格兰杰因果关系检验)
由于本文对黄金进行了格兰杰因果关系检验。本文黄金数据选取上图Lags:6、Lags:7、Lags:8作为格兰杰因果的滞后阶数,结果如下表所示。
由表中结果所知,在5%的显著水平下,百度指数与黄金价格的格兰杰因果关系检验值显著,表明百度指数是黄金价格的格兰杰原因。同时,结果表明黄金价格也是百度指数的格兰杰原因。也就是说,黄金价格与百度指数互为格兰杰因果关系。

(黄金投资者关注度-沪深300指数格兰杰因果关系检验)
本文还对黄金的投资者关注度和沪深300指数进行了格兰杰因果检验,根据上表可知,在5%的显著水平下,沪深300指数与黄金的百度指数格兰杰因果关系检验值显著,P值为0.0063,拒绝原假设,表明沪深300是百度指数的格兰杰原因。
百度指数对沪深300指数的P值为0.2936,接受原假设,百度指数不是沪深300的格兰杰原因,也就是说沪深300指数与百度指数仅存在单向因果关系。


(白银、投资者关注度及沪深300指数格兰杰因果关系)
在对白银、投资者关注度及沪深300指数进行格兰杰因果检验,得出结果如上表所示:首先,百度指数与白银之间格兰杰关系p值为0.0028和0.0055,较为显著,并拒绝原假设,两者互为因果。这意味着投资者关注度与白银价格之间存在双向因果关系。
其次,根据结果可知,沪深300不是现货白银价格的Ganger原因,反之,现货白银价格则是沪深300的Ganger原因,P值为0.0361,拒绝原假设,两者存在单项因果关系。
最后,沪深300指数与白银的投资者关注度P值为0.2668和0.4595,接受原假设,互不为格兰杰因果关系。
八、DCC-GARCH模型实证分析
本文通过LogL、LR、FPE、AIC、SC和HQ等6种评判指标准则确定最佳滞后数为6。
设计两段估计的DCC-GARCH模型,在第一阶段中,对每个残差序列估计单变量GARCH模型,在第二阶段中,在第一阶段的基础上构建DCC-GARCH模型,并且得到动态相关系数。
1、单变量的GARCH模型
首先,第一阶段对样本数据的残差进行GARCH模型估计,采用极大似然的估价方法,结果如表4.8所示:


(单变量GARCH模型估计)
根据上表结果可知,参数估计系数显著,这也就说明GARCH模型能够较好的拟合数据,黄金、白银、百度指数以及沪深300指数数据的波动性具有集聚性。
且ARCH(-1)系数普遍小于GARCH(-1)系数,说明条件方差对后期指数波动的决定更强。最后,ARCH(-1)系数和GARCH(-1)系数之和小于1,满足参数约束条件。接下来进行第二阶段,在第一阶段的基础上构建DCC-GARCH模型,并且得到动态相关系数。
2、DCC-GARCH估计
在估计出单变量GARCH模型,并保证了模型建立的前提假设之后,建立DCC-GARCH模型对投资者关注度与现货黄金、白银及股票市场的动态相关关系进行深入探究,模型估计结果如下表所示。

(百度指数、黄金及沪深300指数DCC-GARCH模型估计结果)

(百度指数、白银及沪深300指数DCC-GARCH模型估计结果)
根据模型估计的结果,所有参数都在1%的置信水平下显著不为0,且满足了theta(1)+theta(2)<1的要求,说明均值方程的设立较为合理,模型拟合情况较好。
一般来说theta(1)+theta(2)的值越接近1,动态相关关系越明显。说明,这反映出三个数据间都存在持续且显著的相关关系。
3、百度指数与黄金价格、白银价格动态相关性分析
本文通过LogL、LR、FPE、AIC、SC和HQ等6种评判指标准则确定最佳滞后数为6和8。
设计两段估计的DCC-GARCH模型,在第一阶段中,对每个残差序列估计单变量GARCH模型,在第二阶段中,在第一阶段的基础上构建DCC-GARCH模型,并且得到动态相关系数。最终得出动态相关系数图如下图所示:

(黄金百度指数和黄金价格动态相关性图)

(黄金百度指数和黄金价格动态相关系数描述性统计图)
上文两图为百度指数与黄金动态相关性图和相关系数的描述性图,从黄金百度指数和黄金价格动态相关性图中可以看出,百度指数与黄金价格相关性呈现出一定的时序性变化,即相关性随着时间呈现出波动性变化。
其相关系数的均值为-0.035731,最大值为0.475691,最小值为-0.755362。总体来看,百度指数与黄金价格在大体上均呈现出负相关关系。百度指数与黄金价格的这种负相关关系也就是说,黄金价格的下降对应着百度指数的上升。
由于投资者普遍认为黄金是一种安全资产,当黄金价格下降时,有很大的概率会恢复到其历史价格水平,黄金价格在短期内的下降会使投资者认为此时购入黄金有一定的升值空间,因此投资者对黄金的关注度则会上升。
但是羊群效应理论来看,在信息不完全的市场上,投资者较容易产生从众心理,当关注某一资产的人数较多时,投资者越有可能购买这一资产。
因此,投资者越关注黄金,购买黄金的可能性越大,也就是说百度指数越高黄金价格也应当上升,而格兰杰因果关系检验也证明了两者之间存在双向因果关系,为进一步探究百度指数的变化对于黄金的影响,本文选用VAR脉冲响应函数进行分析。

(黄金价格对百度指数冲击的响应)
从上图可以看出,当黄金现货价格受到百度指数的正向冲击时,在第一期时先逐渐上升,然后在第二期时达到顶峰,这是由于投资者对黄金的关注度越高,投资者购买黄金的可能性越大,黄金的价格就会逐渐上涨。
另一方面,从图中也可看出在百度指数给黄金价格一个正向冲击后,虽然黄金价格是上涨的,但是随着时间的推进,这种影响会越来越小并逐渐消失。
综上所述,黄金作为一种安全资产,长期来看其资产价格是较为稳定的,当黄金价格下降时,投资者则会觉得此时能够以比通常价格更低的价格购入黄金,会有一定的升值空间,因此投资者对黄金的关注度则会上升。
投资者关注度上升时,由于羊群效应,购买黄金的投资者相对较多,这时会导致黄金价格的上涨,随着时间的推移这种影响会逐渐减少并消失。而百度指数对黄金价格影响的滞后性也会成为投资者对黄金价格预测的一个指标。

(白银百度指数和白银价格动态相关性图)

(白银百度指数和白银价格动态相关系数描述性统计图)
根据上文两图白银百度指数和白银价格的动态相关性图和相关系数描述性统计图我们可以得知,投资者关注度与白银价格均值为0.092939,中位数为0.097162,最大值0.328669,最小值为-0.222237。
负相关系数出现在2013年和2014年底,这可能是受到国际国际形势的影响,尤其是2013年美国政府停摆和2014年瑞典黄金公投失败导致白银价格大幅度降低,进而引起白银的投资者关注度的上涨。
而从大部分的时间来看,白银的投资者关注度于白银之间的相关性存在正相关关系。
根据格兰杰因果检验,两者之间互为因果关系,这表明白银的投资者关注度变化会推动白银价格的变动,而这种变动为正向关系,这与黄金的情况一致。
另一方面,白银价格上涨或下跌,也会带来白银投资者关注度的同向变化,没有表现出黄金作为安全资产的反向变动,说明了白银的商品属性较强,其关注程度更容易受到资产价格的正向影响,这与我国对白银的工业需求量较高有一定的关系。
4、黄金、白银的百度指数与沪深300动态相关性分析

(黄金百度指数与沪深300指数动态相关性图)

(黄金百度指数与沪深300指数动态相关系数描述性统计图)
从上文两图中可以得知,黄金百度指数与沪深300指数指数的相关性呈现出一定的时序性变化,即相关性随着时间呈现出波动性变化。
根据黄金百度指数与沪深300指数动态相关系数描述性统计图可得知,百度指数与沪深300指数相关系数均值为-0.088030。
在研究的大部分时间里,黄金的百度指数与沪深300指数都存在负相关关系,前文的个格兰杰因果检验也说明了沪深300指数是黄金百度指数的格兰杰原因,也就是说当沪深300指数下降时,对应着百度指数投资者关注度的上升。
由前文黄金投资者关注度-沪深300指数格兰杰因果关系检验可得知沪深300指数是百度指数的格兰杰原因,这也就说明在沪深300指数出于下跌阶段时,投资者为了寻求更加稳定的收入便会把关注度放到对于股票市场而言是一个良好的避风港的黄金上,因此,投资者关注度和黄金价格便会大幅度上升。
从图中可以看出,在2016年沪深300指数在这一时期与百度指数呈现出高度的负相关性。这也正说明了,在股市经历了2015年的疯涨之后开始出现下跌,而在这期间,投资者们也纷纷把关注度投向收益更加稳定的黄金市场中。
白银的百度指数与沪深300之间不存在格兰杰因果关系,而黄金的百度指数与沪深300存在因果关系且相关系数为负,说明白银相对于黄金来说,其安全资产属性较弱。
总结
投资者关注度和黄金、白银价格、沪深300指数之间存在一定的相关性,通过观察趋势图可以看出,黄金投资者关注度与黄金价格、沪深300指数之间的趋势是大致相反的。
尤其是在较大的转折点上,黄金价格的下降对应着投资者关注度的上升,沪深300指数的下降对应着黄金的投资者关注度和黄金价格的上升。白银投资者关注度与白银价格整体走势较为一致,两者与沪深300的走势无明显关联。
投资者关注度上升时,由于羊群效应,购买黄金的投资者相对较多,这时会导致黄金价格的上涨,随着时间的推移这种影响会逐渐减少并消失。而百度指数对黄金价格影响的滞后性也会成为投资者对黄金价格预测的一个指标。
免责声明:文章内容如涉及作品内容、版权图片或其它问题,请在30日内与本号作者联系,如反映情况属实我们将第一时间删除责任文章。文章只提供参考并不构成任何投资及应用建议。