作者简介
邱东,曾任东北财经大学校长、中央财经大学*党**委书记,现为江西财经大学讲席教授。
原载于《经济学家茶座》2016年第2期(总第72辑)

从GDP被误解看经济统计意识的必要性
一GDP(国内生产总值)的名声很成问题。可值得我们深思的是,无论是国内还是国外,对GDP的严厉声讨并没有将它赶出经济社会大舞台。春秋流转,南北东西,人们还就是离不开GDP。
它是世界各国经济统计中最基础也最为核心的指标,应用也最为广泛。几乎人人都需要用到的“这玩意儿”,就算您不屑亲自用,间接使用也是避免不了的。然而,社会上对它的误解、误用也最多。
在中国,GDP曾经是为政之要,有所谓“GDP中心主义”之说。当资源、环境等与经济发展的社会矛盾凸显之后,GDP也被不少统计“局外人”攻击为万恶之首。什么事情没搞好,往往会有人跟上一句:“都是叫GDP闹的”。GDP甚至成了网民口中的“鸡的屁”,似乎属于绝对应该废掉的东西。
也有强调GDP至关重要的,但好多人内心里不大认可,他们总觉得经济统计没有那么“高大上”。甚至在不得不翻阅和使用世界经济统计手册和年鉴时,他们也常常抱有居高临下的态度。
还有的误解经济学概念,引发了对经济统计指标的疑惑,比如:为什么发生了火灾或交通事故、自然灾害,乃至恐怖袭击、小型战争等损毁,GDP不降反升?这不是统计造假又是什么!
铿锵抨击之中,有对存量和流量的混淆,有对本期新生产财富量和财富总积累量的混淆,甚至还有对实证研究和规范研究的混淆,对GDP测度目标的误解,人为地给GDP强加道德责任,等等。
GDP当然不是尽善尽美,但种种误解并不是GDP自身的毛病,归结起来,这其实是经济统计意识欠缺的表现,是经济统计文化欠发达的表现。
一个国家发达与否,物质产品固然重要,但公共产品、思想产品或文化产品的分享程度恐怕更为关键。不幸的是,社会上长期对核心指标的误解严重影响了经济统计作用的正常发挥。
我们知道,国际组织在发布经济统计某个专门领域方法手册时,常常会伴有FAQ——“经常会被问到的问题”,这属于科普性的读物,对象是广大民众,不需要求甚解的人群。
编写这种读物,属于经济统计学者对社会的贡献,方便民众使用统计指标及其数据,也是为了弘扬和普及经济统计文化。有的人把这种手册当成了经济统计学问的全部,也当成了经济统计没有学问的铁证。
曾经有位看上去非常聪明的大牌“海鸥”(据说不是“海龟”)亲口教导我们说,经济统计指标很容易懂,挺厚一大本书,无非就是指标解释,花个半天时间就能读完。
读过之后便可在经济模型里应用,简直是所向披靡,一点问题都不会有。按照这个口气,经济统计实在没啥可学可问的。我这里姑且抬一次轿子吧,这位号称经济学家的洋博士对经济统计的态度,跟美国历史上一位参议员罗伯特·肯尼迪能有一拼。
二
罗伯特·肯尼迪何许人也?大名鼎鼎的美国总统约翰·肯尼迪的弟弟,当过美国司法部长,也是位大政治家,一位受人尊敬的理想主义者,1968年遇刺身亡。就在当年的一次竞选演讲中,他强烈地抨击了GNP:
“如果我们用它来衡量美国---这个国民生产总值包括了空气污染和香烟广告,以及为交通事故而奔忙的救护车。它包括了我们装在门上的特种锁和关*锁撬**的人的监狱,包括了我们对红木森林的破坏和因城市无序蔓延而消失的自然奇观。
它包括了凝固汽油弹,包括了*弹核**头,包括了警察用来应付城市骚乱的装甲车,包括了惠特曼步枪和斯佩克刀,包括了为了向孩子推销玩具而美化*力暴**的电视节目。”
“然而,这个国民生产总值不包括我们孩子的健康,他们教育的质量和游戏的快乐。不包括我们诗歌的美丽,我们婚姻的坚强,我们公众辩论中的智慧,和我们官员的正直。它不包括我们的机智和勇气,不包括我们的智慧和学问,不包括我们的同情心,不包括我们对国家的热爱。”
“总之,它衡量一切,却把那些令人生有价值的东西排除在外。它告诉我们美国的方方面面,却不能告诉我们为什么为她自豪。”
在当时的欧美,国民经济统计的核心指标是国民生产总值(现在GNP的专业称谓是国民总收入GNI,GNP只是一个沿用说法),而不是GDP。不过,二者的区别并不影响我们对经济统计核心指标的基本评价。
R·肯尼迪的GNP观,可以作为社会人士误解经济统计核心指标的典型代表。我从以下五个方面加以评论,期望人们对GDP等指标能够有最起码的认知:
第一,R·肯尼迪说GNP包括了空气污染和环境退化,这是不确切的。GNP包含了可能导致空气污染、环境退化的产品生产,但其数据并没有包括空气污染和环境退化本身。还有,R·肯尼迪列举的“特种锁”等项目属于“遗憾性产品(the regret product)”,经济统计对此类指标的口径问题进行过系统研究,专业结论还是应该包括在GNP中。
因为经济统计指标并不是道德法官,GDP不能只测度对人类有益的经济行为。其隐含的道理在于:在不同人的眼中,有益于否的标准可能截然不同。如果一味固执道德标准,就压根儿无法进行全社会的增加值统计,那就等于放弃了任何经济指标对产出的统计。
(2)“健康”和“教育质量”可以测度,但未必一定要完全由GNP来测度。不同指标应该有不同的功能,不能让一个指标承担本应该由其他指标承担的功能。而“游戏的快乐”等余下十个项本身未必可测,恐怕任何指标都无法担当测度那些项目的使命。
说到那些项目,R·肯尼迪实际上是在玩蹦极,从极端否定跳到极端肯定:GDP应该无所不能,想测啥就测啥。试想:硬要测度原本不可测度的事物,得出的所谓测度结果会是什么样子?其可靠性如何?将会产生什么样的社会影响?不确定性风险实在太大。
还有一点需要注意的是,小样本社会专项调查或许可能得出某些所谓的测度数据,但这并不意味着该项目在经济统计意义上可测,专项调查与大规模常规统计在可行性上差距相当大,经济统计是受到“持久资源约束”的,决不能信口开河,决不能与一次性测度行为混为一谈。
(3)GNP应该是综合性最强的经济指标,即便如此,它也不能测度所有经济现象,遑论外加上社会现象。任何指标都不可能“衡量一切”,单个指标决不可能告诉我们一个国家的方方面面,R·肯尼迪的说法很煽情,但也很夸张。
GDP没有把所有“令人生有价值的东西”统统包括在内,但它所统计的内容总体上还是“令人生有价值的”。GDP的确不能告诉你为什么祖国自豪的所有理由,但在其他条件相同的前提下,GDP提高总比其下降为好,它或许是你为祖国自豪的重要支撑之一。
(4)GNP也许不那么完美,然而到目前为止,人类还没有创造出更好的单项综合指标来替代它。R·肯尼迪讲演中没有提到要计算“幸福指数”,但却隐含着开展那种计算的强烈动机。从历史上看,幸福指数几度热炒,但后来都不了了之,其主要原因之一便是其发动者的“无知型无畏”。
迄今为止,最流行的是所谓“国民幸福指数”(GHI),不过距常规统计仍有难以逾越的鸿沟,顶多只是处于“头脑风暴”和小范围试算阶段。而且,幸福指数在计算性质上属于“合成指标”,而GDP属于价值指标,二者在指标类型上大有区别,这又牵涉到经济统计方*论法**研究的一个特别领域,两类指标其实是不应该混为一谈的。
(5)R·肯尼迪极端地关注经济测度的必要性,而完全忽略了经济统计的可行性。他或许是一个优秀的政治家,但他的这段讲演表明,他极缺乏经济统计的常识,压根儿不懂GNP的指标口径,不具备经济统计的基本意识,在经济统计方面完全是个门外汉。
知之为知之,不知为不知。R·肯尼迪固然迎合了社会上某些人的口味,或者说引领了基于非专业态度和水准的某种偏颇情绪。他缺少对经济统计起码的尊重,跑到属于自己思维短板的领域里“大放厥词”,露怯自然是难免的。国内一些人不明就里,却喜欢引证R·肯尼迪的话奉为圣旨,无异于东施效颦。可如果有人揣着明白装糊涂,那品行实在低下。
三
R·肯尼迪还只是针对一个指标发难,而我们那位大牌海鸥则是全面地看低经济统计指标。单从计算方法上粗粗地看,GDP不过是所构成要素的加总,似乎只用到四则运算。连核心指标都这么“小儿科”,经济统计的确貌似没啥硬通货。然而古训告诫我们,“绝知此事要躬行”。
现实往往很打脸,你越是瞧不起它,它就越是愿意麻烦起来给你瞧,其程度远远超出人们的主观臆断。无论在设计思想上,还是在中外经济实践中,真正要做好GDP统计,都决没有那么简单。至少以下五方面问题,是国际经济统计界至今都还没有解决好的。
第一,指标要素与指标的可测度性问题。
现实生活中存在着种种影响GDP数值估算的因素,比如GDP的高估因素之一:公共服务是全社会都享用的,而企业计算“净产出”时并没有扣除此项“中间消耗”,因为根本无法确定“广义政府”服务的微观分量,其隐含的后果便是高估了各公司的增加值,扭曲了结构数据。
再比如GDP低估的因素之一:地下经济的产出(能不能称之为“黑色GDP”呢?假若循着这个思路,恐怕还得有一部分称为“灰色GDP”。)无法完整估算,数据上调不能到位,也不知调到什么程度才算到位。高估和低估都涉及到了指标要素乃至指标整体的可测度性问题,用OECD国民核算专家的话来说,我们甚至无法无法给出GDP准确程度的概括估计,这等于告诉我们,GDP统计本质上属于“真值未知问题”。
第二,指标边界两可状态下正负效应的制衡问题。
在广义国民收入指标中,生产乃至产出的外部边界是一条移动的界线,移动方向总体上是逐步扩大所包含的项目。第二次世界大战之前,经济统计以狭义国民收入指标为核心,国民收入等于消费加投资,NI=C+I,核心经济指标中并不包含“政府服务”这一项,就是说NI公式中没有G。
二战时需要估算如何支付战争费用,以为政府支出提供法理性,由而引发了由狭义国民收入过渡到GNP的动议,即计算GNP=C+I+G。对于是否应该以GNP为核心指标,西蒙·库兹涅茨(S·Kuznets)等学者与主持国民收入统计的官员(米尔顿·吉尔伯特,M·Gilbert,也是著名经济学家)等有过一场方*论法**大战,争论颇为激烈,最后是GDP胜出,取代了NI的核心地位。
生产边界的扩张必然导致GDP数据的上调,中国如此,美国也这样。从这个意义上讲,经济统计的确能够多“生产”出GDP来,并没有什么稀奇。比如,2008年SNA确定R&D算为投资,而不再是中间消耗,GDP数值也就跟着扩大。而生产边界最著名的议题是:“家内家务劳动”是否应该计入GDP?争论持续了几十年,到目前为止还是排在另册。
从生产性质上看,家内家务劳动与“外包家务劳动”(著名者如“菲佣”)并没有区别,计入GDP似乎天经地义。但如果将家内家务劳动纳入生产,就无法确切定义失业人数的“计算概念”,就无法再进行劳动就业和失业统计。
谁都知道,保障就业是宏观管理四大经典目标之一,经济统计理应为其提供数据支撑。是否纳入家内家务劳动,对GDP统计而言是如何补充得更准确,不过是锦上添花而已;但对就业和失业统计而言却是有无存废的大问题,这就导致了边界两可状态下正负效应如何制衡的抉择。
第三,GDP内部不可分事物的切割问题。
GDP内部存在着项目划分归类的问题,最典型的就是消费和投资的界限。“居民户”购买住房属于投资,而购买汽车等耐用消费品则属于消费,为什么做出这样的核算规定呢?
如欲满足结构分析的要求,经济统计必须在不同经济项目之间划一道界线,做出“一刀切”的处置。硬性区分本身并不可分的事物,在边界模糊的地方定性划线,还需得到关键多数的认可,这种测度任务实在难以圆满完成。
GDP内部不可分事物的切割问题,与GDP外部边界的划分一样,同样存在两可状态下正负效应的制衡问题,这类问题的存在势必影响GDP结构数据的质量。
第四,测度(核算)与估算的优先选择问题。
熟悉宏观经济指标演变历史的人都知道,正是因为总产出包含了中间消耗的重复计算,才引发了增加值指标的创新设计,其总和就是NI(后来是GDP)。但是增加值并没有完全消除中间消耗价值的重复计算,从经济理论上看不如国内生产净值(NDP)。既然如此,为什么还要以GDP作为宏观经济的核心指标?
这里隐含着一个测度(核算)与估算孰为优先的问题。却原来,正确与准确并不是一码事儿,测度中到底选哪一样?颇费思量。计算NDP需要扣除“固定资本消耗”,也就是人们通常所说的折旧,但在某个特定时期里固定资产究竟消耗了多少?
这数值实际上是不可测度的,经济统计常常碰到这种强人所难的活计。勉为其难,只能按照一定的假设(该固定资产的使用年限和折旧率类型)来估算。对比而言,GDP无需作此扣除,虽然包含部分重复计算,但避开了估算风险,两害相权取其轻,于是成了核心指标。
如果再深究下去,测度(measurement)与核算(accounting)、估算(estimate)有所不同,存在性事实(primary facts)与构造性事实(constructed facts)也大有区别,然而,这两组彼此之间又不容易截然分开,麻烦何其多。
第五,指标项目间的“约当量”确定与可加性问题。
我们可以用绿色GDP来说明这一点。为了全球的可持续发展,采用绿色GDP的呼声很高。在世界上最发达的美国,克林顿当政期间就下发布过总统令,指定将绿色GDP列入常规经济统计系列。多少个年头过去了,夸下海口的事儿却无疾而终。究竟为什么呢?
所谓绿色GDP,无非是在常规GDP基础上再核算资源和环境等调整项目,扣除消耗资源的,扣除污染环境的,加上节约和增加资源的,加上改善环境的,GDP的颜色就变绿了。道理听上去很简单,计算似乎也不复杂,但是可但是:扣减项和增加项的究竟如何定价?
人类越发展,资源环境越重要。如果把资源和环境价格定到一定高度,恐怕全部GDP都搭进去也不够扣的,难道还能啥都停掉?难道人就干呆着不成?发展到底是不是硬道理?中国需要反思,美国也得慎行。发达国家对资源环境的定价与发展中国家相去甚远,世界各国很难确定一个共同接受的经济统计标准,这就是说,绿色GDP指标项目间存在难以克服的可加性问题:市场信号失灵,价格无法确定,指标间的“约当量”无法确定,彼此就无法相加。
这五大GDP难题,往往形成“测度悖境”,测度者前后左右动弹不得,怎么着都有毛病。也许甚至笃定,还有我们尚未意识到的其它测度问题,看来软科学(或社会科学)中也有压根儿啃不动的硬骨头。
四
看看吧,光是GDP一个指标,就有那么多重大疑难问题,整个经济统计指标体系累积起来又会有多少?那么多指标测度的疑难问题,有的是跨世纪之迷,是全人类所共同面临的经济统计学难题。试问,“指标解释”怎么就不够学问的“格”呢?那又得疑难到什么份上才算学问呢?难道光靠数学就可以破解这些难题了吗?难道非得披上数学的外衣才算学问吗?学问就不可以是多元的吗?我个人以为,如果能把GDP的这些基本问题“解释”一二,那就是学问,而且应该是大学问,那就将是对人类文明的贡献,相当大的贡献。
有些数理出身的经济学大腕曾断言,欧美压根儿没有经济统计学。也有的认定欧美的经济统计就只是数理统计在经济领域的应用而已,他们完全否定经济统计学作为经济学的组成部分,否定经济统计学作为社会科学的存在。真是那样的话,我的说法就成了东方核算体系(MPS)的残渣余孽。
其实,统计学原本是德国学者作为“国势学”开创的,重视经济统计学内在的社会科学性质,甚至带有一定程度人文学科的性质,这恰恰是德国统计学的学术传统。
好在如今世道开放,我们也有机会得知发达国家学科发展的前沿进展,不一定要承担代理人专权妄言的风险。对于善用大帽子强势压人的极端观点,我只好再次强调他们不敢公开否认却刻意选择回避的事例:新旧世纪交汇之时,美国多位顶级的经济学家(其中不乏经济学诺贝尔奖得主)共同回顾了一个世纪内经济统计的发展历程。他们一致认定,GDP是20世纪人类最伟大的发明之一。
那么,作为包含了此项伟大发明的学科,经济统计的科学性表现在哪里呢?为什么我们应该具备经济统计意识呢?除了中外学科发展史的概览外,我尝试着从指标方*论法**、学科特质和指标方法应用三个方面加以探讨。
经济指标的设计思想经历了几百年的演变,这种演变也是经济统计乃至经济学发展历程的重要组成部分。指标的“概念定义”往往来自经济学原理,而照搬、套用概念是行不通的,正如我们不应该仅仅照搬、套用数学公式。
经济统计的重大使命之一就是将指标的概念定义发展成为“计算定义”,其中尤其要重视概念定义与计算定义之间的联系与区别,重视指标间的逻辑关系。
经济统计当然要研究指标的“方法”(侧重how的问题)——即指标如何计算,然而更需要研究指标的“方*论法**”(“论”字更侧重why的问题),即指标为什么应该那么计算?其中包含(特别是隐含!)了哪些前提和假定,它们各自的适用场合在哪里?如果不符合这些指标设计,对指标数值的影响将如何?指标理解和应用中存在哪些需要提防的陷阱?这些测度问题都是需要由经济统计的“方*论法**”来解决。
正是由于这个“论”字的存在,我们不能瞧低了经济指标,经济统计本来就应该是,也必须是,讲究经济指标的,中国如此,外国也如此,东方如此,西方也如此。厚厚的SNA手册,如果用一句话概括而言,讲的就是经济指标及其关系。指标的方*论法**说白了,就是“指标解释”。
1983年中国曾经有过一场统计学学科性质的大争论,使得国内的经济统计学者特别害怕被统计学开除,以至于害怕背上“指标解释”的恶名。很多人误以为戴世光教授内心里只认可数理统计,但可听其言,亦该观其行,戴先生的统计学科观其实是二元的。
如果认真读读他的《世界经济统计概论》,满书讲述的都是经济指标方法和指标解释。该书1987年由人民出版社出版,那恰恰是在大争论之后啊。哪有这么否定“指标解释”和经济统计学的呢?戴先生本人并没有发表数理统计的学术成果,难道说他不是统计学家?
粗看上去,经济统计指标及其方法似乎很简单,实则很有其独特的深奥之处。其专业特质和困难主要在于:
第一,指标定量的社会需求与专业可行性不成比例。即便你得到了近乎正确的答案,你自己也未必能够做出证明。实践中常常出现的情形却是:明明你得出的定量答案并不可靠,而自己却误以为非常正确,对自己的模型结果做绝对的、过度的解读。
第二,为测度、核算和估算所做的投入与经济统计的产出并不成正比。思想无难易。经济统计方*论法**研究的成果主要是思想产品,很难做出难易的区分。不过,思想产品的成果显示度低,表现形式也没有数学模型那么漂亮、震撼与威慑。由此对社会,且对个人,都会生出一个不小的尴尬和遗憾:从事经济统计方*论法**研究并不是一个聪明的职业选择。
第三,方法复杂性与分析结论可靠性不一定成正比。并不是所采用的统计方法越复杂,得出的结论就越可靠。比如人类发展指数(HDI)采用简单平均法,不对三个子因素采用异权处理,忽略了其权重差异,就是基于这个道理。
第四,理论严密性与指标可靠性不一定成正比。并不是所采用的指标在理论概念上越严密,得出的指标值就越可靠。比如前文所述,国内生产净值(NDP)完全消除了中间消耗的重复计算,但其统计结果的可靠性就是比不上GDP。
第五,指标方法的基础性及其颠覆性。经济指标是整个经济学大厦的基础构造,层级虽低,但不失其至关重要。也正是由于肩负重任,经济统计方*论法**研究才举步维艰。试想,如果指标方法或者数据结果存在重大隐患,基于其上的模型建构和分析结论都将失去意义,貌似傲然挺立的经济学摩天大楼可能沦为炫目的海市蜃楼。总体而言,这或许有些危言耸听,但局部风险不可不防。倘有学术良知,何忍此等虚幻?用好统计指标,理得方可心安。
为普及计,经济统计指标手册(特别是FAQ等)中通常没有交代所隐含的测度难题,而现在从数学、物理学跨界来做经济研究成了一种择业潮流,倘若年轻人读了这种入门资料就来套用经济模型,着实有跌入数据陷阱的巨大风险。毕竟物理、数理与事理、心理大有不同,完全用前两者取代后两者不大明智。经济分析固然离不开数学,决不可以不要数学,但并不能仅仅依赖数学。
需要特别提请注意的是,经济指标方法的应用也大有学问,而且这里往往是经济学创新的高产区。比如:经济模型需要基础数据作为投入,对模型投入而言,指标口径用得究竟对不对?数据质量究竟如何?数据质量对模型产出的影响究竟如何?如何按照理论和模型要求进一步改进数据质量?对模型产出而言,又如何解释其经济内涵?经济解释是否合乎指标间的内在逻辑?数据结果能否真实支撑政策建议?
好多应用中的“大问号”,都应该时时挂记于心,深入加以探讨。如果指标理论和实证两头都靠不住,数据与模型的链接不可靠,再前沿的模型又有什么意义呢?如果不接地气,模型运算还不就只是闭门造车的课堂作业?如果不能切实地、逻辑地还原回经济现实,模型运算还不就只是乔装打扮的数字游戏?
前面提到的那位海鸥以经济学家自诩,却对经济统计方*论法**中的隐含难题毫无知觉,误把入门读物当成了经济统计的全部,以偏概全,恰恰犯了统计学科抽样推断的大忌。所谓半天就能掌握的神话,恰恰说明这位仁兄急需恶补经济统计的基础课程,如果他真心打算研究经济问题的话,如果他的研究,除了为个人稻梁谋之外,还切实打算有点社会作用的话。
我倒情愿是我错怪了他,衷心期盼这位大牌海鸥能够睿智如其所夸海口,手起刀落,轻松地给出正确答案,破解GDP五大测度难题,挽解救我等愚生免于迷茫,半天倘若不够,再多半天,哪怕半年也都无妨。