作者简介

邱东，曾任东北财经大学校长、中央财经大学*党**委书记，现为江西财经大学讲席教授。

原载于《经济学家茶座》2016年第2期（总第72辑）

邱东：从GDP被误解看经济统计意识的必要性

从GDP被误解看经济统计意识的必要性

一GDP（国内生产总值）的名声很成问题。可值得我们深思的是，无论是国内还是国外，对GDP的严厉声讨并没有将它赶出经济社会大舞台。春秋流转，南北东西，人们还就是离不开GDP。

它是世界各国经济统计中最基础也最为核心的指标，应用也最为广泛。几乎人人都需要用到的“这玩意儿”，就算您不屑亲自用，间接使用也是避免不了的。然而，社会上对它的误解、误用也最多。

在中国，GDP曾经是为政之要，有所谓“GDP中心主义”之说。当资源、环境等与经济发展的社会矛盾凸显之后，GDP也被不少统计“局外人”攻击为万恶之首。什么事情没搞好，往往会有人跟上一句：“都是叫GDP闹的”。GDP甚至成了网民口中的“鸡的屁”，似乎属于绝对应该废掉的东西。

也有强调GDP至关重要的，但好多人内心里不大认可，他们总觉得经济统计没有那么“高大上”。甚至在不得不翻阅和使用世界经济统计手册和年鉴时，他们也常常抱有居高临下的态度。

还有的误解经济学概念，引发了对经济统计指标的疑惑，比如：为什么发生了火灾或交通事故、自然灾害，乃至恐怖袭击、小型战争等损毁，GDP不降反升？这不是统计造假又是什么！

铿锵抨击之中，有对存量和流量的混淆，有对本期新生产财富量和财富总积累量的混淆，甚至还有对实证研究和规范研究的混淆，对GDP测度目标的误解，人为地给GDP强加道德责任，等等。

GDP当然不是尽善尽美，但种种误解并不是GDP自身的毛病，归结起来，这其实是经济统计意识欠缺的表现，是经济统计文化欠发达的表现。

一个国家发达与否，物质产品固然重要，但公共产品、思想产品或文化产品的分享程度恐怕更为关键。不幸的是，社会上长期对核心指标的误解严重影响了经济统计作用的正常发挥。

我们知道，国际组织在发布经济统计某个专门领域方法手册时，常常会伴有FAQ——“经常会被问到的问题”，这属于科普性的读物，对象是广大民众，不需要求甚解的人群。

编写这种读物，属于经济统计学者对社会的贡献，方便民众使用统计指标及其数据，也是为了弘扬和普及经济统计文化。有的人把这种手册当成了经济统计学问的全部，也当成了经济统计没有学问的铁证。

曾经有位看上去非常聪明的大牌“海鸥”（据说不是“海龟”）亲口教导我们说，经济统计指标很容易懂，挺厚一大本书，无非就是指标解释，花个半天时间就能读完。

读过之后便可在经济模型里应用，简直是所向披靡，一点问题都不会有。按照这个口气，经济统计实在没啥可学可问的。我这里姑且抬一次轿子吧，这位号称经济学家的洋博士对经济统计的态度，跟美国历史上一位参议员罗伯特·肯尼迪能有一拼。

二

罗伯特·肯尼迪何许人也？大名鼎鼎的美国总统约翰·肯尼迪的弟弟，当过美国司法部长，也是位大政治家，一位受人尊敬的理想主义者，1968年遇刺身亡。就在当年的一次竞选演讲中，他强烈地抨击了GNP：

“如果我们用它来衡量美国---这个国民生产总值包括了空气污染和香烟广告，以及为交通事故而奔忙的救护车。它包括了我们装在门上的特种锁和关*锁撬**的人的监狱，包括了我们对红木森林的破坏和因城市无序蔓延而消失的自然奇观。

它包括了凝固汽油弹，包括了*弹核**头，包括了警察用来应付城市骚乱的装甲车，包括了惠特曼步枪和斯佩克刀，包括了为了向孩子推销玩具而美化*力暴**的电视节目。”

“然而，这个国民生产总值不包括我们孩子的健康，他们教育的质量和游戏的快乐。不包括我们诗歌的美丽，我们婚姻的坚强，我们公众辩论中的智慧，和我们官员的正直。它不包括我们的机智和勇气，不包括我们的智慧和学问，不包括我们的同情心，不包括我们对国家的热爱。”

“总之，它衡量一切，却把那些令人生有价值的东西排除在外。它告诉我们美国的方方面面，却不能告诉我们为什么为她自豪。”

在当时的欧美，国民经济统计的核心指标是国民生产总值（现在GNP的专业称谓是国民总收入GNI，GNP只是一个沿用说法），而不是GDP。不过，二者的区别并不影响我们对经济统计核心指标的基本评价。

R·肯尼迪的GNP观，可以作为社会人士误解经济统计核心指标的典型代表。我从以下五个方面加以评论，期望人们对GDP等指标能够有最起码的认知：

第一，R·肯尼迪说GNP包括了空气污染和环境退化，这是不确切的。GNP包含了可能导致空气污染、环境退化的产品生产，但其数据并没有包括空气污染和环境退化本身。还有，R·肯尼迪列举的“特种锁”等项目属于“遗憾性产品（the regret product）”，经济统计对此类指标的口径问题进行过系统研究，专业结论还是应该包括在GNP中。

因为经济统计指标并不是道德法官，GDP不能只测度对人类有益的经济行为。其隐含的道理在于：在不同人的眼中，有益于否的标准可能截然不同。如果一味固执道德标准，就压根儿无法进行全社会的增加值统计，那就等于放弃了任何经济指标对产出的统计。

（2）“健康”和“教育质量”可以测度，但未必一定要完全由GNP来测度。不同指标应该有不同的功能，不能让一个指标承担本应该由其他指标承担的功能。而“游戏的快乐”等余下十个项本身未必可测，恐怕任何指标都无法担当测度那些项目的使命。

说到那些项目，R·肯尼迪实际上是在玩蹦极，从极端否定跳到极端肯定：GDP应该无所不能，想测啥就测啥。试想：硬要测度原本不可测度的事物，得出的所谓测度结果会是什么样子？其可靠性如何？将会产生什么样的社会影响？不确定性风险实在太大。

还有一点需要注意的是，小样本社会专项调查或许可能得出某些所谓的测度数据，但这并不意味着该项目在经济统计意义上可测，专项调查与大规模常规统计在可行性上差距相当大，经济统计是受到“持久资源约束”的，决不能信口开河，决不能与一次性测度行为混为一谈。

（3）GNP应该是综合性最强的经济指标，即便如此，它也不能测度所有经济现象，遑论外加上社会现象。任何指标都不可能“衡量一切”，单个指标决不可能告诉我们一个国家的方方面面，R·肯尼迪的说法很煽情，但也很夸张。

GDP没有把所有“令人生有价值的东西”统统包括在内，但它所统计的内容总体上还是“令人生有价值的”。GDP的确不能告诉你为什么祖国自豪的所有理由，但在其他条件相同的前提下，GDP提高总比其下降为好，它或许是你为祖国自豪的重要支撑之一。

（4）GNP也许不那么完美，然而到目前为止，人类还没有创造出更好的单项综合指标来替代它。R·肯尼迪讲演中没有提到要计算“幸福指数”，但却隐含着开展那种计算的强烈动机。从历史上看，幸福指数几度热炒，但后来都不了了之，其主要原因之一便是其发动者的“无知型无畏”。

迄今为止，最流行的是所谓“国民幸福指数”（GHI），不过距常规统计仍有难以逾越的鸿沟，顶多只是处于“头脑风暴”和小范围试算阶段。而且，幸福指数在计算性质上属于“合成指标”，而GDP属于价值指标，二者在指标类型上大有区别，这又牵涉到经济统计方*论法**研究的一个特别领域，两类指标其实是不应该混为一谈的。

（5）R·肯尼迪极端地关注经济测度的必要性，而完全忽略了经济统计的可行性。他或许是一个优秀的政治家，但他的这段讲演表明，他极缺乏经济统计的常识，压根儿不懂GNP的指标口径，不具备经济统计的基本意识，在经济统计方面完全是个门外汉。

知之为知之，不知为不知。R·肯尼迪固然迎合了社会上某些人的口味，或者说引领了基于非专业态度和水准的某种偏颇情绪。他缺少对经济统计起码的尊重，跑到属于自己思维短板的领域里“大放厥词”，露怯自然是难免的。国内一些人不明就里，却喜欢引证R·肯尼迪的话奉为圣旨，无异于东施效颦。可如果有人揣着明白装糊涂，那品行实在低下。

三

R·肯尼迪还只是针对一个指标发难，而我们那位大牌海鸥则是全面地看低经济统计指标。单从计算方法上粗粗地看，GDP不过是所构成要素的加总，似乎只用到四则运算。连核心指标都这么“小儿科”，经济统计的确貌似没啥硬通货。然而古训告诫我们，“绝知此事要躬行”。

现实往往很打脸，你越是瞧不起它，它就越是愿意麻烦起来给你瞧，其程度远远超出人们的主观臆断。无论在设计思想上，还是在中外经济实践中，真正要做好GDP统计，都决没有那么简单。至少以下五方面问题，是国际经济统计界至今都还没有解决好的。

第一，指标要素与指标的可测度性问题。

现实生活中存在着种种影响GDP数值估算的因素，比如GDP的高估因素之一：公共服务是全社会都享用的，而企业计算“净产出”时并没有扣除此项“中间消耗”，因为根本无法确定“广义政府”服务的微观分量，其隐含的后果便是高估了各公司的增加值，扭曲了结构数据。

再比如GDP低估的因素之一：地下经济的产出（能不能称之为“黑色GDP”呢？假若循着这个思路，恐怕还得有一部分称为“灰色GDP”。）无法完整估算，数据上调不能到位，也不知调到什么程度才算到位。高估和低估都涉及到了指标要素乃至指标整体的可测度性问题，用OECD国民核算专家的话来说，我们甚至无法无法给出GDP准确程度的概括估计，这等于告诉我们，GDP统计本质上属于“真值未知问题”。

第二，指标边界两可状态下正负效应的制衡问题。

在广义国民收入指标中，生产乃至产出的外部边界是一条移动的界线，移动方向总体上是逐步扩大所包含的项目。第二次世界大战之前，经济统计以狭义国民收入指标为核心，国民收入等于消费加投资，NI=C+I，核心经济指标中并不包含“政府服务”这一项，就是说NI公式中没有G。

二战时需要估算如何支付战争费用，以为政府支出提供法理性，由而引发了由狭义国民收入过渡到GNP的动议，即计算GNP=C+I+G。对于是否应该以GNP为核心指标，西蒙·库兹涅茨（S·Kuznets）等学者与主持国民收入统计的官员(米尔顿·吉尔伯特，M·Gilbert，也是著名经济学家)等有过一场方*论法**大战，争论颇为激烈，最后是GDP胜出，取代了NI的核心地位。

生产边界的扩张必然导致GDP数据的上调，中国如此，美国也这样。从这个意义上讲，经济统计的确能够多“生产”出GDP来，并没有什么稀奇。比如，2008年SNA确定R&D算为投资，而不再是中间消耗，GDP数值也就跟着扩大。而生产边界最著名的议题是：“家内家务劳动”是否应该计入GDP？争论持续了几十年，到目前为止还是排在另册。

从生产性质上看，家内家务劳动与“外包家务劳动”（著名者如“菲佣”）并没有区别，计入GDP似乎天经地义。但如果将家内家务劳动纳入生产，就无法确切定义失业人数的“计算概念”，就无法再进行劳动就业和失业统计。

谁都知道，保障就业是宏观管理四大经典目标之一，经济统计理应为其提供数据支撑。是否纳入家内家务劳动，对GDP统计而言是如何补充得更准确，不过是锦上添花而已；但对就业和失业统计而言却是有无存废的大问题，这就导致了边界两可状态下正负效应如何制衡的抉择。

第三，GDP内部不可分事物的切割问题。

GDP内部存在着项目划分归类的问题，最典型的就是消费和投资的界限。“居民户”购买住房属于投资，而购买汽车等耐用消费品则属于消费，为什么做出这样的核算规定呢？

如欲满足结构分析的要求，经济统计必须在不同经济项目之间划一道界线，做出“一刀切”的处置。硬性区分本身并不可分的事物，在边界模糊的地方定性划线，还需得到关键多数的认可，这种测度任务实在难以圆满完成。

GDP内部不可分事物的切割问题，与GDP外部边界的划分一样，同样存在两可状态下正负效应的制衡问题，这类问题的存在势必影响GDP结构数据的质量。

第四，测度（核算）与估算的优先选择问题。

熟悉宏观经济指标演变历史的人都知道，正是因为总产出包含了中间消耗的重复计算，才引发了增加值指标的创新设计，其总和就是NI（后来是GDP）。但是增加值并没有完全消除中间消耗价值的重复计算，从经济理论上看不如国内生产净值(NDP)。既然如此，为什么还要以GDP作为宏观经济的核心指标？

这里隐含着一个测度（核算）与估算孰为优先的问题。却原来，正确与准确并不是一码事儿，测度中到底选哪一样？颇费思量。计算NDP需要扣除“固定资本消耗”，也就是人们通常所说的折旧，但在某个特定时期里固定资产究竟消耗了多少？

这数值实际上是不可测度的，经济统计常常碰到这种强人所难的活计。勉为其难，只能按照一定的假设（该固定资产的使用年限和折旧率类型）来估算。对比而言，GDP无需作此扣除，虽然包含部分重复计算，但避开了估算风险，两害相权取其轻，于是成了核心指标。

如果再深究下去，测度（measurement）与核算(accounting)、估算(estimate)有所不同，存在性事实（primary facts）与构造性事实（constructed facts）也大有区别，然而，这两组彼此之间又不容易截然分开，麻烦何其多。

第五，指标项目间的“约当量”确定与可加性问题。

我们可以用绿色GDP来说明这一点。为了全球的可持续发展，采用绿色GDP的呼声很高。在世界上最发达的美国，克林顿当政期间就下发布过总统令，指定将绿色GDP列入常规经济统计系列。多少个年头过去了，夸下海口的事儿却无疾而终。究竟为什么呢？

所谓绿色GDP，无非是在常规GDP基础上再核算资源和环境等调整项目，扣除消耗资源的，扣除污染环境的，加上节约和增加资源的，加上改善环境的，GDP的颜色就变绿了。道理听上去很简单，计算似乎也不复杂，但是可但是：扣减项和增加项的究竟如何定价？

人类越发展，资源环境越重要。如果把资源和环境价格定到一定高度，恐怕全部GDP都搭进去也不够扣的，难道还能啥都停掉？难道人就干呆着不成？发展到底是不是硬道理？中国需要反思，美国也得慎行。发达国家对资源环境的定价与发展中国家相去甚远，世界各国很难确定一个共同接受的经济统计标准，这就是说，绿色GDP指标项目间存在难以克服的可加性问题：市场信号失灵，价格无法确定，指标间的“约当量”无法确定，彼此就无法相加。

这五大GDP难题，往往形成“测度悖境”，测度者前后左右动弹不得，怎么着都有毛病。也许甚至笃定，还有我们尚未意识到的其它测度问题，看来软科学（或社会科学）中也有压根儿啃不动的硬骨头。

四

看看吧，光是GDP一个指标，就有那么多重大疑难问题，整个经济统计指标体系累积起来又会有多少？那么多指标测度的疑难问题，有的是跨世纪之迷，是全人类所共同面临的经济统计学难题。试问，“指标解释”怎么就不够学问的“格”呢？那又得疑难到什么份上才算学问呢？难道光靠数学就可以破解这些难题了吗？难道非得披上数学的外衣才算学问吗？学问就不可以是多元的吗？我个人以为，如果能把GDP的这些基本问题“解释”一二，那就是学问，而且应该是大学问，那就将是对人类文明的贡献，相当大的贡献。

有些数理出身的经济学大腕曾断言，欧美压根儿没有经济统计学。也有的认定欧美的经济统计就只是数理统计在经济领域的应用而已，他们完全否定经济统计学作为经济学的组成部分，否定经济统计学作为社会科学的存在。真是那样的话，我的说法就成了东方核算体系（MPS）的残渣余孽。

其实，统计学原本是德国学者作为“国势学”开创的，重视经济统计学内在的社会科学性质，甚至带有一定程度人文学科的性质，这恰恰是德国统计学的学术传统。

好在如今世道开放，我们也有机会得知发达国家学科发展的前沿进展，不一定要承担代理人专权妄言的风险。对于善用大帽子强势压人的极端观点，我只好再次强调他们不敢公开否认却刻意选择回避的事例：新旧世纪交汇之时，美国多位顶级的经济学家（其中不乏经济学诺贝尔奖得主）共同回顾了一个世纪内经济统计的发展历程。他们一致认定，GDP是20世纪人类最伟大的发明之一。

那么，作为包含了此项伟大发明的学科，经济统计的科学性表现在哪里呢？为什么我们应该具备经济统计意识呢？除了中外学科发展史的概览外，我尝试着从指标方*论法**、学科特质和指标方法应用三个方面加以探讨。

经济指标的设计思想经历了几百年的演变，这种演变也是经济统计乃至经济学发展历程的重要组成部分。指标的“概念定义”往往来自经济学原理，而照搬、套用概念是行不通的，正如我们不应该仅仅照搬、套用数学公式。

经济统计的重大使命之一就是将指标的概念定义发展成为“计算定义”，其中尤其要重视概念定义与计算定义之间的联系与区别，重视指标间的逻辑关系。

经济统计当然要研究指标的“方法”（侧重how的问题）——即指标如何计算，然而更需要研究指标的“方*论法**”（“论”字更侧重why的问题），即指标为什么应该那么计算？其中包含（特别是隐含！）了哪些前提和假定，它们各自的适用场合在哪里？如果不符合这些指标设计，对指标数值的影响将如何？指标理解和应用中存在哪些需要提防的陷阱？这些测度问题都是需要由经济统计的“方*论法**”来解决。

正是由于这个“论”字的存在，我们不能瞧低了经济指标，经济统计本来就应该是，也必须是，讲究经济指标的，中国如此，外国也如此，东方如此，西方也如此。厚厚的SNA手册，如果用一句话概括而言，讲的就是经济指标及其关系。指标的方*论法**说白了，就是“指标解释”。

1983年中国曾经有过一场统计学学科性质的大争论，使得国内的经济统计学者特别害怕被统计学开除，以至于害怕背上“指标解释”的恶名。很多人误以为戴世光教授内心里只认可数理统计，但可听其言，亦该观其行，戴先生的统计学科观其实是二元的。

如果认真读读他的《世界经济统计概论》，满书讲述的都是经济指标方法和指标解释。该书1987年由人民出版社出版，那恰恰是在大争论之后啊。哪有这么否定“指标解释”和经济统计学的呢？戴先生本人并没有发表数理统计的学术成果，难道说他不是统计学家？

粗看上去，经济统计指标及其方法似乎很简单，实则很有其独特的深奥之处。其专业特质和困难主要在于：

第一，指标定量的社会需求与专业可行性不成比例。即便你得到了近乎正确的答案，你自己也未必能够做出证明。实践中常常出现的情形却是：明明你得出的定量答案并不可靠，而自己却误以为非常正确，对自己的模型结果做绝对的、过度的解读。

第二，为测度、核算和估算所做的投入与经济统计的产出并不成正比。思想无难易。经济统计方*论法**研究的成果主要是思想产品，很难做出难易的区分。不过，思想产品的成果显示度低，表现形式也没有数学模型那么漂亮、震撼与威慑。由此对社会，且对个人，都会生出一个不小的尴尬和遗憾：从事经济统计方*论法**研究并不是一个聪明的职业选择。

第三，方法复杂性与分析结论可靠性不一定成正比。并不是所采用的统计方法越复杂，得出的结论就越可靠。比如人类发展指数（HDI）采用简单平均法，不对三个子因素采用异权处理，忽略了其权重差异，就是基于这个道理。

第四，理论严密性与指标可靠性不一定成正比。并不是所采用的指标在理论概念上越严密，得出的指标值就越可靠。比如前文所述，国内生产净值（NDP）完全消除了中间消耗的重复计算，但其统计结果的可靠性就是比不上GDP。

第五，指标方法的基础性及其颠覆性。经济指标是整个经济学大厦的基础构造，层级虽低，但不失其至关重要。也正是由于肩负重任，经济统计方*论法**研究才举步维艰。试想，如果指标方法或者数据结果存在重大隐患，基于其上的模型建构和分析结论都将失去意义，貌似傲然挺立的经济学摩天大楼可能沦为炫目的海市蜃楼。总体而言，这或许有些危言耸听，但局部风险不可不防。倘有学术良知，何忍此等虚幻？用好统计指标，理得方可心安。

为普及计，经济统计指标手册（特别是FAQ等）中通常没有交代所隐含的测度难题，而现在从数学、物理学跨界来做经济研究成了一种择业潮流，倘若年轻人读了这种入门资料就来套用经济模型，着实有跌入数据陷阱的巨大风险。毕竟物理、数理与事理、心理大有不同，完全用前两者取代后两者不大明智。经济分析固然离不开数学，决不可以不要数学，但并不能仅仅依赖数学。

需要特别提请注意的是，经济指标方法的应用也大有学问，而且这里往往是经济学创新的高产区。比如：经济模型需要基础数据作为投入，对模型投入而言，指标口径用得究竟对不对？数据质量究竟如何？数据质量对模型产出的影响究竟如何？如何按照理论和模型要求进一步改进数据质量？对模型产出而言，又如何解释其经济内涵？经济解释是否合乎指标间的内在逻辑？数据结果能否真实支撑政策建议？

好多应用中的“大问号”，都应该时时挂记于心，深入加以探讨。如果指标理论和实证两头都靠不住，数据与模型的链接不可靠，再前沿的模型又有什么意义呢？如果不接地气，模型运算还不就只是闭门造车的课堂作业？如果不能切实地、逻辑地还原回经济现实，模型运算还不就只是乔装打扮的数字游戏？

前面提到的那位海鸥以经济学家自诩，却对经济统计方*论法**中的隐含难题毫无知觉，误把入门读物当成了经济统计的全部，以偏概全，恰恰犯了统计学科抽样推断的大忌。所谓半天就能掌握的神话，恰恰说明这位仁兄急需恶补经济统计的基础课程，如果他真心打算研究经济问题的话，如果他的研究，除了为个人稻梁谋之外，还切实打算有点社会作用的话。

我倒情愿是我错怪了他，衷心期盼这位大牌海鸥能够睿智如其所夸海口，手起刀落，轻松地给出正确答案，破解GDP五大测度难题，挽解救我等愚生免于迷茫，半天倘若不够，再多半天，哪怕半年也都无妨。