有关数据统计的论文范文

摘要：本文用模特卡罗模拟方法研究了样本容量在54以下的DW统计量的分布特征，并给出小样本DW检验临界值表。同时用DW检验提出了一个判别最小二乘估计中是否存在虚假回归的有效方法。关键词：模特卡罗模拟，DW分布，非平稳性，协整　　Distribution of Small Sample DW Statistic　　Zhang Xiaotong1 Zhao Chuxiao2　　( Institute of International Economics, Nankai University, Tianjin 300071)　　( Management School, Tianjin University, Tianjin 300072)　　Abstract In this paper we investigated the DW distribution with sample size under 54 by Monte Carlo simulation method and gave a critical table for small sample DW Based on that we proposed a method for recognizing spurious regression in ordinary least squares Keywords: Monte Carlo simulation, DW distribution, nonstationary, cointegration　　1．概述　　八十年代以来，Engle-Granger (1987), Engle-Yoo (1987) 和Sargan-Bhargava (1983)都曾提及用DW统计量检验非平稳变量间的协整性问题。在Sargan-Bhargava (1983)中还专门给出一个DW协整检验用表。但在这些论文中均未对小样本DW统计量的分布特征给与研究。　　本文采用蒙特卡罗模拟方法对小样本DW统计量的分布特征进行了充分、详细的研究。样本容量分别取为10，20，30，40和50。变量的设定分为三种情形：一所涉及的两个变量都取自I(1)过程；二所涉及的两个变量中一个取自I(1)过程，一个取自I(0)过程；三所涉及的两个变量都取自I(0)过程。　　在有些国家以年为单位的时间序列的最大可观测值个数并不是很大，所以对小样本DW统计量分布特征的研究有着非常重要的理论与现实意义。　　本文结构如下。第二节推导两个I(1)变量进行最小二乘回归后，由残差计算的DW统计量的极限分布表达式，第三节介绍蒙特卡罗模拟结果及其分析，第四节给出实例，第五节给出结论。　　2．DW统计量的极限分布　　给定如下随机数据生成系统，　　yt = yt-1 + ut , y1 = 0, （1）　　xt = xt-1 + vt , x1 = 0, （2）　　其中ut, vt ~ I(0), E(ut) = E(vt) = 0; E(ui uj) = 0, i ¹ j," i, j。则yt和xt为相互独立的两个I(1)过程。　　建立如下回归模型：　　yt = b0 + b1xt + wt （3）　　当对上式进行最小二乘估计时，会产生虚假回归问题。用随机误差wt的最小二乘估计值构造DW统计量，　　（4）　　因为当T ® µ 时，必然接近于零，上式中分子为Op(1)，而分母T -1sw2也是Op(1)，所以DW统计量是Op(T -1)的。当T ® µ 时，有　　DW Þ 　　即当用两个I(1)变量进行如模型(3)形式的回归时，DW统计量的极限分布为零。　　3．小样本DW分布的蒙特卡罗模拟及其结果分析　　当样本为有限样本，特别是小样本时，DW统计量的分布与其极限分布有着很大不同。由于上述条件下的DW统计量的分布无法用解析的方法求解，本文用蒙特卡罗模拟方法对DW统计量的小样本分布特征进行了研究。　　以模型(3)为基础，除了以yt，xt ~ I(1)为条件对DW分布（记为DW(1,1)）进行模拟外，还分别以yt ~ I(1)，xt ~ I(0) 和yt，xt ~ I(0)为条件进行了模拟（分别记为DW(1,0) 和DW(0,0)）。　　由于DW(0,0)就是通常意义的DW统计量，所以只模拟样本容量T = 10, 40两种情形。对于DW(1,1)和DW(1,0)，分别取T = 10, 20, 30, 40和50进行了模拟。在每个样本容量条件下各模拟1000次。所得结果见表一。　　首先见表一的第三部分，先分析DW(0,0) 的分布特征。由于DW(0,0) 就是通常意义的DW统计量，所以模拟结果表明，一 DW(0,0)分布的均值为2，不受样本容量大小的影响；二分布是对称的，相应JB值（表中最后一列）说明小样本DW(0,0)统计量的分布与正态分布相当近似。三随着样本容量的增大，分布的标准差逐步减小。　　见表一的第一、二部分。小样本DW(1,1)和DW(1,0)统计量有着相似的分布特征。一分布均为右偏态，分布左侧有端点，端点为零；二随着样本容量的增大，DW(1,1)和DW(1,0)分布的右偏倚程度越来越大，分布均值逐步相左移动，90、95、99百分位数也逐步向左移动，同时分布的标准差逐步减小，分布的峰值越来越大，DW取值向零集中；三在样本容量相同的条件下，DW(1,0)分布总是位于DW(1,1)分布的左侧，即DW(1,0)分布的均值、百分位数以及方差都比DW(1,1)分布的相应量小。T = 50模拟1000次的DW(1,1)和DW(1,0)分布的结果分别见图一和图二。　　表一 DW分布的蒙特卡罗模拟结果　　类型样本容量百分位数均值标准差偏度 JB统计量　　1 90 95 99　　10 22 18 45 81 28 62 50 74　　DW(1,1) 20 11 28 49 80 75 39 68 61　　30 09 90 04 39 51 29 07 73　　40 06 77 88 16 41 25 06 10　　50 05 59 71 98 33 20 16 31　　10 18 73 02 38 98 53 73 59　　20 09 02 21 59 56 34 22 61　　DW(1,0) 30 06 70 83 18 38 24 27 43　　40 04 54 66 91 30 19 25 68　　50 04 45 54 71 24 15 12 84　　DW(0,0) 10 31 75 97 24 02 57 00 17　　40 72 41 53 70 00 31 03 06　　注： DW(1,1)表示由两个I(1)变量进行回归，计算得到的DW值　　 DW(1,0)表示由一个I(1)变量和一个I(0)变量进行回归，计算得到的DW值。　　 DW(0,0)表示由两个I(0)变量进行回归，计算得到的DW值。　　在每个样本容量条件下各模拟1000次。　　图一 T = 50模拟1000次的DW(1,1)分布直方图图二 T = 50模拟1000次的DW(1,0)分布直方图　　在相同样本容量条件下，DW(1,0)分布之所以位于DW(1,1)分布左侧，可作如下解释。随着T ® µ，DW(1,0)和DW(1,1)的分布都趋近于零。由于DW(1,0)来自于一个I(1) 变量和一个I(0)变量之间的回归，所以残差序列wt ~ I(1)。由于DW(1,1)来自于两个I(1)变量之间的回归，一般来说残差序列wt&nb　　1、统计范围　　GDDS将国民经济活动划分为五大经济部门：实际部门、财政部门、金融部门、对外部门和社会人口部门。对每一部门各选定一组能够反映其活动实绩和政策以及可以帮助理解经济发展和结构变化的最为重要的数据类别。系统提出了五大部门综合框架和相关的数据类别以及指标编制和公布的目标，鼓励以适当的、反映成员国需要和能力的频率和及时性来开发和公布指标。选定的数据类别和指标分为规定的和受鼓励的两类。　　规定的数据类别包括：（1）来自综合框架中的核心部分，如实际部门的国民帐户总量、财政部门的中央政府预算总量、金融部门的广义货币和信贷总量、对外部门的国际收支总量；（2）追踪分析统计类目，如实际部门的各种生产指数、财政部门的中央政府财政收支和债务统计、金融部门的中央银行分析帐户、对外部门的国际储备和商品贸易统计；（3）与该部门相关的统计指标，如实际部门的劳动市场和价格指数统计；（4）社会人口数据，包括人口、保健、教育、卫生等方面统计。　　除规定的数据类别以外，GDDS鼓励成员国发布更多的统计信息，以增强成员国经济实绩和政策的透明度。如实际部门列出储蓄、国民总收入指标，财政部门列出利息支付和偿债预计数据等。　　GDDS认为，系统所包括的大多数数据类别都是由各国官方机构编制的。将私人部门编制的数据包括进去将更有助于观察经济的全貌，并使各国数据的范围更加一致。但是，将一些由私人机构编制的数据包括在系统内会增加工作的复杂性，比如由官方转发这些数据隐含着对这些数据质量的认可，官方必须对在公众获得、数据完整性和数据质量方面的责任做出调整。　　2、公布频率　　公布频率是指统计数据编制发布的时间间隔。某项统计数据的公布频率需要根据调查、编制的工作难度和使用者的需要来决定。系统鼓励改进数据的公布频率。GDDS对列出的数据类别的公布频率作了统一规定。例如， GDDS要求国民帐户、国际收支平衡表按年公布，广义货币概览按月公布，汇率则每日公布。　　3、公布及时性　　公布及时性是指统计数据公布的速度。统计数据公布的及时性受多种因素制约，如资料整理和计算手续的繁简、数据公布的形式等。GDDS规定了间隔的最长时限，如按季度统计的GDP数据规定在下一季度内发布，按月度统计的生产指数规定在6周至3个月内公布。　　GDDS将选定的数据类别分为规定性和鼓励性两类，目的是给予参加国公布统计数据一定的灵活性。鼓励性一类是要成员国争取发布的，条件不具备的可以暂不发布。有些数据类别下构成要素后面注明“视具体情况”，即成员国认为该项统计不符合本国实际的，可以不编制发布。GDDS规定的发布周期和发布及时性也列出一些灵活处理和变通的办法。　　GDDS有关数据方面的内容及要求如下：　　GDDS的数据规范　　A、综合框架　　核心框架　　范围、分类和分析框架　　受鼓励的扩展　　频率　　及时性　　国民帐户　　编制和公布全套的名义和实际国民帐户总量和平衡项目，得出国内生产总值、国民总收入、可支配总收入、消费、储蓄、资本形成、净贷款、净借款。编制和公布有关的部门帐户以及国家和部门的资产负债表　　年度　　10-14个月　　中央政府操作　　编制和公布交易和债务的综合数据，需强调：1）包括所有的中央政府单位；2）使用适当的分析框架；3）建立一整套详细的分类标准（税收和非税收收入、经常性和资本性支出、国内及国外融资），并适当细分（根据债务持有人、债务工具和币种）。　　广义政府或公共部门操作数据，在那些地方政府或公共企业操作具有重要分析或政策意义的国家尤其鼓励。　　年度　　6-9个月　　广义货币概览　　编制和公布综合的数据，需强调：1）包括所有的存款公司（银行机构）；2）使用适当的分析框架；3）建立对外资产和负债、按部门分类的国内信贷以及货币（流动性）和非货币债务构成的分类标准。　　月度　　2-3个月　　国际收支　　编制和公布综合的国际收支主要总量数据和平衡项目，包括：货物和服务的进口和出口、贸易差额、收入和转移、经常项目差额、储备和其他金融交易、总余额，并适当进行细分。　　国际投资头寸和总体经济外债数据（如果这些数据具有重要的分析和政策意义）　　年度　　6-9个月　　GDDS的数据规范　　B、数据类别和指标　　数据类别　　核心指标　　受鼓励的总量及构成　　频率　　及时性　　实际部门　　国民帐户总量　　国内生产总值（名义和实际）　　国民总收入、资本形成、储蓄　　年度（鼓励季度）　　6-9个月　　生产指数　　制造业或工业　　初级产品、农业或其他指标　　视具体情况　　月度　　视具体情况　　所有指标都为6周-3个月　　价格指数　　消费者价格指数　　生产者价格指数　　月度　　1-2个月　　劳动力市场指标　　就业、失业，工资/收入，视具体情况　　年度　　6-9个月　　财政部门　　核心指标　　受鼓励的指标　　频率　　及时性　　中央政府预算总量　　收入、支出、差额和融资，视具体情况进行细分（根据债务持有人、债务工具和币种）　　利息支付　　季度　　1个季度　　中央政府债务　　内债和外债，视具体情况适当细分（按币种、期限、债务持有人和债务工具）　　政府担保债务　　年度（鼓励季度）　　1-2个季度　　金融部门　　核心指标　　受鼓励的指标　　频率　　及时性　　广义货币和信贷总量　　净对外头寸、国内信贷、广义或狭义货币　　月度　　1-3个月　　中央银行总量　　储备货币　　月度　　1-2个月　　利率　　短期和长期政府债券利率，政策可变利率　　货币或银行间市场利率及一套存贷款利率　　月度　　高频率（如月度）　　股票市场　　股票价格指数，视具体情况　　月度　　对外部门　　核心指标　　受鼓励的指标　　频率　　及时性　　国际收支总量　　货物和服务的进口和出口、经常帐户差额、储备、总差额　　总体经济的外债和偿债数据，视具体情况　　年度（十分鼓励季度）　　6个月　　国际储备　　以美元标价的官方储备总额　　与储备有关的负债　　月度　　1-4周　　商品贸易　　总进口和总出口　　较长时间的主要商品的分类　　月度　　8周-3个月　　汇率　　即期汇率　　每日　　高频率（如月度）　　社会-人口数据　　核心指标　　频率　　人口　　人口；人口增长率；城市人口；农业人口；人口性别；人口的年龄构成　　各国公布频率会各不相同；及时性　　保健　　每个医生照顾人口数；预期寿命；婴儿/儿童/产妇死亡率　　也不尽相同　　教育　　成年人文盲率、学生-教师比率、小学/中学入学率　　贫困状况　　获得洁净水的情况、卫生；每个房间居住的人数；收入分配；最低收入标准以下的家庭数　　二、公布数据的质量　　GDDS从两个方面的内容来评估公布的统计数据质量，即：提供统计数据的文字说明和提供统计数据的交叉检验。　　统计数据质量是个难以界定、因而不易评估的概念。为了便于检查，GDDS选定两条规则作为评估统计数据质量的标准。一是参加国提供数据编制方法和数据来源方面的资料。资料可以采取多种形式，包括公布数据时所附的概括性说明、单独出版物和可从编制者得到的有关说明。同时也鼓励成员国准备并公布重要的关于数据质量特征的说明（例如，数据可能存在的误差类型、不同时期数据之所以不可比的原因、数据调查的范围或调查数据的样本误差等）。二是提供统计类目核心指标的细项内容、及与其相关的统计数据的核对方法，以及支持数据交叉复核并保证合理性的统计框架。为了支持和鼓励使用者对数据进行核对和检验，规定在统计框架内公布有关总量数据的分项，公布有关数据的比较和核对。统计框架包括核算等式和统计关系。比较核对主要针对那些跨越不同框架的数据，例如，作为国民帐户一部分的进出口和作为国际收支一部分的进出口的交叉核对。　　与数据质量密不可分的是制定和公布改进数据的计划。所准备和公布的改进计划应包含所有数据不全的部门。统计当局应表明下述立场中的一个：（1）针对已发现不全的改进计划；（2）最近实施的改进措施；或（3）国家认定不　　四、公众获取　　GDDS规定要提前公布数据发布日期，并向各方同时发送。　　官方统计数据的公布是统计数据作为一项公共产品的基本特征之一，及时和机会均等地获得统计数据是公众的基本要求。GDDS对此制定了两项规划：一是参加国要预先公布各项统计的发布日历表。预先公布统计发布日程表既可方便使用者安排利用数据，又可显示统计工作管理完善和表明数据编制的透明度。GDDS规定对于以年度为频率公布的综合框架和指标，时间表表明不迟于某个既定时间；对于公布频率更高的数据，则可确定一个日期范围，如3-5天。鼓励成员国向公众公布发布最新信息的机构或个人的名称或地址。二是统计发布必须同时发送所有有关各方。由于数据是有价值的商品，因此GDDS规定应向所有有关方同时发布统计数据，以体现公平的原则。发布时可先提供概括性数据，然后再提供详细的数据，当局应至少提供一个公众知道并可以进入的地方，数据一经发布，公众就可以公平地获得。

从统计学的发展趋势谈统计教育的改革摘要：要培养出新型的21世纪的人才，统计教育必须高瞻远瞩。本文从统计学的发展趋势谈了统计教育急需改革的几个方面。关键词: 统计学；发展趋势；统计教育改革随着国家创新体系的建立，统计创新工程已经提上议事日程，统计创新包括两个方面，一是统计实践的创新；二是统计教育的创新。创新的基础在于教育，没有统计教育的创新，就谈不上统计实践的创新。准确把握统计学的发展方向与发展形势，培养适应新世纪社会经济发展需要的人才，是统计教育工作者必须面对的问题，本文从统计学的基本发展趋势谈一谈统计教育急需改革的几个方面。一、统计学的基本发展趋势纵观统计学的发展状况，与整个科学的发展趋势相似，统计学也在走与其他科学结合交融的发展道路。归纳起来，有两个基本结合趋势。（一）统计学与实质性学科结合的趋势统计学是一门通用方法论的科学，是一种定量认识问题的工具。但作为一种工具，它必须有其用武之地。否则，统计方法就成为无源之水，无用之器。统计方法只有与具体的实质性学科相结合，才能够发挥出其强大的数量分析功效。并且，从统计方法的形成历史看，现代统计方法基本上来自于一些实质性学科的研究活动，例如，最小平方法与正态分布理论源于天文观察误差分析，相关与回归源于生物学研究，主成分分析与因子分析源于教育学与心理学的研究。抽样调查方法源于政府统计调查资料的搜集。历史上一些著名的统计学家同时也是生物学家或经济学家等。同时，有不少生物学家、天文学家、经济学家、社会学家、人口学家、教育学家等都在从事统计理论与方法的研究。他们在应用过程中对统计方法进行创新与改进。另外，从学科体系看，统计学与实质性学科之间的关系绝对不是并列的，而是相交的，如果将实质性学科看作是纵向的学科，那么统计学就是一门横向的学科，统计方法与相应的实质性学科相结合，才产生了相应的统计学分支，如统计学与经济学相结合产生了经济统计，与教育学相结合产生了教育统计，与生物学相结合产生了生物统计等，而这些分支学科都具有"双重"属性：一方面是统计学的分支，另一方面也是相应实质性学科的分支，所以经济统计学、经济计量学不仅属于统计学，同时属于经济学，生物统计学不仅是统计学的分支，也是生物学的分支等。这些分支学科的存在主要不是为了发展统计方法，而是为了解决实质性学科研究中的有关定量分析问题，统计方法是在这一应用过程中得以完善与发展的。因此，统计学与各门实质性学科的紧密结合，不仅是历史的传统更是统计学发展的必然模式。实质性学科为统计学的应用提供了基地，为统计学的发展提供了契机。21世纪的统计学依然会采取这种发展模式，且更加注重应用研究。这个趋势说明：统计方法的学习必须与具体的实质性学科知识学习相结合。必须以实质性学科为依据，因此，财经类统计专业的学生必须学好有关经济类与管理类的课程，只有这样，所学的统计方法才有用武之地。统计的工具属性才能够得以充分体现。（二）统计学与计算机科学结合的趋势纵观统计数据处理手段发展历史，经历了手工、机械、机电、电子等数个阶段，数据处理手段的每一次飞跃，都给统计实践带来革命性的发展。上个世纪40年代第一台电子计算机的诞生，给统计学方法的广泛应用创造了条件。20年代发展起来的多元统计方法虽然对于处理多变量的种类数据问题具有很大的优越性，但由于计算工作量大，使得这些有效的统计分析方法一开始并没有能够在实践中很好推广开来。而电子计算机技术的诞生与发展，使得复杂的数据处理工作变得非常容易，那些计算繁杂的统计方法的推广与应用，由于相应统计软件的开发与商品化而变得更加方便与迅速，非统计专业的理论工作者可以直接凭借商品化统计分析软件来处理各类现实问题的多变量数据分析，而无需对有关统计方法的复杂理论背景进行研究。计算机运行能力的提高，使得大规模统计调查数据的处理更加准确、充分与快捷。目前企业经营管理中建立的决策支持系统（DSS）更加离不开统计模型。最近国外兴起的数据挖掘（Datamining,又译"数据掏金"）技术更是计算机专家与统计学家共同关注的领域。随着计算机应用的越来越广泛，每年都要积累大量的数据，大量信息在给人们带来方便的同时也带来了一系列问题：信息过量，难以消化；信息真假，难以辨识；信息安全，难以保证；信息形式不一致，难以统一处理；于是人们开始提出一个新的口号"要学会抛弃信息"。人们考虑"如何才能不被信息淹没，而是从中及时发现有用的知识，提高信息利用率？"面对这一挑战，数据挖掘和知识发现（DMKD）技术应运而生，并显示出强大的生命力。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘是一门交叉学科，它把人们对数据的应用从低层的简单查询，提升到从数据中挖掘知识，提供决策支持。在这种需求牵引下，汇聚了不同领域的研究者，尤其是数据库技术、人工智能技术、统计、可视化技术、并行计算等方面的学者和工程技术人员，投身到数据挖掘这一新兴的研究领域，形成新的技术热点。虽然统计学家与计算机专家关心Datamining的视角不完全相同，但可以说，Datamining与DSS一样，使得统计方法与计算机技术的结合达到了一个更高的层次。因此，统计学越来越离不开计算机技术，而计算机技术应用的深入，也同样离不开统计方法的发展与完善。这个趋势说明：充分利用现代计算技术，通过计算机软件将统计方法中复杂难懂的计算过程屏障起来，让用户直接看到统计输出结果与有关解释，从而使统计方法的普及变得非常容易。所以，对于财经类统计专业的学生来说，一方面要学好统计方法，但另一方面更加要学会利用商品化统计软件包解决实践中的统计数量分析问题，学好计算机信息系统开发的基本思想与基本程序设计，能够将具体单位的统计模型通过编程来实现，以建立起统计决策支持系统。所以统计与实质性学科相结合，与计算机、与信息相结合，这是发展的趋势。了解这一点，再来看我们目前教育中的问题就更加明显了，所以一些课程要改革，教学方式也要改革。以下谈一谈统计教育需要改革的几个方面。采纳哦

统计学论文有具体数据的

世界银行关于中国GDP数据的调整及其存在的问题（内容提要：论文深入研究了世行调整中国GDP数据的原因、方法和结果，系统地阐述了90年代初以来中国统计体系和价格体制改革所取得的巨大进步，以事实为依据，利用大量翔实的资料，对世行的调整方法进行了逐项剖析，揭示出其存在的问题，阐明了这种调整方法已经不符合中国目前的实际情况、世行不应再调整中国GDP数据的基本观点。本文发表在《经济研究》1999年第6期。）90年代初，世界银行派代表团对中国统计体系进行考察之后，发表了一篇考察报告：《转换中的中国统计体系》。报告认为，中国统计体系虽然进行了深入的改革，但其在基本概念、调查范围、调查方法等方面仍存在着很大缺陷:基本概念仍深深扎根于传统的物质产品平衡表体系（MPS），调查范围仍主要限于物质生产领域，调查方法仍以传统的全面行政报表为主；中国价格体制虽然进行了许多重大改革，但仍保留着传统价格体制的许多本质特征，许多产品的价格仍然处于政府控制之中。这些情况导致中国官方国内生产总值（GDP）总量数据的低估和速度的高估。1994年，世行发表了一篇专题报告：《中国人均GNP》。它以上述考察报告为依据，对中国官方1992年GDP数据进行了较大幅度的向上调整。世行公布的1993-1997年的中国人均GNP数据是在其调整后的中国1992年GDP（注1）总量数据和中国官方公布的经济增长率数据基础上计算出来的。因此，世行公布的中国1992-1997年人均GNP数据远大于中国官方人均GNP（注2）的美元折算数。本文阐述世行关于中国官方1992年GDP数据的调整及其存在的问题。一、世界银行关于中国官方GDP数据的调整世界银行对中国官方GDP数据的调整包括三个方面内容：一致性调整、范围调整和估价调整，综合调整比率为3%。其中一致性调整和范围调整是关于统计体系的不完善所做的调整，估价调整是关于价格体制的影响所做的调整。世行关于中国官方GDP数据的调整情况简要概括在表1中：表1：世界银行关于中国官方GDP数据的调整调整项目调整幅度对GDP的影响(%) 自产自用的粮食上调20% +8存货增加下调1/3 -6福利服务 10%企业劳动力从事福利服务 +6亏损补贴补贴视作政府最终支出 +8 一致性调整合计 +6粮食产出上调10% +9蔬菜产出上调30% +3农村工业产出上调10-15% +6农村服务业产出上调50-60% +5 住房服务支出上调40% +5 范围调整合计 7住房服务 8% 5 全部其他行业 -1%-0% 6 估价调整合计 3% 3 总计 3注：1、农村工业包括农村煤炭开采业、纺织业、消费品制造业和其他工业2、农村服务业包括人文服务业、原材料服务业和其他服务业3、全部其他行业包括粮食作物种植业、其他作物种植业、煤炭开采业、纺织业、消费品制造业、其他工业、人文服务业、原材料供应业、其他服务业（一）一致性调整从表1可以看出，世行关于中国官方1992年GDP数据的一致性调整包括以下几个方面：1、农民自产自用的粮食世行认为,中国统计体系以低于市场的价格估价农民自己生产自己消费的粮食。它假定对这部分粮食进行一致性估价将使其价值增加20%,这种调整使GDP上升8%。2、存货增加世行认为，中国对不能销售或不能按计算产出时所采用的价格销售的产出存货增加的计算存在严重的不一致性。它认为，一般来说，如果这些存货结转另一年，并最终被废弃或按大打折扣的价格销售，中国没有对GDP中的存货增加做相应的调整。因此，存货增加大于采用一致性估价所应有的价值量。世行因此将中国的存货增加调低1/3，导致GDP下降6%。3、福利服务世行认为,中国企业改革的最重要组成部分之一,是将目前企业对职工提供的诸如住房、医疗等福利性服务市场化。这种改革的结果将导致GDP上升。世行假定有10%的劳动力从事相应的服务,并假定这些服务转向市场化。通过投入产出计算,这种假定使GDP 上升6%。4、企业亏损补贴中国统计规定,企业亏损补贴作为GDP的负项。世行认为,在许多情况下,企业亏损是政府价格政策的结果。从经济观点来看,这种补贴是对以优惠价格提供货物和服务的补偿,统计上应当处理为政府的货物和服务购买和政府对相应接受者的分配,即不应当作为GDP的负项,而应当作为正项包括在政府最终支出中。世行对这种处理方法进行了调整，结果使政府支出增加7%,导致GDP上升8%。综合上述结果,世行将中国官方1992年GDP数据上调了6%。（二）范围调整从表1可以看出，世行关于中国官方1992年GDP数据的范围调整包括以下几个方面：1、粮食世行认为,中国的耕地面积被低估了十分之一到三分之一（与卫星测量的耕地面积相比）；同时，样本产量可能被高估了,综合两方面因素,将中国的粮食产出调高10%，导致GDP上升9%2、蔬菜世行认为,中国蔬菜产出价值的计算没有反映单位面积的蔬菜实物产量随时间和收获周期而变化以及市场力量正在鼓励蔬菜的非旺季生产(此时价格较高)情况,同时,蔬菜耕地面积的测算也是不准确的。考虑以上各方面因素,世行将中国的蔬菜产出价值调高30%,导致GDP上升3%。3、农村工业世行认为,村及村以下工业的产出被低估,因为相应企业通常没有完整的财务报表和不属于国家统计局直接管理的统计调查系统。农村工业的迅速发展和一定程度的偷漏税情况影响到产出的低估。某些迅速增长的农村工业,如建筑材料工业,高价格和高利润鼓励了产出的低估。利润低的行业,如煤炭开采业,也有低报的刺激,因为煤炭的自由市场价格较高。另外,世行也指出,为了夸大地方官员的政绩,农村工业也出现了高估产出的现象。综合上述因素,世行将中国农村工业产出调高10－15%，导致GDP上升6%。4、农村服务业世行认为,农村服务业,例如农村卡车和拖拉机运输服务业发展的非常迅速，但是中国没有一套系统的测算方案;农村服务业统计基本上没有包括临时生活和工作在城市的农村人从事的服务活动，例如大量的个体维修店的修理人员、小贩、餐馆老板、理发师和家庭佣人,等等。考虑上述因素,世行将农村服务业产出调高50%-60%，导致GDP上升5%。5、居民住房服务世行认为,中国居民住房服务既存在范围方面的低估，也存在价格方面的低估。从范围方面讲，城市和农村住房服务统计都不完整。中国的住房服务价值是通过住房面积、造价和折旧率等资料推算出来的，但住房面积资料不完整，城市住房面积调查资料没有包括居住在城市里的农村居民住房面积，农村住房面积调查范围的不完整性更加突出。世行假定国家统计调查网络覆盖了中国所有住房的三分之二到四分之三,进而把中国的住房服务价值调高40%,导致GDP上升5%。综合上述结果,世行将中国官方1992年GDP数据上调了7%。（三）估价调整世行认为,由于扭曲的价格体制和生产率方面的差异,中国工业的土地和资本回报率远高于其他行业，消费品制造业的回报率最高,服务业和煤炭行业的回报率最低,农业的回报率也比较低，中国进一步的价格改革将改变行业的营利状况。世行试图将各行业的土地和资本回报率调整到全国的平均水平。由于纺织行业在中国对外贸易中很重要,世行在估价调整过程中,保持该行业的价格不变，将住房和其他房地产业的价格提高,纺织业以外的消费者制造业的价格降低。世行利用1987年投入产出表对GDP进行了调整,结果使GDP上调3%。综合上述三个方面的调整结果,世行将中国官方1992年GDP数据上调了3%。二、世界银行关于中国GDP数据调整存在的问题世行关于中国GDP数据的调整是建立在它对80年代末90年代初中国统计体系和价格体制的了解和判断基础上的。90年代初以来，中国统计体系和价格体制改革取得了巨大进步。就统计体系来说，随着国民经济核算制度的改革，基本概念和基本框架已经基本上实现了向国民经济核算最新国际标准--联合国1993年SNA的转换；统计调查范围已经由传统的物质生产领域扩展到非物质生产领域；全面行政报表的统计调查方法已经被以普查为基础，抽样调查为主体的调查方法体系所取代；开展了多项普查，包括农业普查、工业普查、第三产业普查、基本单位普查，等等；许多专业统计采用了抽样调查方法，例如农产品产量调查、农村和城市住户调查、价格调查，等等。这一系列统计改革，使中国统计体系得到不断完善。就价格体制来说，中国进行了广泛而深入的改革，目前，市场价格已经成为中国价格体系的主体。具体说来，世行关于中国GDP数据的调整至少存在以下若干方面问题：（一）一致性调整问题1、农民自产自用粮食的估价中国农业统计规定，农民自产自用粮食的价值，按出售的综合平均价格计算，这种综合平均价格综合了国家收购价格与市场价格两种因素。近些年来，中国粮食连续获得丰收，为了保护农民种粮的积极性，国家的粮食收购价格已经高于，而不是低于市场价格，因此，上述综合平均价格不会低于市场价格。世行关于中国统计体系以低于市场的价格估价农民自产自用的粮食的判断，已经不符合中国目前的实际情况。2、存货增加80年代末90年代初，受传统的计划经济体制的影响，还有相当一部分企业只考虑生产不考虑市场需求和赢利情况。这些企业生产出来的部分产品可能销售不了，只能被废弃或按大打折扣的价格处理。因此，就当时的情况来说，世行把中国的存货增加调低三分之一，可能是不过分的。但是，自从党的十四大把中国经济体制的改革目标确定为市场经济体制以来，情况发生了很大的变化，市场需求和赢利状况已经逐步成为企业生产决策的主要考虑。因此，企业生产的产品被废弃或按打折扣的价格处理的情况明显减少。所以，世行的调整比率不再适合中国目前的存货产品销售的实际情况。3、福利服务近些年来，中国进行的一系列企业制度改革，正在推动企业的福利性服务逐步走向市场化，企业从事福利性服务人员的比例正在逐步下降。因此，至少对于中国目前的企业情况来说，世行假定企业有10%的劳动力从事福利性服务的比例太高了，相应地对GDP的调整比例也就不合适了。（二）范围调整问题1、粮食中国官方统计的耕地面积数据确实低于卫星测量数据，但是，卫星测量出来的耕地面积包括25度以上的坡地、河滩地、轮休地、沟渠和田间道路等等。这些地不能视同正常的耕地。所以，中国官方的耕地面积数据与实际耕地面积之间的差距不像世行估计的那么大。另外，除了农业统计包括粮食产量调查外，农村住户调查还编制农村住户农业生产情况表和农村住户粮食收支平衡表，分别反映农村住户粮食生产情况和年初粮食结存、年内粮食收入、年内粮食支出、年末粮食结存情况。这些不同类型调查能够对粮食产量统计起到校对作用。根据以上情况，中国的粮食产出数据与实际情况应当是比较吻合的，世行将其调高10%，必将导致GDP数据的高估。2、牧业世行断定中国统计数据低估了农业产出，事实上，中国的经常性农业统计还存在高估的成分。全国农业普查结果表明，1996年统计年报中的肉类产量高估了22%，猪、牛、羊存栏头数分别高估了7%，、1%和8%。因此农业总产出和农业增加值被高估了。针对这种情况， GDP应当相应地向下调整。这是世行所没有料到的。3、农村工业全国第三次工业普查结果表明：由农业部乡镇企业管理部门统计的农村工业总产值数据高估了18000亿元（1995年），占全部农村工业总产值的40%。显然，与世行的判断恰好相反，农村工业产出应当向下调整，而不应当向上调整。4、农村服务业世行关于中国农村服务业统计不完善的判断和数据调整对于80年代末、90年代初的中国统计状况来说，是不过分的。但是，中国在1993至1995年开展了首次第三产业普查，对包括农村服务业在内的全部服务行业进行了全面调查，同时，根据普查资料对GDP历史数据进行了较大幅度的调整：表2：第三产业普查关于服务业增加值和GDP数据的调整比率(%)年度 GDP 第三产业运输邮电通信业商业非物质服务业1978 0 4 0 0 3 1980 1 2 0 0 6 1985 1 6 0 2 9 1986 3 2 0 1 4 1987 8 0 0 3 2 1988 1 4 0 1 7 1989 7 3 0 7 8 1990 8 2 7 6 5 1991 1 7 4 6 9 1992 3 1 5 7 7 1993 0 0 7 4 8注：本表根据《中国统计年鉴，1994》和《中国统计年鉴，1995》计算。事实上，这种调整已经大大超过世行对农村服务业的调整。例如，世行对农村服务业数据的调整导致1992年 GDP数据上升5%,而第三产业普查之后，中国对同年GDP数据的上调比例达3%。因此世行对中国农村服务业统计的判断和数据调整已经不再适合中国目前的实际情况。（三）估价调整问题90年代初以来，中国确立了建立社会主义市场价格体制的目标模式，价格改革取得了突破性进展，严重扭曲的价格结构得到明显改善。例如，从1990年到1997年，世行认为土地和资本回报率最低的服务业和煤炭工业价格分别上涨了222%和206%，而属于土地和资本回报率最高的消费品制造业的食品工业和纺织工业价格仅分别上涨8%和3%。特别重要的是，目前，市场机制在中国货物和服务价格形成中已经起了主导作用。货物的价格基本上由市场决定，除部分服务业，如居民福利性住房服务业仍偏离市场价格外，绝大多数服务业的价格也由市场决定。即使那些偏离市场价格的服务业也正在迅速向市场价格过渡。例如，随着住房制度的改革，住房服务将市场化，福利性住房服务不久将不复存在。另外，有关部门在对33种具有代表性的商品进行国内外价格比较时发现，1998年11月，国内价格高于国际价格的有22种，占69%，其中包括小麦、玉米、大豆、豆油等农产品，硫酸、盐酸、尿素等化工产品，汽油、柴油等能源产品，铝锭、生铁等冶金产品，等等。总之，在中国的价格形成机制、价格规模和价格结构发生重大变化的情况下，如果世行仍然依据1987年投入产出表对各行业进行价格方面的调整，也势必导致GDP数据的高估。注1：由于中国官方GDP和GNP数据差距不大，世界银行在计算中国官方人均GNP时是以中国官方GDP数据，而不是以GNP数据为基础。由于同样的原因，本文对GDP和GNP不加区别。注2：中国官方人均GNP是按人民币计算的。参考文献——Document of the World Bank N13580-CHA:China GNP per Capita，December15,世界银行文件：《转换中的中国统计体系》，国家统计局内部翻译件。国家统计局1998年制定：《国家统计报表制度》。国家统计局1998年制定：《农村住户调查方案》。国家统计局编：《中国统计年鉴》(1994,1995 ，1997，1998），中国统计出版社 1994、1995、1997和1998年出版。许宪春著：《中国国民经济核算体系改革与发展》，经济科学出版社1997年出版。《价格监测与分析》1998年第22期

摘要：本文用模特卡罗模拟方法研究了样本容量在54以下的DW统计量的分布特征，并给出小样本DW检验临界值表。同时用DW检验提出了一个判别最小二乘估计中是否存在虚假回归的有效方法。关键词：模特卡罗模拟，DW分布，非平稳性，协整　　Distribution of Small Sample DW Statistic　　Zhang Xiaotong1 Zhao Chuxiao2　　( Institute of International Economics, Nankai University, Tianjin 300071)　　( Management School, Tianjin University, Tianjin 300072)　　Abstract In this paper we investigated the DW distribution with sample size under 54 by Monte Carlo simulation method and gave a critical table for small sample DW Based on that we proposed a method for recognizing spurious regression in ordinary least squares Keywords: Monte Carlo simulation, DW distribution, nonstationary, cointegration　　1．概述　　八十年代以来，Engle-Granger (1987), Engle-Yoo (1987) 和Sargan-Bhargava (1983)都曾提及用DW统计量检验非平稳变量间的协整性问题。在Sargan-Bhargava (1983)中还专门给出一个DW协整检验用表。但在这些论文中均未对小样本DW统计量的分布特征给与研究。　　本文采用蒙特卡罗模拟方法对小样本DW统计量的分布特征进行了充分、详细的研究。样本容量分别取为10，20，30，40和50。变量的设定分为三种情形：一所涉及的两个变量都取自I(1)过程；二所涉及的两个变量中一个取自I(1)过程，一个取自I(0)过程；三所涉及的两个变量都取自I(0)过程。　　在有些国家以年为单位的时间序列的最大可观测值个数并不是很大，所以对小样本DW统计量分布特征的研究有着非常重要的理论与现实意义。　　本文结构如下。第二节推导两个I(1)变量进行最小二乘回归后，由残差计算的DW统计量的极限分布表达式，第三节介绍蒙特卡罗模拟结果及其分析，第四节给出实例，第五节给出结论。　　2．DW统计量的极限分布　　给定如下随机数据生成系统，　　yt = yt-1 + ut , y1 = 0, （1）　　xt = xt-1 + vt , x1 = 0, （2）　　其中ut, vt ~ I(0), E(ut) = E(vt) = 0; E(ui uj) = 0, i ¹ j," i, j。则yt和xt为相互独立的两个I(1)过程。　　建立如下回归模型：　　yt = b0 + b1xt + wt （3）　　当对上式进行最小二乘估计时，会产生虚假回归问题。用随机误差wt的最小二乘估计值构造DW统计量，　　（4）　　因为当T ® µ 时，必然接近于零，上式中分子为Op(1)，而分母T -1sw2也是Op(1)，所以DW统计量是Op(T -1)的。当T ® µ 时，有　　DW Þ 　　即当用两个I(1)变量进行如模型(3)形式的回归时，DW统计量的极限分布为零。　　3．小样本DW分布的蒙特卡罗模拟及其结果分析　　当样本为有限样本，特别是小样本时，DW统计量的分布与其极限分布有着很大不同。由于上述条件下的DW统计量的分布无法用解析的方法求解，本文用蒙特卡罗模拟方法对DW统计量的小样本分布特征进行了研究。　　以模型(3)为基础，除了以yt，xt ~ I(1)为条件对DW分布（记为DW(1,1)）进行模拟外，还分别以yt ~ I(1)，xt ~ I(0) 和yt，xt ~ I(0)为条件进行了模拟（分别记为DW(1,0) 和DW(0,0)）。　　由于DW(0,0)就是通常意义的DW统计量，所以只模拟样本容量T = 10, 40两种情形。对于DW(1,1)和DW(1,0)，分别取T = 10, 20, 30, 40和50进行了模拟。在每个样本容量条件下各模拟1000次。所得结果见表一。　　首先见表一的第三部分，先分析DW(0,0) 的分布特征。由于DW(0,0) 就是通常意义的DW统计量，所以模拟结果表明，一 DW(0,0)分布的均值为2，不受样本容量大小的影响；二分布是对称的，相应JB值（表中最后一列）说明小样本DW(0,0)统计量的分布与正态分布相当近似。三随着样本容量的增大，分布的标准差逐步减小。　　见表一的第一、二部分。小样本DW(1,1)和DW(1,0)统计量有着相似的分布特征。一分布均为右偏态，分布左侧有端点，端点为零；二随着样本容量的增大，DW(1,1)和DW(1,0)分布的右偏倚程度越来越大，分布均值逐步相左移动，90、95、99百分位数也逐步向左移动，同时分布的标准差逐步减小，分布的峰值越来越大，DW取值向零集中；三在样本容量相同的条件下，DW(1,0)分布总是位于DW(1,1)分布的左侧，即DW(1,0)分布的均值、百分位数以及方差都比DW(1,1)分布的相应量小。T = 50模拟1000次的DW(1,1)和DW(1,0)分布的结果分别见图一和图二。　　表一 DW分布的蒙特卡罗模拟结果　　类型样本容量百分位数均值标准差偏度 JB统计量　　1 90 95 99　　10 22 18 45 81 28 62 50 74　　DW(1,1) 20 11 28 49 80 75 39 68 61　　30 09 90 04 39 51 29 07 73　　40 06 77 88 16 41 25 06 10　　50 05 59 71 98 33 20 16 31　　10 18 73 02 38 98 53 73 59　　20 09 02 21 59 56 34 22 61　　DW(1,0) 30 06 70 83 18 38 24 27 43　　40 04 54 66 91 30 19 25 68　　50 04 45 54 71 24 15 12 84　　DW(0,0) 10 31 75 97 24 02 57 00 17　　40 72 41 53 70 00 31 03 06　　注： DW(1,1)表示由两个I(1)变量进行回归，计算得到的DW值　　 DW(1,0)表示由一个I(1)变量和一个I(0)变量进行回归，计算得到的DW值。　　 DW(0,0)表示由两个I(0)变量进行回归，计算得到的DW值。　　在每个样本容量条件下各模拟1000次。　　图一 T = 50模拟1000次的DW(1,1)分布直方图图二 T = 50模拟1000次的DW(1,0)分布直方图　　在相同样本容量条件下，DW(1,0)分布之所以位于DW(1,1)分布左侧，可作如下解释。随着T ® µ，DW(1,0)和DW(1,1)的分布都趋近于零。由于DW(1,0)来自于一个I(1) 变量和一个I(0)变量之间的回归，所以残差序列wt ~ I(1)。由于DW(1,1)来自于两个I(1)变量之间的回归，一般来说残差序列wt&nb　　1、统计范围　　GDDS将国民经济活动划分为五大经济部门：实际部门、财政部门、金融部门、对外部门和社会人口部门。对每一部门各选定一组能够反映其活动实绩和政策以及可以帮助理解经济发展和结构变化的最为重要的数据类别。系统提出了五大部门综合框架和相关的数据类别以及指标编制和公布的目标，鼓励以适当的、反映成员国需要和能力的频率和及时性来开发和公布指标。选定的数据类别和指标分为规定的和受鼓励的两类。　　规定的数据类别包括：（1）来自综合框架中的核心部分，如实际部门的国民帐户总量、财政部门的中央政府预算总量、金融部门的广义货币和信贷总量、对外部门的国际收支总量；（2）追踪分析统计类目，如实际部门的各种生产指数、财政部门的中央政府财政收支和债务统计、金融部门的中央银行分析帐户、对外部门的国际储备和商品贸易统计；（3）与该部门相关的统计指标，如实际部门的劳动市场和价格指数统计；（4）社会人口数据，包括人口、保健、教育、卫生等方面统计。　　除规定的数据类别以外，GDDS鼓励成员国发布更多的统计信息，以增强成员国经济实绩和政策的透明度。如实际部门列出储蓄、国民总收入指标，财政部门列出利息支付和偿债预计数据等。　　GDDS认为，系统所包括的大多数数据类别都是由各国官方机构编制的。将私人部门编制的数据包括进去将更有助于观察经济的全貌，并使各国数据的范围更加一致。但是，将一些由私人机构编制的数据包括在系统内会增加工作的复杂性，比如由官方转发这些数据隐含着对这些数据质量的认可，官方必须对在公众获得、数据完整性和数据质量方面的责任做出调整。　　2、公布频率　　公布频率是指统计数据编制发布的时间间隔。某项统计数据的公布频率需要根据调查、编制的工作难度和使用者的需要来决定。系统鼓励改进数据的公布频率。GDDS对列出的数据类别的公布频率作了统一规定。例如， GDDS要求国民帐户、国际收支平衡表按年公布，广义货币概览按月公布，汇率则每日公布。　　3、公布及时性　　公布及时性是指统计数据公布的速度。统计数据公布的及时性受多种因素制约，如资料整理和计算手续的繁简、数据公布的形式等。GDDS规定了间隔的最长时限，如按季度统计的GDP数据规定在下一季度内发布，按月度统计的生产指数规定在6周至3个月内公布。　　GDDS将选定的数据类别分为规定性和鼓励性两类，目的是给予参加国公布统计数据一定的灵活性。鼓励性一类是要成员国争取发布的，条件不具备的可以暂不发布。有些数据类别下构成要素后面注明“视具体情况”，即成员国认为该项统计不符合本国实际的，可以不编制发布。GDDS规定的发布周期和发布及时性也列出一些灵活处理和变通的办法。　　GDDS有关数据方面的内容及要求如下：　　GDDS的数据规范　　A、综合框架　　核心框架　　范围、分类和分析框架　　受鼓励的扩展　　频率　　及时性　　国民帐户　　编制和公布全套的名义和实际国民帐户总量和平衡项目，得出国内生产总值、国民总收入、可支配总收入、消费、储蓄、资本形成、净贷款、净借款。编制和公布有关的部门帐户以及国家和部门的资产负债表　　年度　　10-14个月　　中央政府操作　　编制和公布交易和债务的综合数据，需强调：1）包括所有的中央政府单位；2）使用适当的分析框架；3）建立一整套详细的分类标准（税收和非税收收入、经常性和资本性支出、国内及国外融资），并适当细分（根据债务持有人、债务工具和币种）。　　广义政府或公共部门操作数据，在那些地方政府或公共企业操作具有重要分析或政策意义的国家尤其鼓励。　　年度　　6-9个月　　广义货币概览　　编制和公布综合的数据，需强调：1）包括所有的存款公司（银行机构）；2）使用适当的分析框架；3）建立对外资产和负债、按部门分类的国内信贷以及货币（流动性）和非货币债务构成的分类标准。　　月度　　2-3个月　　国际收支　　编制和公布综合的国际收支主要总量数据和平衡项目，包括：货物和服务的进口和出口、贸易差额、收入和转移、经常项目差额、储备和其他金融交易、总余额，并适当进行细分。　　国际投资头寸和总体经济外债数据（如果这些数据具有重要的分析和政策意义）　　年度　　6-9个月　　GDDS的数据规范　　B、数据类别和指标　　数据类别　　核心指标　　受鼓励的总量及构成　　频率　　及时性　　实际部门　　国民帐户总量　　国内生产总值（名义和实际）　　国民总收入、资本形成、储蓄　　年度（鼓励季度）　　6-9个月　　生产指数　　制造业或工业　　初级产品、农业或其他指标　　视具体情况　　月度　　视具体情况　　所有指标都为6周-3个月　　价格指数　　消费者价格指数　　生产者价格指数　　月度　　1-2个月　　劳动力市场指标　　就业、失业，工资/收入，视具体情况　　年度　　6-9个月　　财政部门　　核心指标　　受鼓励的指标　　频率　　及时性　　中央政府预算总量　　收入、支出、差额和融资，视具体情况进行细分（根据债务持有人、债务工具和币种）　　利息支付　　季度　　1个季度　　中央政府债务　　内债和外债，视具体情况适当细分（按币种、期限、债务持有人和债务工具）　　政府担保债务　　年度（鼓励季度）　　1-2个季度　　金融部门　　核心指标　　受鼓励的指标　　频率　　及时性　　广义货币和信贷总量　　净对外头寸、国内信贷、广义或狭义货币　　月度　　1-3个月　　中央银行总量　　储备货币　　月度　　1-2个月　　利率　　短期和长期政府债券利率，政策可变利率　　货币或银行间市场利率及一套存贷款利率　　月度　　高频率（如月度）　　股票市场　　股票价格指数，视具体情况　　月度　　对外部门　　核心指标　　受鼓励的指标　　频率　　及时性　　国际收支总量　　货物和服务的进口和出口、经常帐户差额、储备、总差额　　总体经济的外债和偿债数据，视具体情况　　年度（十分鼓励季度）　　6个月　　国际储备　　以美元标价的官方储备总额　　与储备有关的负债　　月度　　1-4周　　商品贸易　　总进口和总出口　　较长时间的主要商品的分类　　月度　　8周-3个月　　汇率　　即期汇率　　每日　　高频率（如月度）　　社会-人口数据　　核心指标　　频率　　人口　　人口；人口增长率；城市人口；农业人口；人口性别；人口的年龄构成　　各国公布频率会各不相同；及时性　　保健　　每个医生照顾人口数；预期寿命；婴儿/儿童/产妇死亡率　　也不尽相同　　教育　　成年人文盲率、学生-教师比率、小学/中学入学率　　贫困状况　　获得洁净水的情况、卫生；每个房间居住的人数；收入分配；最低收入标准以下的家庭数　　二、公布数据的质量　　GDDS从两个方面的内容来评估公布的统计数据质量，即：提供统计数据的文字说明和提供统计数据的交叉检验。　　统计数据质量是个难以界定、因而不易评估的概念。为了便于检查，GDDS选定两条规则作为评估统计数据质量的标准。一是参加国提供数据编制方法和数据来源方面的资料。资料可以采取多种形式，包括公布数据时所附的概括性说明、单独出版物和可从编制者得到的有关说明。同时也鼓励成员国准备并公布重要的关于数据质量特征的说明（例如，数据可能存在的误差类型、不同时期数据之所以不可比的原因、数据调查的范围或调查数据的样本误差等）。二是提供统计类目核心指标的细项内容、及与其相关的统计数据的核对方法，以及支持数据交叉复核并保证合理性的统计框架。为了支持和鼓励使用者对数据进行核对和检验，规定在统计框架内公布有关总量数据的分项，公布有关数据的比较和核对。统计框架包括核算等式和统计关系。比较核对主要针对那些跨越不同框架的数据，例如，作为国民帐户一部分的进出口和作为国际收支一部分的进出口的交叉核对。　　与数据质量密不可分的是制定和公布改进数据的计划。所准备和公布的改进计划应包含所有数据不全的部门。统计当局应表明下述立场中的一个：（1）针对已发现不全的改进计划；（2）最近实施的改进措施；或（3）国家认定不　　四、公众获取　　GDDS规定要提前公布数据发布日期，并向各方同时发送。　　官方统计数据的公布是统计数据作为一项公共产品的基本特征之一，及时和机会均等地获得统计数据是公众的基本要求。GDDS对此制定了两项规划：一是参加国要预先公布各项统计的发布日历表。预先公布统计发布日程表既可方便使用者安排利用数据，又可显示统计工作管理完善和表明数据编制的透明度。GDDS规定对于以年度为频率公布的综合框架和指标，时间表表明不迟于某个既定时间；对于公布频率更高的数据，则可确定一个日期范围，如3-5天。鼓励成员国向公众公布发布最新信息的机构或个人的名称或地址。二是统计发布必须同时发送所有有关各方。由于数据是有价值的商品，因此GDDS规定应向所有有关方同时发布统计数据，以体现公平的原则。发布时可先提供概括性数据，然后再提供详细的数据，当局应至少提供一个公众知道并可以进入的地方，数据一经发布，公众就可以公平地获得。

数据可从网上搜索，统计年鉴及各大数据库都有，再通过统计软件作分析，例如相关分析和回归分析，这种论文偏理论型。推论统计学被用来将资料中的数据模型化，计算它的机率并且做出对于母体的推论。这个推论可能以对/错问题的答案所呈现（假设检定）。对于数字特征量的估计（估计），对于未来观察的预测，关联性的预测（相关性），或是将关系模型化（回归）。其他的模型化技术包括变异数分析（ANOVA），时间序列，以及数据挖掘。为了实际的理由，我们选择研究母体的子集代替研究母体的每一笔资料，这个子集称做样本。以某种经验设计实验所搜集的样本叫做资料。资料是统计分析的对象，并且被用做两种相关的用途：描述和推论。描述统计学处理有关叙述的问题：资料是否可以被有效的摘要，不论是以数学或是图片表现，以用来代表母体的性质？基础的数学描述包括了平均数和标准差。图像的摘要则包含了许多种的表和图。

统计学数据分析论文范文

《统计学与应用》这本期刊上的文献，你可以去看看学习学习的

摘要：本文用模特卡罗模拟方法研究了样本容量在54以下的DW统计量的分布特征，并给出小样本DW检验临界值表。同时用DW检验提出了一个判别最小二乘估计中是否存在虚假回归的有效方法。关键词：模特卡罗模拟，DW分布，非平稳性，协整　　Distribution of Small Sample DW Statistic　　Zhang Xiaotong1 Zhao Chuxiao2　　( Institute of International Economics, Nankai University, Tianjin 300071)　　( Management School, Tianjin University, Tianjin 300072)　　Abstract In this paper we investigated the DW distribution with sample size under 54 by Monte Carlo simulation method and gave a critical table for small sample DW Based on that we proposed a method for recognizing spurious regression in ordinary least squares Keywords: Monte Carlo simulation, DW distribution, nonstationary, cointegration　　1．概述　　八十年代以来，Engle-Granger (1987), Engle-Yoo (1987) 和Sargan-Bhargava (1983)都曾提及用DW统计量检验非平稳变量间的协整性问题。在Sargan-Bhargava (1983)中还专门给出一个DW协整检验用表。但在这些论文中均未对小样本DW统计量的分布特征给与研究。　　本文采用蒙特卡罗模拟方法对小样本DW统计量的分布特征进行了充分、详细的研究。样本容量分别取为10，20，30，40和50。变量的设定分为三种情形：一所涉及的两个变量都取自I(1)过程；二所涉及的两个变量中一个取自I(1)过程，一个取自I(0)过程；三所涉及的两个变量都取自I(0)过程。　　在有些国家以年为单位的时间序列的最大可观测值个数并不是很大，所以对小样本DW统计量分布特征的研究有着非常重要的理论与现实意义。　　本文结构如下。第二节推导两个I(1)变量进行最小二乘回归后，由残差计算的DW统计量的极限分布表达式，第三节介绍蒙特卡罗模拟结果及其分析，第四节给出实例，第五节给出结论。　　2．DW统计量的极限分布　　给定如下随机数据生成系统，　　yt = yt-1 + ut , y1 = 0, （1）　　xt = xt-1 + vt , x1 = 0, （2）　　其中ut, vt ~ I(0), E(ut) = E(vt) = 0; E(ui uj) = 0, i ¹ j," i, j。则yt和xt为相互独立的两个I(1)过程。　　建立如下回归模型：　　yt = b0 + b1xt + wt （3）　　当对上式进行最小二乘估计时，会产生虚假回归问题。用随机误差wt的最小二乘估计值构造DW统计量，　　（4）　　因为当T ® µ 时，必然接近于零，上式中分子为Op(1)，而分母T -1sw2也是Op(1)，所以DW统计量是Op(T -1)的。当T ® µ 时，有　　DW Þ 　　即当用两个I(1)变量进行如模型(3)形式的回归时，DW统计量的极限分布为零。　　3．小样本DW分布的蒙特卡罗模拟及其结果分析　　当样本为有限样本，特别是小样本时，DW统计量的分布与其极限分布有着很大不同。由于上述条件下的DW统计量的分布无法用解析的方法求解，本文用蒙特卡罗模拟方法对DW统计量的小样本分布特征进行了研究。　　以模型(3)为基础，除了以yt，xt ~ I(1)为条件对DW分布（记为DW(1,1)）进行模拟外，还分别以yt ~ I(1)，xt ~ I(0) 和yt，xt ~ I(0)为条件进行了模拟（分别记为DW(1,0) 和DW(0,0)）。　　由于DW(0,0)就是通常意义的DW统计量，所以只模拟样本容量T = 10, 40两种情形。对于DW(1,1)和DW(1,0)，分别取T = 10, 20, 30, 40和50进行了模拟。在每个样本容量条件下各模拟1000次。所得结果见表一。　　首先见表一的第三部分，先分析DW(0,0) 的分布特征。由于DW(0,0) 就是通常意义的DW统计量，所以模拟结果表明，一 DW(0,0)分布的均值为2，不受样本容量大小的影响；二分布是对称的，相应JB值（表中最后一列）说明小样本DW(0,0)统计量的分布与正态分布相当近似。三随着样本容量的增大，分布的标准差逐步减小。　　见表一的第一、二部分。小样本DW(1,1)和DW(1,0)统计量有着相似的分布特征。一分布均为右偏态，分布左侧有端点，端点为零；二随着样本容量的增大，DW(1,1)和DW(1,0)分布的右偏倚程度越来越大，分布均值逐步相左移动，90、95、99百分位数也逐步向左移动，同时分布的标准差逐步减小，分布的峰值越来越大，DW取值向零集中；三在样本容量相同的条件下，DW(1,0)分布总是位于DW(1,1)分布的左侧，即DW(1,0)分布的均值、百分位数以及方差都比DW(1,1)分布的相应量小。T = 50模拟1000次的DW(1,1)和DW(1,0)分布的结果分别见图一和图二。　　表一 DW分布的蒙特卡罗模拟结果　　类型样本容量百分位数均值标准差偏度 JB统计量　　1 90 95 99　　10 22 18 45 81 28 62 50 74　　DW(1,1) 20 11 28 49 80 75 39 68 61　　30 09 90 04 39 51 29 07 73　　40 06 77 88 16 41 25 06 10　　50 05 59 71 98 33 20 16 31　　10 18 73 02 38 98 53 73 59　　20 09 02 21 59 56 34 22 61　　DW(1,0) 30 06 70 83 18 38 24 27 43　　40 04 54 66 91 30 19 25 68　　50 04 45 54 71 24 15 12 84　　DW(0,0) 10 31 75 97 24 02 57 00 17　　40 72 41 53 70 00 31 03 06　　注： DW(1,1)表示由两个I(1)变量进行回归，计算得到的DW值　　 DW(1,0)表示由一个I(1)变量和一个I(0)变量进行回归，计算得到的DW值。　　 DW(0,0)表示由两个I(0)变量进行回归，计算得到的DW值。　　在每个样本容量条件下各模拟1000次。　　图一 T = 50模拟1000次的DW(1,1)分布直方图图二 T = 50模拟1000次的DW(1,0)分布直方图　　在相同样本容量条件下，DW(1,0)分布之所以位于DW(1,1)分布左侧，可作如下解释。随着T ® µ，DW(1,0)和DW(1,1)的分布都趋近于零。由于DW(1,0)来自于一个I(1) 变量和一个I(0)变量之间的回归，所以残差序列wt ~ I(1)。由于DW(1,1)来自于两个I(1)变量之间的回归，一般来说残差序列wt&nb　　1、统计范围　　GDDS将国民经济活动划分为五大经济部门：实际部门、财政部门、金融部门、对外部门和社会人口部门。对每一部门各选定一组能够反映其活动实绩和政策以及可以帮助理解经济发展和结构变化的最为重要的数据类别。系统提出了五大部门综合框架和相关的数据类别以及指标编制和公布的目标，鼓励以适当的、反映成员国需要和能力的频率和及时性来开发和公布指标。选定的数据类别和指标分为规定的和受鼓励的两类。　　规定的数据类别包括：（1）来自综合框架中的核心部分，如实际部门的国民帐户总量、财政部门的中央政府预算总量、金融部门的广义货币和信贷总量、对外部门的国际收支总量；（2）追踪分析统计类目，如实际部门的各种生产指数、财政部门的中央政府财政收支和债务统计、金融部门的中央银行分析帐户、对外部门的国际储备和商品贸易统计；（3）与该部门相关的统计指标，如实际部门的劳动市场和价格指数统计；（4）社会人口数据，包括人口、保健、教育、卫生等方面统计。　　除规定的数据类别以外，GDDS鼓励成员国发布更多的统计信息，以增强成员国经济实绩和政策的透明度。如实际部门列出储蓄、国民总收入指标，财政部门列出利息支付和偿债预计数据等。　　GDDS认为，系统所包括的大多数数据类别都是由各国官方机构编制的。将私人部门编制的数据包括进去将更有助于观察经济的全貌，并使各国数据的范围更加一致。但是，将一些由私人机构编制的数据包括在系统内会增加工作的复杂性，比如由官方转发这些数据隐含着对这些数据质量的认可，官方必须对在公众获得、数据完整性和数据质量方面的责任做出调整。　　2、公布频率　　公布频率是指统计数据编制发布的时间间隔。某项统计数据的公布频率需要根据调查、编制的工作难度和使用者的需要来决定。系统鼓励改进数据的公布频率。GDDS对列出的数据类别的公布频率作了统一规定。例如， GDDS要求国民帐户、国际收支平衡表按年公布，广义货币概览按月公布，汇率则每日公布。　　3、公布及时性　　公布及时性是指统计数据公布的速度。统计数据公布的及时性受多种因素制约，如资料整理和计算手续的繁简、数据公布的形式等。GDDS规定了间隔的最长时限，如按季度统计的GDP数据规定在下一季度内发布，按月度统计的生产指数规定在6周至3个月内公布。　　GDDS将选定的数据类别分为规定性和鼓励性两类，目的是给予参加国公布统计数据一定的灵活性。鼓励性一类是要成员国争取发布的，条件不具备的可以暂不发布。有些数据类别下构成要素后面注明“视具体情况”，即成员国认为该项统计不符合本国实际的，可以不编制发布。GDDS规定的发布周期和发布及时性也列出一些灵活处理和变通的办法。　　GDDS有关数据方面的内容及要求如下：　　GDDS的数据规范　　A、综合框架　　核心框架　　范围、分类和分析框架　　受鼓励的扩展　　频率　　及时性　　国民帐户　　编制和公布全套的名义和实际国民帐户总量和平衡项目，得出国内生产总值、国民总收入、可支配总收入、消费、储蓄、资本形成、净贷款、净借款。编制和公布有关的部门帐户以及国家和部门的资产负债表　　年度　　10-14个月　　中央政府操作　　编制和公布交易和债务的综合数据，需强调：1）包括所有的中央政府单位；2）使用适当的分析框架；3）建立一整套详细的分类标准（税收和非税收收入、经常性和资本性支出、国内及国外融资），并适当细分（根据债务持有人、债务工具和币种）。　　广义政府或公共部门操作数据，在那些地方政府或公共企业操作具有重要分析或政策意义的国家尤其鼓励。　　年度　　6-9个月　　广义货币概览　　编制和公布综合的数据，需强调：1）包括所有的存款公司（银行机构）；2）使用适当的分析框架；3）建立对外资产和负债、按部门分类的国内信贷以及货币（流动性）和非货币债务构成的分类标准。　　月度　　2-3个月　　国际收支　　编制和公布综合的国际收支主要总量数据和平衡项目，包括：货物和服务的进口和出口、贸易差额、收入和转移、经常项目差额、储备和其他金融交易、总余额，并适当进行细分。　　国际投资头寸和总体经济外债数据（如果这些数据具有重要的分析和政策意义）　　年度　　6-9个月　　GDDS的数据规范　　B、数据类别和指标　　数据类别　　核心指标　　受鼓励的总量及构成　　频率　　及时性　　实际部门　　国民帐户总量　　国内生产总值（名义和实际）　　国民总收入、资本形成、储蓄　　年度（鼓励季度）　　6-9个月　　生产指数　　制造业或工业　　初级产品、农业或其他指标　　视具体情况　　月度　　视具体情况　　所有指标都为6周-3个月　　价格指数　　消费者价格指数　　生产者价格指数　　月度　　1-2个月　　劳动力市场指标　　就业、失业，工资/收入，视具体情况　　年度　　6-9个月　　财政部门　　核心指标　　受鼓励的指标　　频率　　及时性　　中央政府预算总量　　收入、支出、差额和融资，视具体情况进行细分（根据债务持有人、债务工具和币种）　　利息支付　　季度　　1个季度　　中央政府债务　　内债和外债，视具体情况适当细分（按币种、期限、债务持有人和债务工具）　　政府担保债务　　年度（鼓励季度）　　1-2个季度　　金融部门　　核心指标　　受鼓励的指标　　频率　　及时性　　广义货币和信贷总量　　净对外头寸、国内信贷、广义或狭义货币　　月度　　1-3个月　　中央银行总量　　储备货币　　月度　　1-2个月　　利率　　短期和长期政府债券利率，政策可变利率　　货币或银行间市场利率及一套存贷款利率　　月度　　高频率（如月度）　　股票市场　　股票价格指数，视具体情况　　月度　　对外部门　　核心指标　　受鼓励的指标　　频率　　及时性　　国际收支总量　　货物和服务的进口和出口、经常帐户差额、储备、总差额　　总体经济的外债和偿债数据，视具体情况　　年度（十分鼓励季度）　　6个月　　国际储备　　以美元标价的官方储备总额　　与储备有关的负债　　月度　　1-4周　　商品贸易　　总进口和总出口　　较长时间的主要商品的分类　　月度　　8周-3个月　　汇率　　即期汇率　　每日　　高频率（如月度）　　社会-人口数据　　核心指标　　频率　　人口　　人口；人口增长率；城市人口；农业人口；人口性别；人口的年龄构成　　各国公布频率会各不相同；及时性　　保健　　每个医生照顾人口数；预期寿命；婴儿/儿童/产妇死亡率　　也不尽相同　　教育　　成年人文盲率、学生-教师比率、小学/中学入学率　　贫困状况　　获得洁净水的情况、卫生；每个房间居住的人数；收入分配；最低收入标准以下的家庭数　　二、公布数据的质量　　GDDS从两个方面的内容来评估公布的统计数据质量，即：提供统计数据的文字说明和提供统计数据的交叉检验。　　统计数据质量是个难以界定、因而不易评估的概念。为了便于检查，GDDS选定两条规则作为评估统计数据质量的标准。一是参加国提供数据编制方法和数据来源方面的资料。资料可以采取多种形式，包括公布数据时所附的概括性说明、单独出版物和可从编制者得到的有关说明。同时也鼓励成员国准备并公布重要的关于数据质量特征的说明（例如，数据可能存在的误差类型、不同时期数据之所以不可比的原因、数据调查的范围或调查数据的样本误差等）。二是提供统计类目核心指标的细项内容、及与其相关的统计数据的核对方法，以及支持数据交叉复核并保证合理性的统计框架。为了支持和鼓励使用者对数据进行核对和检验，规定在统计框架内公布有关总量数据的分项，公布有关数据的比较和核对。统计框架包括核算等式和统计关系。比较核对主要针对那些跨越不同框架的数据，例如，作为国民帐户一部分的进出口和作为国际收支一部分的进出口的交叉核对。　　与数据质量密不可分的是制定和公布改进数据的计划。所准备和公布的改进计划应包含所有数据不全的部门。统计当局应表明下述立场中的一个：（1）针对已发现不全的改进计划；（2）最近实施的改进措施；或（3）国家认定不　　四、公众获取　　GDDS规定要提前公布数据发布日期，并向各方同时发送。　　官方统计数据的公布是统计数据作为一项公共产品的基本特征之一，及时和机会均等地获得统计数据是公众的基本要求。GDDS对此制定了两项规划：一是参加国要预先公布各项统计的发布日历表。预先公布统计发布日程表既可方便使用者安排利用数据，又可显示统计工作管理完善和表明数据编制的透明度。GDDS规定对于以年度为频率公布的综合框架和指标，时间表表明不迟于某个既定时间；对于公布频率更高的数据，则可确定一个日期范围，如3-5天。鼓励成员国向公众公布发布最新信息的机构或个人的名称或地址。二是统计发布必须同时发送所有有关各方。由于数据是有价值的商品，因此GDDS规定应向所有有关方同时发布统计数据，以体现公平的原则。发布时可先提供概括性数据，然后再提供详细的数据，当局应至少提供一个公众知道并可以进入的地方，数据一经发布，公众就可以公平地获得。

论文中的数据统计法

,上去看看。

《统计学与应用》这本期刊上的文献，你可以去看看学习学习的

如果研究一个X或多个X对Y的影响关系，其中Y为定量数据，可使用线性回归分析，构建回归模型。如果研究一个X或多个X对Y的影响关系，其中Y为定类数据，可使用Logistic分析，构建Logistic回归模型。如果要分析1组X与一组Y之间的关系情况，可使用典型相关分析。如果要分析多个X与多个Y之间的影响关系情况，且样本量较小（通常小于200），可使用PLS回归分析。

缺失值的处理：缺失值是人群研究中不可避免的问题，其处理方式的差异可能在不同程度上引入偏倚，因此，详细报告数据清理过程中缺失值的处理方法有助于读者对潜在偏倚风险进行评价。例如，瑞舒伐他汀试验在统计分析部分详细说明了缺失值的填补策略，包括：将二分类结局中的缺失值视为未发生事件；将生物标志物和心电图测量中的缺失值进行多重填补（multiple imputation）；为了证明缺失值处理的合理性和填补结果的稳定性，研究还比较了多重填补与完整数据（complete-case）分析的结果。2、数据的预处理：实施统计分析之前往往需要将原始数据进行预处理，如：对连续变量进行函数转换使其更接近正态分布，基于原始数据构建衍生变量，将连续变量拆分为分类变量或将分类变量的不同类别进行合并等。医学论文应报告处理原始数据的方法及依据，瑞舒伐他汀试验即在统计分析部分描述了对血液生物标志物的对数转换。3、变量分布特征描述：确定统计分析使用的变量，并针对每一个变量的分布特征进行描述，是决定研究选用何种统计分析方法的基础。医学期刊虽然普遍对此提出要求，但作者往往套用常用方法，如：连续变量符合正态分布时，采用均数（标准差）描述，否则采用中位数（四分位间距）描述；分类变量采用频数（百分比）描述等。事实上，应根据研究设计类型、统计分析目的和数据特征选择恰当的描述方法。例如，CKB选择采用年龄、性别和地区校正的均值和率来描述人群分布特征，而非简单的报告连续变量的均数和分类变量的构成比。4、主要分析（primary analysis）：指针对研究结局的统计分析，是研究论文的核心证据。因此，医学论文应详细描述主要分析的实施过程和适用性。在试验性研究中，应明确统计分析数据集、试验效应指标、相对或绝对风险及其置信区间的计算方法、以及假设检验的方法。

数据统计方面的论文

统计学领域，必须要读大数据定理，比如说伯努力大数定理等等，只有了解了这些大数定理，你才能更好地运用统计学去做一些统计工作。

统计学的论文，如果你想参考的话，可以上一些比较出名的论文网站上去搜索，但只能是参考，不能抄袭，你可以从他的论文上去汲取一些东西，把这种东西转化成自己的东西，再用自己的言语去描述

虽然我也写过论文，但并不是你这个专业的，但我想论文的大致思路其实也是差不多的。首先你得要确定你论文的题目，确定了论文题目之后就会比较好下笔了

世界银行关于中国GDP数据的调整及其存在的问题（内容提要：论文深入研究了世行调整中国GDP数据的原因、方法和结果，系统地阐述了90年代初以来中国统计体系和价格体制改革所取得的巨大进步，以事实为依据，利用大量翔实的资料，对世行的调整方法进行了逐项剖析，揭示出其存在的问题，阐明了这种调整方法已经不符合中国目前的实际情况、世行不应再调整中国GDP数据的基本观点。本文发表在《经济研究》1999年第6期。）90年代初，世界银行派代表团对中国统计体系进行考察之后，发表了一篇考察报告：《转换中的中国统计体系》。报告认为，中国统计体系虽然进行了深入的改革，但其在基本概念、调查范围、调查方法等方面仍存在着很大缺陷:基本概念仍深深扎根于传统的物质产品平衡表体系（MPS），调查范围仍主要限于物质生产领域，调查方法仍以传统的全面行政报表为主；中国价格体制虽然进行了许多重大改革，但仍保留着传统价格体制的许多本质特征，许多产品的价格仍然处于政府控制之中。这些情况导致中国官方国内生产总值（GDP）总量数据的低估和速度的高估。1994年，世行发表了一篇专题报告：《中国人均GNP》。它以上述考察报告为依据，对中国官方1992年GDP数据进行了较大幅度的向上调整。世行公布的1993-1997年的中国人均GNP数据是在其调整后的中国1992年GDP（注1）总量数据和中国官方公布的经济增长率数据基础上计算出来的。因此，世行公布的中国1992-1997年人均GNP数据远大于中国官方人均GNP（注2）的美元折算数。本文阐述世行关于中国官方1992年GDP数据的调整及其存在的问题。一、世界银行关于中国官方GDP数据的调整世界银行对中国官方GDP数据的调整包括三个方面内容：一致性调整、范围调整和估价调整，综合调整比率为3%。其中一致性调整和范围调整是关于统计体系的不完善所做的调整，估价调整是关于价格体制的影响所做的调整。世行关于中国官方GDP数据的调整情况简要概括在表1中：表1：世界银行关于中国官方GDP数据的调整调整项目调整幅度对GDP的影响(%) 自产自用的粮食上调20% +8存货增加下调1/3 -6福利服务 10%企业劳动力从事福利服务 +6亏损补贴补贴视作政府最终支出 +8 一致性调整合计 +6粮食产出上调10% +9蔬菜产出上调30% +3农村工业产出上调10-15% +6农村服务业产出上调50-60% +5 住房服务支出上调40% +5 范围调整合计 7住房服务 8% 5 全部其他行业 -1%-0% 6 估价调整合计 3% 3 总计 3注：1、农村工业包括农村煤炭开采业、纺织业、消费品制造业和其他工业2、农村服务业包括人文服务业、原材料服务业和其他服务业3、全部其他行业包括粮食作物种植业、其他作物种植业、煤炭开采业、纺织业、消费品制造业、其他工业、人文服务业、原材料供应业、其他服务业（一）一致性调整从表1可以看出，世行关于中国官方1992年GDP数据的一致性调整包括以下几个方面：1、农民自产自用的粮食世行认为,中国统计体系以低于市场的价格估价农民自己生产自己消费的粮食。它假定对这部分粮食进行一致性估价将使其价值增加20%,这种调整使GDP上升8%。2、存货增加世行认为，中国对不能销售或不能按计算产出时所采用的价格销售的产出存货增加的计算存在严重的不一致性。它认为，一般来说，如果这些存货结转另一年，并最终被废弃或按大打折扣的价格销售，中国没有对GDP中的存货增加做相应的调整。因此，存货增加大于采用一致性估价所应有的价值量。世行因此将中国的存货增加调低1/3，导致GDP下降6%。3、福利服务世行认为,中国企业改革的最重要组成部分之一,是将目前企业对职工提供的诸如住房、医疗等福利性服务市场化。这种改革的结果将导致GDP上升。世行假定有10%的劳动力从事相应的服务,并假定这些服务转向市场化。通过投入产出计算,这种假定使GDP 上升6%。4、企业亏损补贴中国统计规定,企业亏损补贴作为GDP的负项。世行认为,在许多情况下,企业亏损是政府价格政策的结果。从经济观点来看,这种补贴是对以优惠价格提供货物和服务的补偿,统计上应当处理为政府的货物和服务购买和政府对相应接受者的分配,即不应当作为GDP的负项,而应当作为正项包括在政府最终支出中。世行对这种处理方法进行了调整，结果使政府支出增加7%,导致GDP上升8%。综合上述结果,世行将中国官方1992年GDP数据上调了6%。（二）范围调整从表1可以看出，世行关于中国官方1992年GDP数据的范围调整包括以下几个方面：1、粮食世行认为,中国的耕地面积被低估了十分之一到三分之一（与卫星测量的耕地面积相比）；同时，样本产量可能被高估了,综合两方面因素,将中国的粮食产出调高10%，导致GDP上升9%2、蔬菜世行认为,中国蔬菜产出价值的计算没有反映单位面积的蔬菜实物产量随时间和收获周期而变化以及市场力量正在鼓励蔬菜的非旺季生产(此时价格较高)情况,同时,蔬菜耕地面积的测算也是不准确的。考虑以上各方面因素,世行将中国的蔬菜产出价值调高30%,导致GDP上升3%。3、农村工业世行认为,村及村以下工业的产出被低估,因为相应企业通常没有完整的财务报表和不属于国家统计局直接管理的统计调查系统。农村工业的迅速发展和一定程度的偷漏税情况影响到产出的低估。某些迅速增长的农村工业,如建筑材料工业,高价格和高利润鼓励了产出的低估。利润低的行业,如煤炭开采业,也有低报的刺激,因为煤炭的自由市场价格较高。另外,世行也指出,为了夸大地方官员的政绩,农村工业也出现了高估产出的现象。综合上述因素,世行将中国农村工业产出调高10－15%，导致GDP上升6%。4、农村服务业世行认为,农村服务业,例如农村卡车和拖拉机运输服务业发展的非常迅速，但是中国没有一套系统的测算方案;农村服务业统计基本上没有包括临时生活和工作在城市的农村人从事的服务活动，例如大量的个体维修店的修理人员、小贩、餐馆老板、理发师和家庭佣人,等等。考虑上述因素,世行将农村服务业产出调高50%-60%，导致GDP上升5%。5、居民住房服务世行认为,中国居民住房服务既存在范围方面的低估，也存在价格方面的低估。从范围方面讲，城市和农村住房服务统计都不完整。中国的住房服务价值是通过住房面积、造价和折旧率等资料推算出来的，但住房面积资料不完整，城市住房面积调查资料没有包括居住在城市里的农村居民住房面积，农村住房面积调查范围的不完整性更加突出。世行假定国家统计调查网络覆盖了中国所有住房的三分之二到四分之三,进而把中国的住房服务价值调高40%,导致GDP上升5%。综合上述结果,世行将中国官方1992年GDP数据上调了7%。（三）估价调整世行认为,由于扭曲的价格体制和生产率方面的差异,中国工业的土地和资本回报率远高于其他行业，消费品制造业的回报率最高,服务业和煤炭行业的回报率最低,农业的回报率也比较低，中国进一步的价格改革将改变行业的营利状况。世行试图将各行业的土地和资本回报率调整到全国的平均水平。由于纺织行业在中国对外贸易中很重要,世行在估价调整过程中,保持该行业的价格不变，将住房和其他房地产业的价格提高,纺织业以外的消费者制造业的价格降低。世行利用1987年投入产出表对GDP进行了调整,结果使GDP上调3%。综合上述三个方面的调整结果,世行将中国官方1992年GDP数据上调了3%。二、世界银行关于中国GDP数据调整存在的问题世行关于中国GDP数据的调整是建立在它对80年代末90年代初中国统计体系和价格体制的了解和判断基础上的。90年代初以来，中国统计体系和价格体制改革取得了巨大进步。就统计体系来说，随着国民经济核算制度的改革，基本概念和基本框架已经基本上实现了向国民经济核算最新国际标准--联合国1993年SNA的转换；统计调查范围已经由传统的物质生产领域扩展到非物质生产领域；全面行政报表的统计调查方法已经被以普查为基础，抽样调查为主体的调查方法体系所取代；开展了多项普查，包括农业普查、工业普查、第三产业普查、基本单位普查，等等；许多专业统计采用了抽样调查方法，例如农产品产量调查、农村和城市住户调查、价格调查，等等。这一系列统计改革，使中国统计体系得到不断完善。就价格体制来说，中国进行了广泛而深入的改革，目前，市场价格已经成为中国价格体系的主体。具体说来，世行关于中国GDP数据的调整至少存在以下若干方面问题：（一）一致性调整问题1、农民自产自用粮食的估价中国农业统计规定，农民自产自用粮食的价值，按出售的综合平均价格计算，这种综合平均价格综合了国家收购价格与市场价格两种因素。近些年来，中国粮食连续获得丰收，为了保护农民种粮的积极性，国家的粮食收购价格已经高于，而不是低于市场价格，因此，上述综合平均价格不会低于市场价格。世行关于中国统计体系以低于市场的价格估价农民自产自用的粮食的判断，已经不符合中国目前的实际情况。2、存货增加80年代末90年代初，受传统的计划经济体制的影响，还有相当一部分企业只考虑生产不考虑市场需求和赢利情况。这些企业生产出来的部分产品可能销售不了，只能被废弃或按大打折扣的价格处理。因此，就当时的情况来说，世行把中国的存货增加调低三分之一，可能是不过分的。但是，自从党的十四大把中国经济体制的改革目标确定为市场经济体制以来，情况发生了很大的变化，市场需求和赢利状况已经逐步成为企业生产决策的主要考虑。因此，企业生产的产品被废弃或按打折扣的价格处理的情况明显减少。所以，世行的调整比率不再适合中国目前的存货产品销售的实际情况。3、福利服务近些年来，中国进行的一系列企业制度改革，正在推动企业的福利性服务逐步走向市场化，企业从事福利性服务人员的比例正在逐步下降。因此，至少对于中国目前的企业情况来说，世行假定企业有10%的劳动力从事福利性服务的比例太高了，相应地对GDP的调整比例也就不合适了。（二）范围调整问题1、粮食中国官方统计的耕地面积数据确实低于卫星测量数据，但是，卫星测量出来的耕地面积包括25度以上的坡地、河滩地、轮休地、沟渠和田间道路等等。这些地不能视同正常的耕地。所以，中国官方的耕地面积数据与实际耕地面积之间的差距不像世行估计的那么大。另外，除了农业统计包括粮食产量调查外，农村住户调查还编制农村住户农业生产情况表和农村住户粮食收支平衡表，分别反映农村住户粮食生产情况和年初粮食结存、年内粮食收入、年内粮食支出、年末粮食结存情况。这些不同类型调查能够对粮食产量统计起到校对作用。根据以上情况，中国的粮食产出数据与实际情况应当是比较吻合的，世行将其调高10%，必将导致GDP数据的高估。2、牧业世行断定中国统计数据低估了农业产出，事实上，中国的经常性农业统计还存在高估的成分。全国农业普查结果表明，1996年统计年报中的肉类产量高估了22%，猪、牛、羊存栏头数分别高估了7%，、1%和8%。因此农业总产出和农业增加值被高估了。针对这种情况， GDP应当相应地向下调整。这是世行所没有料到的。3、农村工业全国第三次工业普查结果表明：由农业部乡镇企业管理部门统计的农村工业总产值数据高估了18000亿元（1995年），占全部农村工业总产值的40%。显然，与世行的判断恰好相反，农村工业产出应当向下调整，而不应当向上调整。4、农村服务业世行关于中国农村服务业统计不完善的判断和数据调整对于80年代末、90年代初的中国统计状况来说，是不过分的。但是，中国在1993至1995年开展了首次第三产业普查，对包括农村服务业在内的全部服务行业进行了全面调查，同时，根据普查资料对GDP历史数据进行了较大幅度的调整：表2：第三产业普查关于服务业增加值和GDP数据的调整比率(%)年度 GDP 第三产业运输邮电通信业商业非物质服务业1978 0 4 0 0 3 1980 1 2 0 0 6 1985 1 6 0 2 9 1986 3 2 0 1 4 1987 8 0 0 3 2 1988 1 4 0 1 7 1989 7 3 0 7 8 1990 8 2 7 6 5 1991 1 7 4 6 9 1992 3 1 5 7 7 1993 0 0 7 4 8注：本表根据《中国统计年鉴，1994》和《中国统计年鉴，1995》计算。事实上，这种调整已经大大超过世行对农村服务业的调整。例如，世行对农村服务业数据的调整导致1992年 GDP数据上升5%,而第三产业普查之后，中国对同年GDP数据的上调比例达3%。因此世行对中国农村服务业统计的判断和数据调整已经不再适合中国目前的实际情况。（三）估价调整问题90年代初以来，中国确立了建立社会主义市场价格体制的目标模式，价格改革取得了突破性进展，严重扭曲的价格结构得到明显改善。例如，从1990年到1997年，世行认为土地和资本回报率最低的服务业和煤炭工业价格分别上涨了222%和206%，而属于土地和资本回报率最高的消费品制造业的食品工业和纺织工业价格仅分别上涨8%和3%。特别重要的是，目前，市场机制在中国货物和服务价格形成中已经起了主导作用。货物的价格基本上由市场决定，除部分服务业，如居民福利性住房服务业仍偏离市场价格外，绝大多数服务业的价格也由市场决定。即使那些偏离市场价格的服务业也正在迅速向市场价格过渡。例如，随着住房制度的改革，住房服务将市场化，福利性住房服务不久将不复存在。另外，有关部门在对33种具有代表性的商品进行国内外价格比较时发现，1998年11月，国内价格高于国际价格的有22种，占69%，其中包括小麦、玉米、大豆、豆油等农产品，硫酸、盐酸、尿素等化工产品，汽油、柴油等能源产品，铝锭、生铁等冶金产品，等等。总之，在中国的价格形成机制、价格规模和价格结构发生重大变化的情况下，如果世行仍然依据1987年投入产出表对各行业进行价格方面的调整，也势必导致GDP数据的高估。注1：由于中国官方GDP和GNP数据差距不大，世界银行在计算中国官方人均GNP时是以中国官方GDP数据，而不是以GNP数据为基础。由于同样的原因，本文对GDP和GNP不加区别。注2：中国官方人均GNP是按人民币计算的。参考文献——Document of the World Bank N13580-CHA:China GNP per Capita，December15,世界银行文件：《转换中的中国统计体系》，国家统计局内部翻译件。国家统计局1998年制定：《国家统计报表制度》。国家统计局1998年制定：《农村住户调查方案》。国家统计局编：《中国统计年鉴》(1994,1995 ，1997，1998），中国统计出版社 1994、1995、1997和1998年出版。许宪春著：《中国国民经济核算体系改革与发展》，经济科学出版社1997年出版。《价格监测与分析》1998年第22期

首页

> 论文期刊知识库

有关数据统计的论文范文