第一章 绪论一、判断题:1、社会经济统计的研究对象是社会经济现象总体的各个方面。(×) 2、统计调查过程中采用的大量观察法,是指必须对研究对象的所有单位进行调查。(×) 3、 总体的同质性是指总体中的各个单位在所有标志上都相同。 (×)4、个人的工资水平和全部职工的工资水平,都可以称为统计指标。(×)5、对某市工程技术人员进行普查,该市工程技术人员的工资收入水平是数量标志。(×)6、某一职工的文化程度在标志的分类上属于品质标志,职工的平均工资在指标的分类上属于质量指标。( √)7、总体和总体单位是固定不变的。 (×)8、质量指标是反映总体质的特征,因此可以用文字来表述。 (×)9、指标与标志一样,都是由名称和数值两部分组成的。 (×)10、数量指标由数量标志值汇总而来,质量指标由品质标志值汇总而来。(× )11、一个统计总体可以有多个指标。 (√ )二、单选题:1、属于统计总体的是(B ) A、某县的粮食总产量 B、某地区的全部企业 C、某商店的全部商品销售额 D、某单位的全部职工人数 2、构成统计总体的个别事物称为( D)。 A、调查单位 B、标志值 C、品质标志 D、总体单位3、对某城市工业企业未安装设备进行普查,总体单位是(B )。 A、工业企业全部未安装设备 B、工业企业每一台未安装设备 C、每个工业企业的未安装设备 D、每一个工业企业4、工业企业的设备台数、产品产值是(D )。 A、连续变量 B、离散变量 C.前者是连续变量,后者是离散变量 D、前者是离散变量,后者是连续变量5、在全国人口普查中(B )。 A、男性是品质标志 B、人的年龄是变量 C、人口的平均寿命是数量标志 D、全国人口是统计指标6、总体的变异性是指(B )。 A.总体之间有差异 B、总体单位之间在某一标志表现上有差异 C.总体随时间变化而变化 D、总体单位之间有差异7、几位学生的某门课成绩分别是67分、78分、88分、89分、96分,“学生成绩”是(B )。 A、品质标志 B、数量标志 C、标志值 D、数量指标8、某年级学生四门功课的最高考分分别是98分、86分、88分和95,这四个数字是( D ) A指标 B标志 C变量 D标志值9、下列指标中属于质量指标的是(B )。 A、社会总产值 B、产品合格率 C、产品总成本 D、人口总数10、下列属于质量指标的是( D ) A产品的产量 B产品的出口额 C产品的合格品数量 D产品的评价11、下列属于离散型变量的是( D ) A职工的工资 B商品的价格 C粮食的亩产量 D汽车的产量12、标志的具体表现是指( A ) A标志名称之后所列示的属性或数值 B如性别 C标志名称之后所列示的属性 D标志名称之后所列示的数值三、多选题:1、统计一词的含义是( CDE ) A统计设计 B统计调查 C统计工作 D统计学 E统计资料2、统计研究的基本方法包括( ACDE ) A大量观察法 B重点调查法 C统计分组法 D归纳推断法 E综合指标法3、品质标志和数量标志的区别是( AD ) A数量标志可以用数值表示 B品质标志可以用数值表示 C数量标志不可以用数值表示 D品质标志不可以用数值表示 E两者都可以用数值来表示 4、在全国人口普查中(BCE ) A、全国人口总数是统计总体 B、男性是品质标志表现 C、人的年龄是变量 D、每一户是总体单位 E、人口的平均年龄是统计指标5、在工业普查中( BCE) A、工业企业总数是统计总体 B、每一个工业企业是总体单位 C、固定资产总额是统计指标 D、机器台数是连续变量 E、职工人数是离散变量6、下列属于数量标志的有( CE ) A性别 B所有制形式 C收入 D民族 E工龄7、下列统计指标中,属于质量指标的有(BDE ) A、工资总额 B、单位产品成本 C、出勤人数 D、人口密度 E、合格品率第二章 统计数据搜集一、判断题:1、对某市下岗职工生活状况进行调查,要求在一个月内报送调查结果。所规定的一个月时间是调查时间。(×)2、对我国主要粮食作物产区进行调查,以掌握全国主要粮食作物生长的基本情况,这种调查是重点调查。( √)3、我国人口普查的总体单位和调查单位都是每一个人,而填报单位是户。(√ )4、采用重点调查搜集资料时,选择的调查单位是标志值较大的单位。( ×)5、对调查资料进行准确性检查,既要检查调查资料的登记性误差,也要检查资料的代表性误差。(× ) 6、重点调查是在调查对象中选择一部分样本进行的一种全面调查。 (√ )7、多种调查方式结合运用,会造成重复劳动,不应该提倡。 (×)8、全面调查和非全面调查是以调查组织规模的大小来划分的。 ( ×)9、在统计调查中,调查单位与填报单位有时是不一致的。 ( √)二、单选题:1、调查几个重要铁路枢纽,就可以了解我国铁路货运量的基本情况和问题,这种调查属于( B)。 A、普查 B、重点调查 C、典型调查 D、抽样调查2、某市工业企业2010年生产经营成果年报呈报时间规定在2011年1月31日,则调查期限为( B)。 A、一日 B、一个月 C、一年 D、一年零一个月3、下列调查中,调查单位与填报单位一致的是(D )。 A、企业设备调查 B、人口普查 C、农村耕地调查 D、工业企业现状调查4、对一批商品进行质量检验,最适宜采用的方法是(B )。 A、全面调查 B、抽样调查 C、典型调查 D、重点调查5、调查时间是指(A )。 A、调查资料所属的时间 B、进行调查的时间 C、调查工作的期限 D、调查资料报送的时间6、有意识地选择三个农村点调查农民收入情况,这种调查方式属于(A)。 A、典型调查 B、重点调查 C、抽样调查 D、普查7、通过调查大庆、胜利、辽河等几大油田,了解我国石油生产的基本情况。这种调查方式是( B )。A典型调查 B重点调查 C抽样调查 D普查8、人口普查是( C )。A重点调查 B典型调查 C一次性调查 D经常性调查9、人口普查规定标准时间是为了( C )。A确定调查时限 B确定调查单位 C避免登记重复和遗漏 D确定调查对象10、重点调查中的重点单位是指( A )。A标志值在总体中占有很大比重的单位 B具有典型意义或代表性的单位C那些具有反映事物属性差异的品质标志的单位 D能用以推算总体标志总量的单位三、多选题:1、抽样调查和重点调查的共同点是(AB ) A、两者都是非全面调查 B、两者选取单位都不受主观因素的影响 C、两者都按随机原则选取单位 D、两者都按非随机原则选取单位 E、两者都可以用来推断总体指标2、普查是一种( ABE) A、专门组织的调查 B、一次性调查 C、经常性调查 D、非全面调查 E、全面调查3、在工业企业设备普查中(BDE ) A、工业企业是调查对象 B、工业企业的全部设备是调查对象 C、每台设备是填报单位 D、每台设备是调查单位 E、每个工业企业是填报单位4、我国第四次人口普查的标准时间是1990年7月1日零时, 下列情况应统计人口数的有 (BDE ) A、1990年7月2日出生的婴儿 B、1990年6月29日出生的婴儿 C、1990年6月29日晚死亡的人 D、1990年7月1日1时死亡的人 E、1990年6月26出生,7月1日6时死亡的的婴儿5、下列调查属于非全面调查的有( BCD) A普查 B重点调查 C典型调查 D抽样调查 E统计报表6、对某地区高校进行办学质量评估,则该地区每一所高校属于(BC) A调查对象 B调查单位 C填报单位 D典型单位 E重点单位第三章 数据整理和描述数据整理一、判断题:1、统计分组的关键问题是确定组距和组数。(× )2、某企业职工按文化程度分组形成的分配数列是一个单项式分布数列。( ×)3、连续型变量和离散型变量在进行组距式分组时,均可采用相邻组组距重叠的方法确定组限。(√ )4、对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所以这种分组会使资料的真实性受到损害。(√ )5、统计分组以后,掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。(√ )6、离散型变量既可以编制单项变量数列,也可以编制组距变量数列;连续型变量只能编制组距变量数列,且相邻组的组限必须重叠。( √)7、按品质标志分组所形成的次数分布数列就是变量数列。( ×)二、单选题:1、在组距分组时,对于连续型变量,相邻两组的组限( A)。 A、必须是重叠的 B、必须是间断的 C、可以是重叠的,也可以是间断的 D、必须取整数2、有一个学生考试成绩为70分,在统计分组中,这个变量值应归入( B)。 A、60---70分这一组 B、70---80分这一组 C、60-70或70-80两组都可以 D、作为上限的那一组3、 某主管局将下属企业先按轻、重工业分类,再按企业规模分组,这样的分组属于(B )。 A、简单分组 B、复合分组 C、分析分组 D、结构分组4、 划分连续变量的组限时,相邻组的组限必须(A )。 A、重叠 B、相近 C、不等 D、间断5、在等距数列中,组距的大小与组数的多少成(C )。A、正比 B、等比 C、反比 D、不成比例6、有12名工人分别看管机器台数资料如下:2、5、4、4、3、4、3、4、4、2、2、4,按以上资料编制变量数列,应采用( A)。A、单项式分组 B、等距分组 C、不等距分组 D、以上几种分组均可三、多选题:1.统计分组( ACD)。A、是一种统计方法 B、对总体而言是“合” C、对总体而言是“分”D、对个体而言是“合” E、对个体而言是“分”2、在组距数列中,组中值(ABE ) A、上限和下限之间的中点数值 B、用来代表各组标志值的平均水平 C、在开放式分组中无法确定 D、就是组平均数 E、在开放式分组中,可以参照相邻组的组距来确定3、分布数列的两个组成要素为(CD )。A、品质标志 B、数量标志 C、各组名称 D、次数 E、分组标志。4、根据分组标志性质不同,分布数列可分为(CD )。A、等距数列 B、异距数列 C、品质数列 D、变量数列 E、次数与频率。5、下列数列属于(BCDE )按生产计划完成程度分组(%) 企业数(个)80─90 1590─100 30100─110 5合计 50A、品质分布数列 B、变量分布数列 C、组距式变量分布数列 D、等距变量分布数列 E、次数分布数列数据描述——总量指标和相对指标一、判断题:1、统计资料显示,× ×年全国净增加人口1320万人,这是时点指标。( × )2、我国耕地面积占世界的7%,养活占世界人口总数22%的人口,这两个指标都是结构相对指标。(√ )3、全国粮食总产量与全国人口对比计算的人均粮食产量是平均指标。( ×)4、某年甲、乙两地社会商品零售额之比为1:3,这是一个比例相对指标。( ×)5、某企业生产某种产品的单位成本,计划在上年的基础上降低2%,实际降低了3%,则该企业差一个百分点,没有完成计划任务。(× )6、同一总体的一部分数值与另一部分数值对比得到的相对指标是比较相对指标。(× )二、单选题:1、一工厂2004年10月份产值30万元,10月底半成品库存额25万元,这两个指标( C)。 A、均为时期指标 B、均为时点指标 C、前者为时期指标,后者为时点指标 D、前者为时点指标,后者为时期指标2、某厂1996年完成产值2000万元,1997年计划增长10%,实际完成2310万元,超额完成计划(B )。 A、5% B、5% C、5% D、5%3、反映不同总体中同类指标对比的相对指标是(B )。 A、结构相对指标 B、比较相对指标 C、强度相对指标 D、计划完成程度相对指标4、下列相对数中,属于不同时期对比的指标有( B)。 A、结构相对数 B、动态相对数 C、比较相对数 D、强度相对数5、总量指标按照其反映的内容不同,分为(A )A总体单位总量和总体标志总量 B时期指标和时点指标C实物指标、价值指标和劳动量指标 D平均指标和相对指标6、下列指标中,属于相对数的是(C )A某企业的工人劳动生产率 B某种商品的平均价格C某地区的人均粮食产量 D某公司职工的平均工资三、多选题:1、下列统计指标属于时点指标的有( ACE) A、某地区人口数 B、某地区人口死亡数 C、某城市在校学生数 D、某农场每年拖拉机台数 E、某工厂月末在册职工人数2、下列属于时期指标的有(BCD ) A职工人数 B大学生毕业人数 C婴儿出生数 D固定资产折旧额3、相对指标中,分子和分母有可能互换的有(BCE ) A计划完成百分比 B比例相对数 C强度相对数 D比较相对数4、下列指标中的结构相对指标是(ACD ) A、国有制企业职工占总数的比重 B、某工业产品产量比上年增长的百分比 C、大学生占全部学生的比重 D、中间投入占总产出的比重 E、某年人均消费额5、下列指标属于相对指标的是( BDE) A、某地区平均每人生活费245元 B、某地区人口出生率3% C、某地区粮食总产量4000万吨 D、某产品产量计划完成程度为113% E、某地区人口自然增长率5‰数据描述——平均指标和变异指标一、单选题:1、某公司下属五个企业,共有2000名工人。已知每个企业某月产值计划完成百分比和实际产值,要计算该公司月平均产值计划完成程度,采用加权调和平均数的方法计算,其权数是(B )。 A、计划产值 B、实际产值 C、工人数 D、企业数 2、 加权算术平均数计算公式 的权数是(C )。 A、f B、∑f C、f/∑f D、X3、权数对算术平均数的影响作用,实质上取决于(A )。 A、作为权数的各组单位数占总体单位数比重的大小 B、各组标志值占总体标志总量比重的大小 C、标志值本身的大小 D、标志值数量的多少4、比较两个不同水平数列总体标志的变异程度,必须利用(B )。 A、标准差 B、标志变动系数 C、平均差 D、全距5、用标准差比较分析两个同类总体平均指标的代表性的前提条件是(B )。 A、两个总体的标准差应相等 B、两个总体的平均数应相等 C、两个总体的单位数应相等 D、两个总体的离差之和应相等6、甲、乙两数列的平均数分别为100和5,它们的标准差为8和7,则(A )。 A、甲数列平均数的代表性高于乙数列 B、乙数列平均数的代表性高于甲数列 A、两数列平均数的代表性相同 B、两数列平均数的代表性无法比较7、若某一变量数列中,有变量值为零,则不适宜计算的平均指标是(B) A算数平均数 B调和平均数 C中位数 D众数二、多选题:1、平均数的种类有(ABCDE ) A、算术平均数 B、众数 C、中位数 D、调和平均数 E、几何平均数2、影响加权算术平均数的因素有( AB) A、各组频率或频数 B、各组标志值的大小 C、各组组距的大小 D、各组组数的多少 E、各组组限的大小 3、在下列条件下,加权算术平均数等于简单算术平均数( ADE) A、各组次数相等 B、各组变量值不等 C、变量数列为组距数列 D、各组次数都为1 E、各组次数占总次数的比重相等4、可以衡量变量离散程度的指标有( ABCD) A全距 B平均差 C标准差 D标准差系数5、位置平均数有(CD ) A算数平均数 B调和平均数 C中位数 D众数6、受极端值影响较大的平均指标有(ABC ) A算术平均数 B调和平均数 C几何平均数 D众数第五至七章 抽样推断一、判断题:1、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免地会产生误差,这种误差的大小是不能进行控制的。(×)2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。(×)3、在抽样推断中,作为推断的总体和作为观察对象的样本都是确定的、唯一的。(×)4、抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。(√)5、在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。(×)6、抽样平均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于抽样平均误差,也可能小于抽样平均误差。(×)二、单选题:1、抽样误差是指( C)。A在调查过程中由于观察、测量等差错所引起的误差B在调查中违反随机原则出现的系统误差C随机抽样而产生的代表性误差D人为原因所造成的误差2、在一定的抽样平均误差条件下( A )。A扩大极限误差范围,可以提高推断的可靠程度B扩大极限误差范围,会降低推断的可靠程度C缩小极限误差范围,可以提高推断的可靠程度D缩小极限误差范围,不改变推断的可靠程度3、反映样本指标与总体指标之间的平均误差程度的指标是(C )。A抽样误差系数 B概率度C抽样平均误差 D抽样极限误差4、抽样平均误差是( C )。A全及总体的标准差 B样本的标准差C抽样指标的标准差 D抽样误差的平均差5、抽样平均误差说明抽样指标与总体指标之间的( B )。A实际误差 B平均误差 C实际误差的平方 D允许误差6、总体均值和样本均值之间的关系是( A )。A总体均值是确定值,样本均值是随机变量 B总体均值是随机变量,样本均值是确定值C两者都是随机变量 D两者都是确定值7、所谓大样本是指样本单位数( B )。A.30个 B.大于等于30个C.大于等于50个 D.50个8、样本容量是指( B )。A.样本的个数 B.样本中所包含的单位数C.样本的大小 D.总体单位数第八章 相关与回归分析一、判断题:1、正相关是指两个变量之间的变化方向都是上升的趋势,而负相关是指两个变量之间的变化方向都是下降的趋势。(×)2、函数关系是一种完全的相关关系。(√) 3、已知两变量直线回归方程为:Y^=-25+61x,则可断定这两个变量之间一定存在正相关关系。(√)4、相关系数的数值越大,说明相关程度越高;同理,相关系数的数值越小,说明相关程度越低。(×)5、不具有因果关系的两个变量之间,一定不存在相关关系。(×)二、单选题:1、当相关系数r=O时,说明(C )。 A、现象之间相关程度较小 B、现象之间完全相关 C、现象之间无直线相关 D、现象之间完全无关2、 若两个变量之间的线性相关程度是高的,则计算出的相关系数应接近( C ) A、 0 B、 5 C、 -1或+1 D、 25、下列各组列出为同一个问题的回归方程和相关系数,哪一组肯定是错误的(C) A、y=50+3x,r=8; B、y=-75+13x, r=91; C、y=5-6x, r=78; D、y=-130+5x, r=966、下列现象中,相关密切程度高的是(D )A、 商品销售量与商品销售额之间的相关系数为90B、商品销售额与商业利润率之间的相关系数为60C、商品销售额与流通费用率之间的相关系数为-85D、商业利润率与流通费用率之间的相关系数为-957、回归方程 ^Y=a+bx 中的回归系数 b 说明自变量变动一个单位时, 因变量( B) A、变动b个单位 B、平均变动b个单位C、变动a+b个单位 D、变动1/b个单位第九章 时间序列分析一、判断题:1、发展水平就是动态数列中的每一项具体指标数值,它只能表现为绝对数。(×)2、若将1990-1995年末国有企业固定资产净值按时间先后顺序排列,此种动态数列称为时点数列。(√)3、定基发展速度等于相应各个环比发展速度的连乘积,所以定基增长速度也等于相应各个环比增长速度的连乘积。(×)4、发展速度是以相对数形式表示的速度分析指标,增长量是以绝对数形式表示的速度分析指标。(×)5、定基发展速度和环比发展速度之间的关系是两个相邻时期的定基发展速度之积等于相应的环比发展速度。(×)6、平均增长速度不是根据各个增长速度直接来求得,而是根据平均发展速度计算的。(√)二、单选题:3、某企业的职工工资水平比上年提高5%,职工人数增加2%,则企业工资总额增长(B )。A 10% B 1% C 7% D 11%解释:工资总额指数=工资水平指数*职工人数指数 所以,工资总额指数=(1+5%)*(1+2%)=1%4、间隔相等的间断时点数列计算序时平均数应采用(D )。A几何平均法 B加权算术平均法 C简单算术平均法 D首末折半法5、定基发展速度和环比发展速度的关系是( A )。A两个相邻时期的定基发展速度之商等于相应的环比发展速度B两个相邻时期的定基发展速度之差等于相应的环比发展速度C两个相邻时期的定基发展速度之和等于相应的环比发展速度D两个相邻时期的定基发展速度之积等于相应的环比发展速度6、下列数列中哪一个属于动态数列(D )。A学生按学习成绩分组形成的数列B工业企业按地区分组形成的数列C职工按工资水平高低排列形成的数列D出口额按时间先后顺序排列形成的数列7、说明现象在较长时期内发展的总速度的指标是( C )。A环比发展速度 B平均发展速度 C定基发展速度 D定基增长速度8、已知各期环比增长速度为2%、5%、8%和7%,则相应的定基增长速度的计算方法为( A )。A(102%×105%×108%×107%)-100%B 102%×105%×108%×107%C 2%×5%×8%×7%D(2%×5%×8%×7%)-100%9、平均发展速度是( C )。A定基发展速度的算术平均数 B环比发展速度的算术平均数C环比发展速度的几何平均数 D增长速度加上100%10、以1960年为基期,1993年为报告期,计算某现象的平均发展速度应开(A )。A 33次方 B 32次方 C 31次方 D 30次方11、假定某产品产量2009年比2001年增加28%,那2001年-2009年的平均发展速度为(D )。A. B. C. D. 三、多选题:4、定基发展速度和环比发展速度的关系是( ABD )。A两者都属于速度指标B环比发展速度的连乘积等于定基发展速度C定基发展速度的连乘积等于环比发展速度D相邻两个定基发展速度之商等于相应的环比发展速度E相邻两个环比发展速度之商等于相应的定基发展速度5、累积增长量与逐期增长量( ABD )。A前者基期水平不变,后者基期水平总在变动B二者存在关系式:逐期增长量之和=累积增长量C相邻的两个逐期增长量之差等于相应的累积增长量D根据这两个增长量都可以计算较长时期内的平均每期增长量E这两个增长量都属于速度分析指标6、下列哪些属于序时平均数( ABDE )。A一季度平均每月的职工人数 B某产品产量某年各月的平均增长量C某企业职工第四季度人均产值 D某商场职工某年月平均人均销售额E某地区进几年出口商品贸易额平均增长速度第十章 统计指数一、单选题:2、销售价格综合指数 表示( C )。A综合反映多种商品销售量变动程度 B综合反映多种商品销售额变动程度C报告期销售的商品,其价格综合变动的程度D基期销售的商品,其价格综合变动程度3、编制数量指标指数,用(C)作为同度量因素。A基期的数量指标 B报告期的数量指标C基期的质量指标 D报告期的质量指标二、多选题:1、下列属于质量指标指数的是( CDE )。 A商品零售量指数 B商品零售额指数 C商品零售价格指数 D职工劳动生产率指数 E销售商品计划完成程度指数2、下列属于数量指标指数的有( ACD )。 A工业总产值指数 B劳动生产率指数 C职工人数指数 D产品总成本指数 E产品单位成本指数
学生信息管理系统开题报告的格式(通用)由于开题报告是用文字体现的论文总构想,因而篇幅不必过大,但要把计划研究的课题、如何研究、理论适用等主要问题说清楚,应包含两个部分:总述、提纲。 1 总述开题报告的总述部分应首先提出选题,并简明扼要地说明该选题的目的、目前相关课题研究情况、理论适用、研究方法、必要的数据等等。2 提纲开题报告包含的论文提纲可以是粗线条的,是一个研究构想的基本框架。可采用整句式或整段式提纲形式。在开题阶段,提纲的目的是让人清楚论文的基本框架,没有必要像论文目录那样详细。3 参考文献开题报告中应包括相关参考文献的目录4 要求开题报告应有封面页,总页数应不少于4页。版面格式应符合以下规定。开 题 报 告 学 生: 一、 选题意义 1、 理论意义 2、 现实意义 二、 论文综述 1、 理论的渊源及演进过程 2、 国外有关研究的综述 3、 国内研究的综述 4、 本人对以上综述的评价 三、 论文提纲 前言、 一、1、2、3、�6�1�6�1�6�1 �6�1�6�1�6�1二、1、2、3、�6�1�6�1�6�1 �6�1�6�1�6�1三、1、2、3、结论 四、论文写作进度安排 毕业论文开题报告提纲一、开题报告封面:论文题目、系别、专业、年级、姓名、导师二、目的意义和国内外研究概况三、论文的理论依据、研究方法、研究内容四、研究条件和可能存在的问题五、预期的结果六、进度安排
譬如自一组数据中,可以摘要并且描述这份数据的集中和离散情形,这个用法称作为描述统计学。另外,观察者以数据的形态,创建出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。数理统计学则是讨论背后的理论基础的学科。拓展资料:统计学是在数据分析的基础上,研究测定、收集、整理、归纳和分析反映数据数据,以便给出正确消息的科学。这一门学科自17世纪中叶产生并逐步发展起来,它广泛地应用在各门学科,从自然科学、社会科学到人文学科,甚至被用于工商业及政府的情报决策。随着大数据(Big Data)时代来临,统计的面貌也逐渐改变,与信息、计算等领域密切结合,是数据科学(Data Science)中的重要主轴之一。
统计一词有三方而含义:(1)统计工作。指搜集、整理和分析客观事物总体数量方面资料的工作过程,是统计的基础。(2)统计资料。统计工作所取得的各项数字资料及有关文字资料,一般反映在统计表、统计图、统计手册、统计年鉴、统计资料汇编和统计分析报告中。(3)统计科学。研究如何搜集、整理和分析统计资料的理论与方法。统计工作、统计资料、统计科学三者之间的关系是:统计工作的成果是统计资料,统计资料和统计科学的基础是统计工作,统计科学既是统计工作经验的理论概括,又是指导统计工作的原理、原则和方法。
统计工作,即统计实践,是指根据科学的方法从事统计,搜集,整理,分析研究和提供各种统计资料及统计咨询意见的活动总称,其成果是统计资料。统计资料,是统计工作活动过程中所获得的各种有关数字以及与之相联系的其他资料的总称。统计学,即统计理论,是一门收集,整理和分析统计数据的方法科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。