|
马上注册,所有资料全部下载!
您需要 登录 才可以下载或查看,没有账号?立即注册
×
第三章 统计整理
学习重点:本章主要讲授统计资料的整理的方法及技术和统计表。难点讲授统计资料的整理技术。
第一节 统计资料整理的意义和程序
一、统计资料整理的概念和意义
统计资料整理是根据统计研究的任务与要求,对调查得来的各种原始资料,进行科学的整理与加工,使之系统化,从而得出反映总体特征的综合资料,包括系统地积累资料与为研究特定问题对资料的再加工。
统计调查取得的原始资料是分散的、杂乱的、不系统的,只能表明各个被调查单位的具体情况,反映事物的表面现象或一个侧面,不能说明事物的全貌、总体情况。因此,只有对这些资料进行加工整理才能认识事物的总体及其内部联系。
统计资料整理,是统计调查的继续,也是统计分析的前提,在整个统计工作中具有承前启后的作用。
二、统计资料整理的步骤
统计资料整理是一项细致周密的工作,需要有计划、有组织的进行,因此,进行统计资料整理必须按以下步骤进行。
1.设计和编制统计资料的汇总方案。
2.对原始资料进行审核。
为了保证统计资料的质量,在统计资料进行整理前,应该对统计调查材料的准确性、及时性、完整性进行严格的审核,看它们是否达到准确、及时、完整,若发现问题及时纠正。汇总后须对其结果进行逻辑检查和技术性检查。
3.用一定的组织形式和方法对原始资料进行分组、汇总和计算。
主要根据汇总的要求和工作条件选择适当的汇总组织形式和具体方法对原始资料进行整理、加工,以达到我们的目的。
4.对整理好的资料再一次进行审核,改正在汇总过程中所发生的各种差错。
5.编制统计表,以简明扼要地表达社会经济现象在数量方面的有关联系。
6.统计资料的保管与积累。
第二节 统 计 分 组
一、统计分组的概念
统计分组是根据统计研究的需要,按照一定的标志将总体区分为若干个性质不同而又有联系的组成部分的一种统计方法。这些组成部分称为这一统计总体的“组”。
统计分组对总体而言是“分”,即把统计总体划分为一定意义上的性质相异的若干个组;对个体而言是“合” 即把一定意义上的性质相同的个体组合成一组。其分组原则是,保证组间各单位具有差异性,组内各单位具有同质性。对统计总体进行分组,是由统计总体中各个总体单位所具有的“差异性”特征所决定的,总体的变异性是统计分组的客观依据。统计分组是把总体划分为一个个性质
不同的范围更小的总体。例如,对全国总人口这一总体,根据研究的需要可以按性别等不同的标志进行分组。按照每一个标志分组的结果都把总人口划分成了两个组成部分。如表3-1所示。
通过分组,将性质相同的各单位结合在一起,将性质相异的各单位分开,区分了事物之间质的差异,并能据此从数量上揭示事物的内部联系,从而反映出我国人口的差异与特征,满足其研究问题的需要。
二、统计分组的作用
统计分组是统计整理的主要方法,统计分组的作用主要有以下三方面:
(一)、划分社会经济现象的类型。
统计分组的根本作用在于区分现象的质。经济现象千差万别,性质各异,任何一批数据都存在着差异,在进行统计分组之前,这种差异处于无序状态,显现不出来,通过统计分组,反映出了统计总体的基本性质和特征。分组实际上就是按差异的大小进行分类,差异小的归人一组,差异大的归人不同的组。因此,统计分组的结果使组内的差异缩小,而组与组之间的差异扩大。所以说,统计分组的过程就是区别事物性质的过程。要了解各种社会经济现象的性质、特点及其相互关系,必须按某种标志把它们划分为性质不同的部分。 例如,国民经济按行业分组,可以划分为20个行业门类:
(1)农、林、牧、渔业;<2)采矿业;(3)制造业;(4)电力、燃气及水的生产和供应业;(5)建筑业;(6)交通、运输、仓储及邮政业;(7)信息传输、计算机服务和软件业;(8)批发和零售业;(9)住宿和餐饮业;(10)金融业;(11)房地产业;(12)租赁和商务服务业;(13)科学研究、技术服务和地质勘探业;<14)水利、环境和公共设施管理;(15)居民服务和其他服务业;(16)教育;(17)卫生、社会保障和社会福利业;(18)文化、体育和娱乐业;(19)公共管理和社会组织;(20)国际组织。通过分类,可以反映我国各行业的发展,为进一步研究其水平与结构提供了便利
条件。又如,产业可以划分为第一产业、第二产业、第三产业;经济类型可以划分为国有、集体、民营、合营、个体、外资、中外合资等多种类型;表3-2列示了我国2004年三次产业增加值基本情况。
表3-2 我国2004年三次产业增加值
(二)、反映现象的内部结构
统计往往对总体按某一标志进行分组,并计算总体内各组成部分占全体的比重,以说明各个组成部分在总体中的分布状况,反映现象的内部结构和结构变化,从而揭示现象的性质和发展变化的规律。
例如,表3-3所列是我国人口就业结构的变化情况,能基本说明我国三次产业人口就业结构的变化,反映了我国产业结构调整的进程。如果将这一结构与其他
国家相比较,还可以显示我国劳动力的就业特点。
表3-3 我国人口就业结构变化情况 (%)
资料来源:《中国统计摘要》,中国统计出版社,2004
(三)、分析现象之间的依存关系
社会经济现象不是孤立存在的,各现象之间存在广泛的联系和制约关系,一种现象的变化常是另一种现象变化的原因或结果。通过统计分组,可以揭示现象之间的依存关系。例如,施肥量与农作物产量之间、工人劳动生产率和产品成本之间、商品销售额与流通费用率之间,这些方面的依存关系,都可以利用分组法说明影响因素对结果因素的作用程度。表3-4列示的即为某地区粮食单位面积产量与施肥量的关系。
表3-4 施肥量与农作物产量关系资料单位:公斤/公顷
表3-4中按化肥施用量分组,再计算各组的粮食单位面积产量,可以反映粮食产量与化肥施用量之间的依存关系。随着化肥施用量的增加,单位面积粮食产量也随之增加。
统计分组是一切统计研究的基础,应用于统计工作的全过程,是统计研究的基本方法之一。
三、分组标志的选择
分组标志,即将同质总体区分为不同组的标准或依据。分组标志一旦选定,就必然突出了总体在该标志下的性质差别,而掩盖了总体在其他标志下的不同。即对同一总体按不同标志进行分组会得到不同的分组结果甚至相反的结论。分组标志选择不当,不但无法显示现象的根本特征,甚至会混淆事物的性质,歪曲社会经济的真实情况。因此,分组标志的选择是统计分组的核心问题。为了达到统计分组的目的,在进行统计分组时要遵循以下原则:
(一)、根据统计研究的目的选择分组标志
正确选择分组标志是统计分组的关键。分组标志的选择是统计分组的核心。分组标志选择得恰当与否,直接影响到分组的科学性。如要研究总体哪一方面的特征,就应该选择反映该特征的标志作为分组标志。统计总体中的个体有许多标志,选择什么标志作为分组标志,要根据统计研究的目的来确定。例如,要了解某单位职工的学历状况,就应选择“文化程度”为分组标志;要了解学生的学习情况,要以“成绩”为分组标志,而不能用“性别”、“年龄”、“收入”为分组标志,因为这些内容与要了解的内容无关。
因此,根据研究目的,正确选择分组标志是保证统计分组具有科学性的关键,是保证统计研究获得正确结论的前提。
(二)、要选择最能够反映现象本质的标志作为分组标志。
明确了统计研究的目的,还不等于能够选择好分组标志。因为说明同一问题可能有若干个相关标志,在进行分组时,应选择最能反映事物本质特征的标志。
例如,研究城镇居民家庭生活水平状况,而反映居民家庭生活水平的标志有:家庭人口数、就业人口数、每一就业者负担人数(含本人)、家庭年收人、平均每人年收人等。其中最能反映居民家庭生活水平状况的标志是“平均每人年收入”,所以应选择这一标志作为分组标志。
请思考:反映企业规模的标志有许多,如企业职工人数、企业固定资产和生产能力等,请问谁是划分企业规模大小的最具有本质特征的标志?
(三)、要考虑现象所处的历史条件和经济状况以及标志内涵的变化来选择分组标志。
社会经济现象随着时间、地点、条件的变化而发生变化,其标志的内涵也会发生变化。同一分组,在过去适用,现在就不一定适用;在这一场合适用,在另一场合就不一定适用。
例如,在计划经济时期,企业按所有制形式分组一般是分为四组,全民所有制企业、集体所有制企业、私营企业和其他企业。而现在按企业登记注册类型可分为:(1)国有企业;(2)集体企业;(3)股份合作制企业;(4)联营企业;(5)有限责任公司;(6)股份有限公司;(7)私营企业;(8)港澳台商投资企业;(9)外商投资企业;(10)个体企业等类型。又如,对最低生活水平的确定,就不能沿用20世纪五六十年代的标准,而应根据目前的生活水平状况制定标准,然后再进行分组。此外,行业的划分,也发生了很大变化。
结合研究对象所处的历史条件、经济条件选择分组标志,这样可以保证分组标志在不同时间、不同场合的适用性。
请思考:所有的标志都有可能成为分组标志吗?
四、统计分组的方法
分组标志确定之后,还必须在分组标志变异范围内,划定各相邻组间的性质界限和数量界限。根据分组标志的不同特征,统计总体可以按品质标志分组,也可以按数量标志分组。
(一)、按品质标志分组
按品质标志分组是指选择反映事物属性差异的品质标志作为分组标志进行分组。按品质标志分组能直接反映事物间质的差别,给人以明确、具体的概念。因为事物的属性差异是客观存在的,有些品质标志分组,由于界限清晰,分组标志有几种具体表现,就分成几组。例如,人口按性别、民族、职业、文化程度等分组,企业总体按所有制分为国有、集体、联营、股份合作、其他等组。有些品质标志分组有时也很复杂,其相邻组之间的界限不容易划清。有些在理论上容易区分,但在实际社会经济生活中却难于辨别。例如,人口按城乡分组,居民一般分为城市和乡村两组,但因目前还存在有些既具备城市形态又具备乡村形态的地区,分组时就需慎重考虑。其他如部门分类、职业分类也都存在同样的问题。因此,在实际工作中,为了便利和统一,联合国及各个国家都制订有适合一般情况的标准分类目录,如我国就有《国民经济行业分类目录》、《工业部门分类目录》、《商品目录》等等。
(二)、按数量标志分组
统计的研究对象是社会经济现象的数量方面,所以,按数量标志分组是我们研究的重点。按数量标志分组是指选择反映事物数量差异的数量标志作为分组标志进行分组。如企业按工人数、产值、产量等标志进行分组;居民家庭按子女人数分组,可分为0人(无子女)、1人、2人,3人,等等。按数量标志分组的目的,并不是单纯确定各组在数量上的差别,而是要通过数量上的变化来区分各组的不同类型和性质。因此,按数量标志分组,应根据事物内在特点和统计研究的要求,先确定总体在某数量标志的特征下有几种性质不同的组成部分,再研究确定各组成部分之间的数量界限。例如,人口按年龄分组,男性分为0--6岁、7--17岁、18--59岁、60岁以上;女性分为0-6岁、7--17岁、18--54岁、55岁以上。这是由于国家对男女职工规定退休年龄的不同而有所差别。因此,正确选择决定事物性质差别的数量界限是按数量标志分组中的一个关键问题。现有某校50名教职工2004年月基本工资额(元)资料如下:
417 341 452 338 344 354 266 230 456 258
337 414 375 466 416 504 392 359 440 232
414 466 335 484 310 417 546 283 515 390
380 377 462 371 341 325 292 279 278 304
349 347 410 417 417 292 358 351 330 489
把这些数据按基本工资额分组,如表3-5所示:
五、统计分组的形式
统计分组按分组标志的多少及其排列形式可分为简单分组、平行分组体系和复合分组体系。在现实经济生活中,这三种形式都有广泛的应用价值。
(一)、简单分组
简单分组就是对被研究现象总体仅按一个标志所进行的分组。这种分组比较简单,它只能说明社会经济现象某一方面的状况。例如,人口按性别或年龄分组、企业按所有制或规模大小进行分组等。
(二)、分组体系
在统计整理中,为了全面认识被研究现象总体,常常需要运用多个分组标 志对总体进行分组,形成一系列相互联系、相互补充的分组体系。例如,对国民经济总体进行统计研究,必须通过按经济类型、部门、产业、地区、管理系统等多种分组,形成国民经济分组体系。在我们所要研究现象总体中,总是可以选择一系列标志进行分组,所以分组体系是客观存在的,组与组之间层层深人、相互联系、相互补充。
1.平行分组体系
平行分组体系就是对同一总体同时选择两个或两个以上的标志分别进行简单分组,然后并列在一起就形成了平行分组体系。例如,为了认识我国工业企业的一些基本情况,可以按所有制、轻重工业、企业规模等分组,得到如下分组体系:
平行分组体系的特点是,每一分组只能固定一个因素对差异的影响,不能固定其他因素对差异的影响。应用平行分组体系,其多种分组相互独立而不重叠,既可以从不同的角度、不同方面对某一社会经济现象做出比较全面的说明,反映事物的多种结构,又不至于使分组过于烦琐,故这种分组被广泛采用。上面的分组从多方面反映了我国企业类型的状况,给人以全面的认识。
请思考:如何理解平行分组体系中的“平行”二字?通过上例具体说明“平行”的真正含义。
2.复合分组体系
复合分组体系就是将总体按两个或两个以上的标志结合起来进行层叠分组,形成复合分组体系。具体地说,它是先按一个标志分组,再按另一个标志对已经分好的各个组进行再分组。例如,对我校学生先按专业分组,再按性别分组;工业企业先按经营组织形式分组,然后再按规模大小进行分组,见表3-7。
复合分组体系的特点是,第一次分组只固定一个因素对差异的影响,第二次分组同时固定两个因素对差异的影响,依次类推,当最后一次分组时,则所有的分组标志对差异的影响已全部被固定。复合分组体系可以更深入细致地研究总体的内部结构,反映问题全面深入。但其组数会随着分组标志的增加而成倍地增加,使各组的单位数减少,次数分布不集中 不易揭示总体的本质特征。因此复合分组体系不宜采用过多的分组标志,也不宜对较小总体进行复合分组。
请思考:1. 如何理解复合分组体系中的“层叠”二字?通过上例具体说明“层叠”的真正含义。
2. 自行确定资料,进行如下分组:按一个品质标志的简单分组、按两个品质标志的复合分组、按一个品质标志和一个数量标志的复合分组、按两个数量标志的复合分组。
第三节 次数分布
一、次数分配的概念
在统计分组的基础上,将总体中所有单位按组归类整理,形成总体中各单位数在各组间的分配称为次数分配。
分配在各组的单位数叫次数或频数。
各组次数与总次数的比率叫频率或比率。各比率之和为100或1即Σ=1。
将各组组别与次数依次排列而形成的数列叫次数分配数列,简称分配数列。
二、分配数列的编制
1.种类
①属性分配数列:
按品质标志分配而形成的数列叫属性分配数列,简称品质数列,如上例内蒙古自治区人口分布。
②变量分配数列
按数量标志分组而形成的数列叫变量分配数列,简称变量数列。
1)单项式变量分组数列
是按每个变量值分别列组而形成的数列。
2)组距式变量数列
把各变量值按照一定组距进行分组而形成的数列。如:上例某班学生统计考试成绩表。
在组距数列中,表示各组界限的变量值称为组限,50—60,60—70等。其中较小的变量值称为下限,50,60等,较大的变量值为上限,60,70等,各组上限与下限之差即为组距, 组距=上限-下限,60-50,70-60等,各组上限与下限的中点称为组中值,即组中值=(上限+下限)/2,(50+60)/2=55,(60+70)/2=65,组中值具有一定的假定性,即假定次数在各组内的分布是均匀的,代表了各组内的一般水平。
a.等距分组
各组的组距均相等。
特点:由于各组组距相等,各组次数的分布不受组距大小的影响,它和消除了组距影响,与次数密度的分布是一致的,一般呈正态分布。
次数密度=次数/组距,其作用 主要用于消除各组组距不相等而造成的现象分布的影响。
b.不等距分组
各组组距不相等。
特点:不等距分组各组的次数多少受组距不同的影响,组距大次数可能多,组距小,则次数可能少,因此必须消除组距对其分布的影响即需计算次数密度。
在编制组距式变量数列时,常常会遇到这样的情况,如:学生成绩的分布
60分以下
60—70
70—80等
又如:学生人数的分布
30人以下
30—60
60人以上等
这种具有不确定组距的组称为“开口组”,包括上开口和下开口,其组中值如何计算?
下开口的组中值=上限-1/2邻组组距
上开口的组中值=下限+下限1/2邻组组距
2.变量数列的编制
程序:①原始数据②序列化(编制由小到大简单数列)③求出组距等④分组归类合计(形成次数分布)⑤制成统计表(变量数列)
a.离散型变量
由于离散型变量各变量值之间以整数断开,变量值之间有明显的界限,上下限都可以用准确的数值表示,组限非常清楚。
如:某校按学生人数分组,其组限为:
100人以下
101—200
201—300
301—400
401人以上
b.连续型变量
由于连续型变量各变量值之间可做无限分割,有小数存在,上下限不能用两个确定的值表示,只能用前一组的上限与本组的下限为同一数值表示。如:上例考试成绩
统计实际工作中,虽然变量区分连续型变量与离散型变量,但为了计算,绘图等的方便,保证整体单位不出现重复、遗漏。可采用连续型变量的形式代替离散型变量。
对于连续型变量,在确定组限时,有一原则可循,即“上组限不在内”原则:各组只包括本组下限变量值的单位,不包括本组上限变量值的单位。
3.编制统计表
如上例40人考试成绩分为5组,组距为10,组限可以为:
50—60,60—70,…,90—100
可以使考试成绩的优、良、中、及、不及格的特征体现出来。
第四节 统计表
一、统计表的构成
统计表是用来表示经过汇总加工后的综合统计资料的一种表格形式。
从形式上看,统计表是由纵横交叉的直线组成的左右两边不封口的表格,表的上面有总标题,即表的名称,左边有横行标题,上方有纵栏标题,表内是统计数据。
(一)统计表的横向构成一般包括四个部分
1.总标题。它相当于一篇论文的总标题,表明全部统计资料的内容,一般写在表的上端正中。
2.横行标题。通常也称为统计表的主词(主栏),它是表明研究总体及其组成部分,也是统计表所要说明的对象,一般写在表的左方。
3.纵栏标题。通常也称为统计表的宾词(宾栏),它是表明总体特征的统计指标的名称,一般写在表的上方。
4.数字资料。即各横栏与纵栏的交叉处的数字(这些数是由横行与纵栏所限定的内容)。
(二)统计表的纵向构成一般有两部分:主词栏和宾词栏,主词与宾词不是固定不变的。
二、统计表的种类
(一)简单表。统计表的主词栏,未经任何分组,仅仅罗列各单位名称,或按时间顺序排列的表格。
(二)简单分组表。即表的主词栏,按某一个标志进行分组的统计表。
(三)复合分组表。按两个及两个以上标志进行分组的统计表。
三、统计表的设计
为了使统计表的设计科学、实用、简明、美观,应注意以下问题。
1.总标题要简明扼要,并能确切说明表中的内容。
2.统计表的上下两端的端线应当用粗线绘制,表中其他线条一律用细线绘制,表的左右两端习惯上均不划线,采用开口式。
3.指标数字应有计算单位。如果全表的计算单位是相同的,若用“万元”为单位,应在表的右上角注明“单位:万元”字样;如果表中同样的指标数字计算单位相同而各栏之间不同时,应在各栏标题中注明计算单位。
4.表中的横行“合计”,一般列在最后一行(或最前一行),表中纵栏的“合计”一般列在最前一栏。
5.对某些资料必须进行说明时,应在表的下面注明。
|
|