第四章统计学.docx
- 文档编号:26456362
- 上传时间:2023-06-19
- 格式:DOCX
- 页数:8
- 大小:24.19KB
第四章统计学.docx
《第四章统计学.docx》由会员分享,可在线阅读,更多相关《第四章统计学.docx(8页珍藏版)》请在冰豆网上搜索。
第四章统计学
第四章
第一节统计整理
一、统计整理的意义
统计整理是根据统计研究任务的要求,对调查所搜查的原始资料进行分组、汇总,使其条理化、系统化的工作过程。
统计整理实现了从个别单位的标志值向说明总体数量特征的指标值过渡,是人们对社会经济现象从感性认识上升到理性认识的过渡阶段,为统计分析提供基础。
二、统计整理的步骤
a、设计和编制统计资料整理方案
b、对原始资料进行审核
c、对原始资料进行统计分组和统计汇总
d、编制统计表或绘制统计图
第二节统计分组
一、统计分组的概念
统计分组是根据所研究事物的特点和统计研究的目的,按照某一标志将统计总体划分为若干个组成的一种统计方法。
二、统计分组的作用
a、揭露社会经济现象的类型,反映各类型的特点
b、反应现象总体的内部结构
c、分析现象之间的互相依存关系
表:
(一)类型分析
1999~2002年我国农林牧渔业总产值单位:
亿元
类型
1999
2000
2001
2002
农业
14106.2
13873.6
14462.8
14931.5
林业
886.3
936.5
938.8
1033.5
牧业
6997.6
7393.1
7963.1
8454.6
渔业
2539.0
2712.6
2815.0
2971.1
合计
24519.1
24915.8
26179.6
27390.8
(二)结构分组“九五”期间我国国内生产总值构成(%)
年份
1996
1997
1998
1999
2000
第一产业
20.4
19.1
18.6
17.6
15.9
第二产业
49.5
50.0
49.3
49.4
50.9
第三产业
30.1
30.9
32.1
33.0
33.2
合计
100.0
100.0
100.0
100.0
100.0
(三)分析分组
某乡某种农作物的耕作深度与收获率的关系
耕作深度分组(cm)
地块数
平均收获率
10~12
7
400
12~14
10
460
14~16
16
540
15~18
12
620
18~20
5
680
三、统计分组的方法
a、正确选择分组标志
1、根据统计研究的目的选择分组标志
2、选择最能反映事物本质特征的标志进行分组
3、选择分组标志时,要考虑到现象发展的历史条件和经济条件
b、按品质标志或按数量标志分组
1、按品质标志分组
2、按数量标志分组
c、简单分组和复杂分组
1、简单分组。
简单分组是指对所研究的总体按一个标志进行分组。
2、复合分组。
复合分组是指对研究的总体按两个或两个以上的标志进行的多层次分组。
分组再分组
按家庭月收入分组(元)
户数(户)
家庭拥有电视机的台数(台)
1000以下
500
200
1000~2000
400
100
2000~3000
300
290
3000~4000
45
50
4000以上
5
10
按家庭月收入分组(元)
户数(户)
1000以下
500
1000~3000
600
3000~4000
745
4000以上
5
四、统计分组的几个基本概念
a、组数:
是指将全体变量值分成多少组
b、单项分组与组距分组
1、单项分组:
在按数量标志分组时,将每一个变量值作为一组
2、组距分组:
将所有的变量值依次划分为几个区间,一个区间内的所有变量值归为一组,这样的分组成为组距分组。
c、组距:
指分组条件下每组变量值的变化范围,即每组变量
区间的距离。
d、等距分组与不等距分组
1、等距分组,指各组组距相等,凡是在变量变动比较均匀的条件下,可以采用等距分组。
列如:
身高,体重,零件尺寸的误差分组等。
2、不等距分组,指各组组距不相等的分组。
当变量值变动很不均匀时,常采用不等距分组。
不等距分组中,多数情况是根据事物性质变化的数量界限来确定组距。
如对少年儿童年龄的分组,必须注意到不同年龄生理变化的特定。
e、组限:
组限是指各组变量值变动的两端界限,是每组的起点和组点、每组的起点成为下限,每组的终点成为上限。
凡遇到某总值单位的变量值刚好等于相邻两组上下限时,一般把比值归并到作为下限的那一组,这成为“上限不在内”的原则。
f、开口式分组与闭口式分组
1、开口式分组:
在组距式分组中,凡具有“以上”(上开口组)或“以下”(下开口组)的分组。
2、闭口式分组:
没有“以上”和“以下”的分组。
g、组中值:
指各组上限和下限的中点数值。
其计算公式为:
组中值=(上限+下限)/2
开口组的组中值计算公式如下:
1、下开口组组中值=上限-相邻组组距的一半
2、上开口组组中值=下限+相邻组组距的一半
五、注意
1、对于连续变量分组,相邻组的上限与下限必须重叠
对于正指标,采用“上限不在内”原则(一般)
对于逆指标,采用“下限不在内”原则
2、对于离散变量分组,相邻组的上限和下限必须间隔。
第三节次数分布
一、次数分布的概念
次数分布是指将总体中的所有单位按某个标志分组后,所形成的总体数在各组之间的分布。
分布在各组的总体单位数叫做次数或频数。
分类:
a、根据分组标志特征不同,次数分布数列可以分为品质分布数列和变量分布数列。
b、按品质标志分组形成的次数分布数列叫品质分布数列,简称品质数列。
c、按数量标志分组形成的次数分布数列叫变量分布数列,简称变量数列。
二、变量数列的种类
a、单项变量数列
单项数列是按数量标志分组后,用一个变量值代表一个组形成的数列。
b、组距变量数列
组距变量数列是按照数量标志分组后,用变量值变动的一定范围(即组距)代表一个组所形成的数列。
三、变量数列的编制
a、将原始资料按数值大小依次排列
b、确定组数(k)和组距(i)
k=1+3.322logn
i=R/k
上述公式成为斯德吉斯组数公式。
公式中,n为数据个数,R为全距。
定组距和组数应考虑下列原则:
1、要尽可能反映出总体单位的分布情况及总体单位的集中趋势
2、要尽可能区分出组与组性质上的差异
c、确定组限和组限的表示方法
1、最小组的下限要略低于最小变量值,最大组的上限要略高于最大变量值。
2、组限的确定应当有利于表现总体单位分布的规律性
3、对于等距数列,如果组距是5,10,…,100,…,则每组的下限最好是它们的倍数。
四、次数分布的表示方法
a、表示法
——即用统计表来表示次数分布
b、图示法
——即用统计图来表示次数分布
①直方图②折线图③曲线图
曲线图是组数趋向于无限多是折线图的极限描绘,是一种理论实践。
五、次数分布的主要类型
a、钟形分布
b、U型分布
c、J型分布
第四节统计汇总的组织、技术与现代化
一、统计汇总的组织形式
a、逐级汇总
b、集中汇总
c、综合汇总
二、统计汇总的审核
三、统计汇总的技术与现代化
a、手工汇总法
1、划记法
2、过录法
3、折叠法
4、卡片法
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 统计学