统计学以Excel为分析工具Word文档格式.docx
- 文档编号:13713343
- 上传时间:2022-10-13
- 格式:DOCX
- 页数:6
- 大小:22.62KB
统计学以Excel为分析工具Word文档格式.docx
《统计学以Excel为分析工具Word文档格式.docx》由会员分享,可在线阅读,更多相关《统计学以Excel为分析工具Word文档格式.docx(6页珍藏版)》请在冰豆网上搜索。
总量指标(绝对数)、相对指标(相对数,两个绝对数之比)、平均指标(平均数、均值)。
设计要求:
(1)要素完整
(2)指标名称必须有科学的理论依据(3)要明确统计指标的计算口径和范围(4)要有科学的计算方法
7、指标和标志:
区别:
标志是说明总体单位特性的,指标是说明总体特征的;
标志中的数量标志可以用数值表示,而品质标志不可以用数值表示。
所有的统计指标都是用数值表示。
联系:
有些统计指标的数值是在总体单位的数量标志值基础上直接汇总得到的;
在一定条件下,二者可以相互转化。
8、指标体系:
指由若干相互联系的统计指标构成的有机整体。
设计的基本要求:
(1)科学性
(2)目的性(3)全面性(4)统一性(5)可比性(6)核心性(7)可行性(8)互斥性
9、参数:
描述总体特征的概括性数字度量
10、统计量:
描述样本特征的概括性数字度量
11、数据的计量尺度由低到高分层:
(1)名类尺度(品质标志)
(2)顺序尺度(3)区间尺度(4)比尺度
12、数据类型:
(1)按计量尺度分
(2)按数据的收集方式分(3)按数据的时间关系分
13、变量:
表示现象某种特征的概念(标志、指标)。
具体表现称为变量值(统计标志的标志表现和指标数值)。
品质变量、数量(数字)变量——离散变量(取值有限)、连续变量——取值无穷
1、问卷格式:
(1)开头部分(问候语、填表说明、问卷编号)
(2)甄别部分(过滤)(3)主体部分(核心部分,问题和答案)(4)背景部分
2、问卷设计标准:
(1)能有效地用来收集数据,同时尽可能减少误差和矛盾
(2)对被调查者有友好界面(3)尽量减少由无回答所引起的追踪回访的数量,且便于数据编码和录入,从而尽量减少审核与插补工作量,最终减少收集和处理数据所花的费用和时间
3、问卷的开发程序:
(1)向数据用户对象进行咨询
(2)参考以前相同主题的问卷(3)起草问题(4)对问卷进行审议与修改(5)对问卷进行测试与修改(认知法、焦点座谈、非正式测试、向被调查者了解情况、向访员了解情况、分裂样本测试、试试点调查)(6)定稿
4、问题措辞应注意的问题:
(1)简单
(2)易懂(3)针对性(4)具体性和充分性(5)避免含糊歧义重复(6)避免诱导性问题(7)避免使用双重否定(8)减少敏感问题或隐私问题的影响(每个人法、为回答辩护技巧、即使一次技术、系列问题或热身法、设立档次)(9)确保问题读来顺口
5、问卷问题类型:
(1)开放性问题
(2)封闭式问题
数据的预处理是数据分组整理的先前步骤,内容包括数据的审核(首先)、插补、筛选、排序等
1、审核:
应用各种检查规则来辨别缺失、无效、不一致的录入。
目的:
更好地了解调查过程、调查数据,确保调查数据的完整、准确、一致。
(贯穿整个调查过程,简单初步检查——数据录入后计算机程序复杂校验,为整理分析打基础)。
直接调查取得原始数据的审核(完整性、准确性——逻辑检查和计算检查);
间接取得的二手数据的审核(适用性、时效性,加工资料时应做到适用性审核、实效性审核、确认是否必要做进一步加工处理)。
从数据的表现性质来看,数据审核内容主要有有效性审核、一致性审核、分布审核。
2、插补:
解决在审核过程中辨别出来的数据缺失无效与不一致等问题的过程。
方法分类:
随机插补;
确定插补【(差不每次都是相同的值)具体方法:
1、推理插补;
2、均值插补;
3)比率或回归插补;
4、热平台插补:
使用同一插补类中的供者记录的信息来代替一个相似的受者记录中缺失的或不一致数据的插补方法(分类:
序贯热平台插补、随机热平台插补。
优点:
可以保持数据的原始分布形式。
缺:
常导致同一个供者的多次使用,有时很难找到一个合适的供者)(为确保找到供者记录,可以用多层次热平台插补);
5、冷平台插补:
与热不同为使用前期的或普查中的供者资料;
6、最近邻插补:
与热一样基于匹配变量选择一个供者记录,但它的目的不是非要找出一个和受者记录在匹配变量上完全相同的供者记录,而是插补类中按匹配变量找到和受记录者最接近的供者记录——找到距离最近的值】
3、离群值:
一个观测值或一组观测值,它们看起来与数据集中的其他观测值不一致。
4、统计数据的筛选:
(1)将某些不符合要求的数据或有明显错误的数据予以剔除
(2)将符合某种特定条件的数据筛选出来,不符合特定条件的数据予以剔除
5、数据排序:
按一定顺序将数据排列,目的是便于研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索(定性数据、定量数据)
1、统计分组:
根据统计研究的目的和客观现象的内在特点,按一定的标志把被研究总体划分为若干个性质不同但又有联系的组。
目的是使资料系统化、科学化、条理化,从而得出能够反映事务总体特征的资料。
方法:
(1)按品质标志进行分组{属性特征}
(2)按数量标志分组{按表现总体数量特征的标志}——单项式分组(每个组变量值是一个值)、组距式分组(连续变量、离散型变量多)
2、频数分布(次数分布):
在对总体进行分组的基础上将总体中所有单位按组归类整理,形成总体各单位在各组间的分布,反映总体单位数在各组的分布状况和特征。
包括要素:
(1)组的名称
(2)组的次数或频数。
次数的相对数即各组次数与总次数之比——比率或频率(反映总体构成)。
频数分布表明总体分布特征和内部结构,并据以研究总体中某种标志的平均水平及其变动规律。
频数分布按分组标志不同分:
品质数列(品质标志)、变量数列
3、组中值=(上限值+下限值)÷
2。
使用组中值代表一组数据时有一个必要的假定条件,即各组数据在本组内呈均匀分布或在组中值两侧对称分布
4、统计图:
可以将表中的数据用图来表示,使表图文字有机结合起来,使人们一目了然地认识客观事物的状态、形成、发展趋势或在某地区上的分布状况等。
(1)条形图和柱形图
(2)饼图(3)环形图(4)直方图(5)折线图(6)散点图与气泡图
5、统计表:
把杂乱的数据有条理的组织在一张简明的表格内。
组成部分:
表头、行标题、列标题、数字资料,必要时可以再表下方附加。
设计要求科学、实用、简练、美观。
注意:
(1)合理安排结构
(2)表头一般包括表号、总标题、表中数据的单位等内容(3)表中的上下两条横线一般用粗线,中间其他线要用细线(4)使用统计表必要时可在表下方加注释,特别要注明资料来源
1、总量指标:
反映社会经济现象在一定时间、地点、条件下总规模或总水平的统计指标,它通常是用绝对数来表现的,又称为绝对指标、绝对数。
它是社会经济统计中最基本的统计综合指标。
作用:
(1)反映社会经济现象总体的基本情况
(2)是制定政策、编制计划、进行经济管理的重要依据(3)是计算相对指标和平均指标的基础。
应注意问题:
(1)现象的同质性
(2)明确总量指标的含义、范围、计算方法(3)使用统一的计量单位
2、总量指标的分类:
{1}按反映内容不同,分总体单位总量(总体中包含的总体单位总数)和总体标志总量(标志总量,总体某一数量特征的总量){2}按反映的时间状况不同,分时期指标(一段时期内发展过程的总量指标,特点:
连续计数、可加性、流量指标)和时点指标(在某一点、瞬间,特点:
间断计数、指标不能累加、存量指标){3}按其采用的计量单位不同,分实物指标(实物单位:
自然单位、度量衡~、标准实物~、复合~、双重或多重~)、价值指标(货币单位)、劳动指标(劳动单位)
3、相对指标:
相对数,两个有联系的指标的比值,用以说明两个互相联系的社会经济现象之间的数量对比关系和联系程度。
用来对比的两个数,可以是绝对数、平均数和相对数。
(1)综合反映现象的互相关系、内部结构、实现的程度、强度和速度等,从而说明总量指标不能充分说明的问题
(2)可以使某些利用总量指标不能直接进行对比的社会经济现象,取得可以比较的基础。
表现形式:
有名数(强度、密度、普遍程度)和无名数(抽象化的数值,系数、倍数、成数、百分数、千分数、翻数)。
遵循原则:
可比性原则、正确选择对比基数~、多种相对指标结合运用~、相对指标与总量指标结合运用~
4、相对指标根据研究目的、任务、对不基数的不同,可分为:
(一)计划完成相对数:
计划完成百分比,某一现象在一定时间计划的完成度。
公式:
计划完成相对数=(实际完成数÷
计划完成数)×
100%。
{1}计划数为绝对数:
(1)短期计划完成情况检查:
100%;
(2)中长期计划完成程度检查:
1)水平法-计划完成相对数=计划末期(最后一年)实际达到的水平÷
计划规定期末应达到的水平×
100%,2)累计法:
计划完成相对数=计划期间实际累计完成数÷
计划期间规定的累计数×
{2}计划数为相对数:
计划完成相对数=实际达到的百分数÷
计划规定的百分数×
100%=(1±
实际提高/降低百分数)÷
(1±
计划提高/降低百分数);
{3}计划数为平均数:
计划完成相对数=实际完成的平均数÷
实际完成的平均数×
100%
(二)结构相对数-比重相对数:
内部各组成部分在总体中所占比重。
结构相对数=总体中某一部分数值÷
总体全部数值×
(三)比例相对数:
反映一个统计总体内部各个组成部分之间数量对比关系,常用系数、倍数表示。
比例相对数=总体中某一部分数值÷
总体中另一部分数值
(四)比较相对数:
反映同一时期的同类现象在不同地区、部门、单位之间数量对比关系,用百分数或倍数表示。
比较相对数=某一地区(单位)某期某类指标数值÷
另一地区(单位)同期同类指标数值
(五)动态相对数:
发展速度,把同一现象在不同时间上的指标数值进行对比,用以说明发展变化的方向和程度。
动态相对数=某一现象报告期数值÷
同一现象基期数值×
(六)强度相对数:
两个性质不同但又相互联系的总量指标进行对别比值,可反映现象强度、密度、普遍度。
强度相对指标=某一总量指标的数值÷
另一有联系但性质不同的总量指标数值
1、集中趋势:
一组数据向中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表或中心值。
用平均指标来测度。
2、数值平均数:
(1)算术平均数:
均值,是全部数据算数平均的结果。
算术平均数=总体标志总量÷
总体单位总量。
简单算数平均数加权平均数:
根据分组数据计算计算算术平均数,以各组变量值出现的次数或频数为权数计算加权的算数平均数。
(2)调和平均数:
是各个变量值倒数的算术平均数的倒数,又称倒数平均数H。
简单调和平均数加权调和平均数。
(3)几何平均数:
n个变量值连乘积的n次方根。
简单几何平均数。
加权几何平均数
3、位置平均数:
根据全部标志计算的平均数,当某现象次数分布数列不对称,且极端值很大时,数值平均数就失去了意义。
(1)众数Mo:
一组数据中出现次数最多的变量值。
(2)中位数Me:
一组书中按大小排序后,处在中间位置上的变量。
(3)分位数:
四分位数,用3个点将数据四等分后各分位点上的值
4、离散程度的度量:
异众比率(非众数组的频数占总频数的比率)、四分位差(上四分位与下四分位之差)、极差-全距(一组数据最大值与最小值之差)、平均差(各变量值与其算数平均数离差绝对值的平均数)、方差(各变量与其算术平均数离差平方的算数均数)和标准差(方差的平方根)、离散系数-变异系数(一组数据的标准差与其相应的平均数的比值,是测度数据离散度的相对指标)等
1、统计假设:
对总体参数的具体数值所作的描述,常用的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 Excel 分析 工具