初级统计师考试实务复习重点.docx
- 文档编号:7115543
- 上传时间:2023-01-19
- 格式:DOCX
- 页数:10
- 大小:134.20KB
初级统计师考试实务复习重点.docx
《初级统计师考试实务复习重点.docx》由会员分享,可在线阅读,更多相关《初级统计师考试实务复习重点.docx(10页珍藏版)》请在冰豆网上搜索。
初级统计师考试实务复习重点初级统计师考试实务复习重点1、统计是用来处理数据的,它是关于数据的一门学问。
统计学是用以收集数据,分析数据和由数据得出结论的一组概念、原那么和方法。
统计分析数据的方法分为:
描述统计、推断统计。
描述统计是研究数据搜集、处理和描述的统计学方法。
推断统计是研究如何利用样本数据来推断总体特征的统计学方法,容包括参数估计和假设检验。
2、数据类型:
定性数据与定量数据根据获取数据的方法分为观测数据与实验数据。
3、分类变量没有数值特征,所以不能对其数据进展数学运算。
分类数据只能用来区分事物,而不能用来说明事物之间的大小、优劣关系。
顺序数据之间可以比拟大小、上下、优劣。
却无法计算相互之间大小、上下或优劣的距离。
顺序数据的数据仍然是用来表示事物在性质上的差异,而不能用来反映事物在数量上的差异。
因此,从本质上说,顺序数据仍然是定性数据中的一种。
数值型数据的计量功能远大于分类数据和顺序数据。
有些数值型数据只可以计算绝对差,而有些不仅可以计算绝对差还可以计算相对差。
在统计学研究中对数值型数据的研究是定量分析的主要容。
4、观测数据是对客观现象进展实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束。
实验数据一般是在科学实验环境下取得的数据。
5、数据的直接来源原始数据:
统计调查或进展实验。
通过统计调查得到的数据,一般称为观测数据。
通过实验法得到的数据是实验数据。
运用实验法首先要注意的是实验组和对照组的产生式随机的。
数据的间接来源次级数据:
?
中国统计年鉴?
、专业调查咨询机构发布的调查结果数据、各企业的经营报表数据等。
次级数据第二手数据是指由其他人搜集和整理得到的统计数据。
6、搜集数据的方法:
普查、抽样调查、统计报表、重点调查、典型调查。
普查是专门组织的一次性的全面调查,用来调查属于一定时点上或一定时期的社会现象总量。
它适于搜集某些不能或不适宜于定期的全面统计报表搜集的统计资料。
普查可以摸清一个国家的国情、国力,特别是可以了解与掌握人力、财力、物资资源状况及其利用状况,为国家制定长远规划与政策提供可靠的依据。
普查的特点:
是一种全面调查,具有资料包括围全面、详尽、系统的优点;是一次性的专门调查,因为工作量大,耗资也多,时间周期较长,一般不宜经常举行。
抽样调查是一种非全面调查。
所有调查单位都有一定的概率被抽取。
特点:
第一,样本单位按随机原那么抽取,排除了主观因素对选取样本单位的影响。
第二,能够根据局部调查的实际资料对调查对象的总体的数量特征进展推断,从而到达对调查总体的认识。
第三,在抽样调查中会存在抽样误差,但是这个误差可以事先计算并加以控制。
在实际调查中,抽样方法主要有概率抽样和非概率抽样。
常用的概率抽样形式:
简单随机抽样、分层抽样、整群抽样、系统抽样。
分层抽样是首先将总体分成不同的层或组,然后在每一层进展抽样。
系统抽样又称等距抽样,是在总体的名录单中每隔一定距离抽选一个被调查者。
统计报表是自下而上逐步提供统计资料的调查方法。
按照报送围分为全面报表和非全面报表。
容包括:
表式、填表说明。
重点调查是在调查对象中选择一局部重点单位进展的一种非全面调查。
这些重点单位虽然数目不多,但它们具有所研究对象的总量在总体总量中占据绝大局部的特点。
当调查的任务只要求掌握事物的根本状况与根本的开展趋势,而不要求掌握全面的准确资料,而且在总体中确实存在着重点单位时,进展重点调查是比拟适宜的。
典型调查是一种非全面的专门调查,它是根据调查的目的与要求,在对被调查对象进展全面分析的根底上,有意识地选择假设干具有典型意义的或有代表性的单位进展的调查。
作用:
补充全面调查的缺乏在一定的条件下可以验证全面调查数据的真实性。
优点:
灵活机动,通过少数典型即可取得深入、详实的统计资料。
缺点:
由于受“有意识地选出假设干有代表性的限制,在很大程度上受人们主观认识上的影响,因此,必须同其他调查结合起来使用,才能防止出现片面性。
7、定性数据包括分类数据和顺序数据,它们的图表展示方法根本一样。
即用频数分布表和图形饼图、条形图、环形图描述。
频数分布表中落在某一特定类别的数据个数称为频数。
饼图是利用圆形及圆扇形面积来表示数值大小的图形。
主要用于总体中各组成局部所占比重的研究。
条形图是用宽度一样的条形的高度或长度来表述数据多少的图形。
如果想比拟不同变量之间的构造差异,可以通过环形图来实现。
定性数据的图示表述方法都适用于定量数据,反之不然。
8、生成定量数据的频数分布表时,首先是将数据进展分组。
分组个数515其次,确定组距。
上限-下限最后,统计出各组的频数及频数分布表。
确定组距时要考虑各组的划分是否能区分总体部各个组成局部的性质差异要能准确清晰地反映总体单位的分布特征在研究的现象变动比拟均匀的情况下,可以采用等距分组当研究的现象变动很不均匀时,一般采用不等距分组在统计各组频数时,采取上限不在的原那么,即将频数计算在与下限一样的组。
常用来表述定量数据统计图形有:
直方图、折线图和散点图。
此外还有茎叶图、箱线图。
直方图的横坐标代表变量分组,纵坐标代表各变量值出现的频数。
折线图是利用线段的升降来说明现象的变动。
折线图和散点图都可以用来反映两个变量之间的关系。
9、统计表一般由表头、行标题、列标题、数字资料和表外附加组成。
10、数据的分布特征:
集中趋势,即数据的数值向其中心值的靠拢程度。
离散程度,反映数据的各数值远离其中心值的趋势和程度。
11、反映定性数据集中趋势:
百分比、中位数由小到大排列后中间的数或中间两数的平均数、众数出现次数最多。
反映定量数据集中趋势:
平均数、中位数、众数和分位数等。
反映定量数据离散程度:
极差、四分位差、标准差和方差。
平均数、中位数和众数:
平均数易被多数人理解和承受,实际中用的也较多,但主要缺点是更容易受少数极端数值的影响。
中位数和众数提供的信息不像平均数那么多,但不受极端值的影响,具有统计上的稳健性,当数据为偏态分布,特别是偏斜程度较大时,可以考虑选择中位数和众数。
极差又称全距,为最大值与最小值之差。
它非常容易受极端值的影响,不能准确描述数据的分散程度。
标准差是方差的平方根,它比方差更具量纲性。
在一个统计样本中,其标准差越大,说明它的各个观测值分布的越分散,它的趋中程度就越差。
12、离散系数是将一组数据的标准差除以其均值。
13、标准分数是变量值与其平均数的离差除以标准差后的值,用以测定有一个数据在该组数据中的相对位置。
14、我们所关心的参数有:
总体平均数、总体方差、总体比例。
15、统计量是样本的函数。
构成统计量的函数中不能包含未知因素。
我们关心的统计量通常有样本均值、样本方差、样本比例。
16、统计量的概率分布提供了该统计量长远而稳定的信息,它构成了推断总体参数的理论根底。
17、样本均值的均值是总体均值。
在重置抽样时,样本均值的标准差为总体标准差的1/n。
在不重置抽样时,样本均值的标准差为18、当总体服从正态分布时,样本均值一定服从正态分布,即有。
假设总体为未知的非正态分布时,只要样本容量n足够大通常要求n30,样本均值仍会接近正态分布,其分布的期望值为总体均值,方差为总体方差的1/n。
如果总体不是正态分布,当n为小样本时通常要求n30,样本均值的分布那么不服从正态分布。
19、当样本容量比拟大时当np5且n(1-p)5时,样本比率P近似服从正态分布,且有P的数学期望就是总体比率。
P的方差:
在重置抽样时,在不重置抽样时,20、标准误差用于衡量样本统计量的离散程度,在参数估计中,它是用于衡量样本统计量与总体参数之间差距的一个重要尺度。
样本均值的标准误差SE或。
当总体标准差未知时,可用样本标准差s代替计算。
样本比例的标准误差为。
当总体比例的方差未知时,可用样本比例p(1-p)代替。
21、参数估计是用样本统计量去估计总体的参数。
由样本统计量来估计总体参数的方法:
点估计和区间估计。
常用的点估计:
样本均值估计总体均值,样本比例估计总体比例,样本方差估计总体方差。
22、区间估计包括样本统计量在有时是以统计量为中心的一个区间,该区间通常是由样本统计量加减估计标准误差得到的。
23、标准正态分布:
均值为0,标准差为1。
分布标准化公式:
样本均值标准化公式:
24、评估估计量的标准:
无偏性、有效性、一致性。
无偏性指估计量的期望值等于被估计的总体参数。
、分别是、的无偏估计量。
估计量与参数的接近程度是用估计量的方差或标准误差来度量的。
对同一个总体参数的两个无偏估计量,有更小方差的估计量更有效。
是的一致估计量。
25、在对总体均值进展区间估计时,需要考虑总体是否为正态分布、总体方差是否、用于估计的样本是大样本n30还是小样本等情况。
26、总体均值的区间估计:
大样本,当总体方差未知时,用代替。
小样本,总体方差,当总体方差未知时,。
27、总体比例的区间估计:
大样本,。
28、估计总体均值时样本量确实定:
,表示置信水平。
估计总体比例时样本量确实定:
。
如果总体比例未知,可用样本比例p代替,或取=0.5,使得到达最大。
29、时间序列指反映社会、经济、自然现象的数据按时间先后顺序记录形成的数列。
时间序列的构成要素:
现象所属的时间、对应不同时间的统计指标数值。
编制时间序列的原那么:
时期长短应该相等指标经济容应该一致总体围一样指标的计算方法、计算价格和计量单位一致数列中的各个指标值具有可比性。
30、增长量分析指标:
开展水平、增长量=报告期水平-基期水平、平均增长量。
增长量分为:
逐期增长量报告期水平与前一期水平之差、累计增长量报告期水平与某一固定时期水平之差。
逐期增长量之和等于相应时期的累计增长量。
平均增长量是某种社会经济现象在一定时期平均每期增长或减少的绝对数量。
一般用累计增长量除以增长的时期数目计算。
31、反映时间序列增长率的指标主要有:
开展速度、增长速度、平均开展速度和平均增长速度。
开展速度分为环比开展速度和定基开展速度。
环比开展速度是报告期水平与前一期水平之比,反映了现象逐期开展变化速度;定基开展速度是报告期水平同某一固定时期水平之比,说明现象在较长时期总的开展变化速度,又称总速度。
环比开展速度与定基开展速度的关系:
环比开展速度的连乘积等于对应的定基开展速度由此,平均开展速度。
相邻时期的两个定基开展速度相除的商等于相应的环比开展速度。
呈直线趋势的时间数列,其各期环比开展速度大致一样。
定基增长速度是累计增长量与某一固定时期开展水平比照的结果,表示现象在较长时期总的增长速度。
平均增长速度是环比增长速度的几何平均数。
平均增长速度=平均开展速度-1。
平均开展速度以环比开展速度的个数为变量值个数计算的几何平均数。
32、时间序列影响因素:
长期趋势、季节变动、循环变动、不规那么变动。
假设要观察现象在一段时期变动的根本趋势,需测定现象的长期趋势。
时间序列影响因素的分解:
加法模式假定各因素是相互独立的乘法模式长期趋势分析方法:
回归方程法、移动平均法、指数平滑法。
回归方程法将时间作为解释变量。
直线趋势方程:
b为斜率,是每增加一个单位时间,现象平均值增加的值移动平均法是用来测定时间数列长期趋势的最根本的方法。
采用移动平均法对时间数列修匀后等到的新数列:
由序时平均数组成项数少于原数列根本开展趋势与原数列一致。
平滑常数。
33、季节变动的特点:
每年重复一次按照一定的周期进展每个周期变化强度大致一样。
季节指数法:
。
该方法的缺陷:
没有考虑长期趋势的影响季节比率的上下受各年数值大小的影响。
数值大的年份,对季节比率的影响较大。
一般经济现象都存在一定的长期趋势,为准确地反映现象随季节变动的特征,采取回归方程法消除法。
34、指数的作用:
综合反映事物的变动方向综合反映事物的变动程度利用指数可以进展因素分析研究事物在长时间的变动趋势。
统计指数是说明复杂社会经济现象总体数量综合变动的相对数。
从指数理论和方法上看,统计指数所研究的主要是狭义指数。
35、指数的分类:
按反映对象围,分为个体指数和综合指数。
按所说明的经济指标性质分为数量指标说明总体单位数量、规模等数量变动的相对数,如产量指数、销售量指数、职工人数指数和质量指标说明总体单位水平、工作质量等质量变动的相对数,如价格指数、单位本钱指数、劳动生产率指数。
综合指数是一种加权指数。
计算方法:
拉氏指数和派氏指数。
在编制综合指数时,首先必须:
确定指数化因素固定同度量因素选择同度量因素所属的时期。
拉氏指数主要受基期商品构造的影响,派氏指数主要受报告期商品构造的影响。
由于派氏指数要求每期更换权数资料,计算比拟麻烦,而拉氏指数的权数固定在基期,在编制长期连续性的指数数列时比拟方便,因此,拉氏指数更得到普遍的应用。
但是从实际意义上看,派氏物量指数的解释更符合现实意义。
在编制物价指数时,以商品的销售量或使用数量作为权数,在编制物量指数时,以商品的价格或本钱作为权数。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 初级 统计 考试 实务 复习 重点