卫生统计学期末复习重点.docx
- 文档编号:2330909
- 上传时间:2022-10-28
- 格式:DOCX
- 页数:16
- 大小:58.86KB
卫生统计学期末复习重点.docx
《卫生统计学期末复习重点.docx》由会员分享,可在线阅读,更多相关《卫生统计学期末复习重点.docx(16页珍藏版)》请在冰豆网上搜索。
卫生统计学期末复习重点
《卫生统计学》期末复习提要
一、期末考试有关问题的说明
<一>出题的指导思想、原则及题目类型
出题的指导思想是:
全面考核学生对本课程的基本概念、基本方法,基本技能的掌握情况,考核学生运用所学的知识和方法综合分析与解决实际问题的能力。
出题的原则是:
不超过教学大纲的内容,难度适中但覆盖面较广,基本知识占80─90%,稍难或灵活的题目占10─20%。
凡自学的章节不考。
<二>答题要求
选择题:
要求选择无误,每题只选一个最佳答案。
计算分析题:
要求完整地写出计算步骤(包括计算公式)、用计算器计算出正确结果,并能对所得结果作出相应的分析结论。
二、期末复习范围和重点
绪言
<一>重点复习的名词:
计量资料:
对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurementdata)。
计量资料亦称定量资料、测量资料。
计数资料:
将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(countdata)。
计数资料亦称定性资料或分类资料。
总体(population):
表示大同小异的对象(某个测量值)全体。
样本(sample):
从研究总体中随机抽取的一部分有代表性的个体
变异(variation):
同一总体内的个体间存在差异。
抽样误差:
消除了系统误差并控制了随机测量误差之后,样本数值仍和总体指标的数值有差异,这种误差称之。
概率:
某事件出现机会大小的量。
<二>重点复习的问题:
1、根据计量、计数、等级资料的概念正确识别统计资料的类型。
等级资料:
将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinaldata),等级资料又称有序变量。
等级资料与计数资料不同:
属性分组有程度差别,各组按大小顺序排列。
等级资料与计量资料不同:
每个观察单位未确切定量,故亦称为半计量资料。
2、统计工作的步骤及搜集资料的来源和要求。
1.设计:
设计内容包括资料收集、整理和分析全过程总的设想和安排。
设计是整个研究中最关键的一环,是今后工作应遵循的依据。
2.收集资料:
应采取措施使能取得准确可靠的原始数据。
3.整理资料:
简化数据,使其系统化、条理化,便于进一步分析计算。
4.分析资料:
计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。
分析资料包括统计描述和统计推断。
3、抽样研究的原因及目的,产生抽样误差的原因。
<三>一般复习的名词:
同质:
一些个体处于同一总体么就是指他们大同小异,具有同质性。
参数:
:
参数(paramater)是指总体的统计指标,如总体均数、总体率等。
总体参数是固定的常数。
多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。
统计量:
统计量(statistic)是指样本的统计指标,如样本均数、样本率等。
样本统计量可用来估计总体参数。
总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
随机化抽样:
随机抽样(randomsampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
样本含量:
<四>一般复习的问题:
1、卫生统计学的内容及学习卫生统计学的意义。
2、统计工作各个步骤的基本内容和关系。
集中趋势与离散趋势
<一>重点复习的名词:
频数分布表:
当变量值个数较多时,对各变量值出现的频率列表即为频率分布表(frequencydistributiontable)。
中位数(median,M):
将原始观察值从小到大或者从大到小排序后,位次居中的那个数。
<二>重点复习的问题:
1、对频数分布特征的描述。
频数分布分为集中趋势(centraltendency)和离散趋势(tendencyofdispersion)。
常用描述定量变量集中趋势的统计指标包括算数均数、几何均数、中位数。
算数均数适用于对称分布,特别是正态分布的资料;几何均数适用于可经对数转换为对称分布的资料;中位数适用于各种分布资料,常用于描述偏峰分布的资料。
常用的描述定量变量离散趋势的统计指标包括极差、四分位数间距、方差、标准差和变异系数。
极差只利用最大值和最小值的信息,易受样本含量的影响,很不稳定;四分位数间距适用于各种分布资料;方差和标准差适用于对称分布,特别是正态分布的资料;变异系数常用于量纲不同时,或均数相差较大时变量间变异程度的比较。
实际应用中,常将算数均数和标准差结合对正态分布资料进行统计描述;常将中位数和四分位数间距结合对偏峰分布资料进行统计描述。
2、平均指标:
算术均数、几何均数、中位数的意义及应用条件,算术均数的计算。
3、变异指标:
全距、标准差、变异系数的意义及应用条件,标准差和变异系数的计算。
4、正态分布的两个参数及正态曲线下面积的分布规律。
正态分布的特征:
服从正态分布的变量的频数分布由μ、σ完全决定。
(1)μ是正态分布的位置参数,描述正态分布的集中趋势位置。
正态分布以x=μ为对称轴,左右完全对称。
正态分布的均数、中位数、众数相同,均等于μ。
(2)σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。
σ也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。
正态曲线下面积的分布规律:
如果用其标准差作为衡量单位,则以均数为中心,正负1个标准差内,即(μ-σ,μ+σ)区间内,正态分布曲线下的面积为总面积的68.27%;正负2个标准差内,即(μ-2σ,μ+2σ)区间内,面积为95.44%;正负3个标准差,即(μ-3σ,μ+3σ)区间内,面积为99.74%。
这是由正态分布的性质所决定的。
<三>一般复习的问题:
1、除<二>4外,正态分布的其余特点。
2、u变换的形式和作用。
3、查阅标准正态曲线下面积表的方法。
均数的抽样误差及标准误
<一>重点复习的名词:
均数的抽样误差:
抽样造成的这种样本均数与样本均数之间、样本均数与总体均数之间的差异。
标准误:
用于表示均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。
总体均数的可信区间:
用统计量X和Sx确定一个有概率意义的区间,以该区间具有较大的可信度包含总体均数。
<二>重点复习的问题:
1、标准误的意义、计算及应用。
标准误:
用于表示均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。
⏹标准误的计算公式:
⏹在实际应用中可通过增加样本含量n来减小样本均数的标准误,从而降低抽样误差。
对于任意分布,在样本含量足够大时,其样本均数的分布近似于正态分布,且样本均数的均数等于原分布的均数,均数的标准误由公式
⏹计算。
2、标准差与标准误的区别与联系。
样本均数标准误的大小与标准差成正比,与样本含量n的平方根成反比,即在同一总体中随机抽样,样本含量n越大,抽样误差越小。
3、总体均数可信区间的意义和计算。
根据总体标准差σ是否已知及样本含量n的大小,总体均数置信区间的计算有t分布和Z分布(标准正态分布)两种方法。
1.t分布方法
当总体标准差σ未知时,正态总体N(μ,σ2)的样本均数的t变换结果服从t分布,若“砍去”t分布双侧尾部面积α=0.05=5%,故有95%的t值满足不等式:
-t0.05/2,ν< -t0.05/2,ν<μ<+t0.05/2,ν μ: (-t0.05/2,ν,+t0.05/2,ν) 总体均数μ的(1-α)可信区间置信区间的一般计算式为 ±tα/2,ν 均数的单侧置信区间为 μ>-tα/2,ν 或μ<+tα/2,ν 2正态分布近似方法 (1)当总体标准差σ已知时,总体均数的双侧置信区间为±Zα/2 (2)当σ未知但n足够大时(n>50),t分布的极限分布是标准正态分布,可用zα/2代替公式(5-9)中的tα/2,ν,则总体均数的双侧置信区间为 ±Zα/2 同理,与(5-8)和(5-9)式相对应,单侧置信区间则为 -zα或-zα +zα或+zα 4、总体均数可信区间与正常值范围的区别。 参考值范围 总体均数的置信区间 意义 绝大多数人某项指标的数值范围 指一定的置信度估计总体均数所在的范围 计算 正态分布 双侧±Zα/2 单侧,(-Zα/2S,∞) 或(-∞,+Zα/2S) 偏峰分布 双侧,Px~P100-x 单侧,(PX,∞)或(-∞,P100-X) 正态分布 σ未知: 双侧,±tα/2,v 单侧,(-tα/2,v,∞) 或(-∞,+tα/2,v) σ已知: 双侧,±Zα/2 单侧,(-Zα,∞) 或(-∞,+Zα) 正态分布或偏峰分布 σ未知但n足够大: 双侧±Zα/2 单侧(-Zα,∞)或(-∞,+Zα/) 应用 判断某项指标正常与否 估计总体均数所在的范围 <三>一般复习的问题: 1、抽样误差的规律。 2、提高对总体均数可信区间估计精度的办法。 均数的假设检验 <一>重点复习的名词: 检验假设H0: 零假设(nullhypothesis),又称原假设。 检验水准α: 根据问题的背景,规定一个“小”的概率α,若P值小于α,就认为“P值较小”,若P值不小于α,就认为“P值较大”。 通常取α=0.05或0.01以保证犯假阳性错误的概率不超过0.05或0.01。 这个α称为检验水准。 假设检验中的P值: 在零假设成立的条件下,出现统计量目前值及更不利于零假设数值的概率。 可比性: 第Ⅰ类错误和第Ⅱ类错误: : 假阳性错误称为第I类错误(typeIerror),指拒绝了实际上成立的H0,这类“弃真”的错误称为I型错误,其概率大小用a表示;假阴性错误称为第II类错误(typeIIerror),指接受了实际上不成立的H0,这类“存伪”的误称为II型错误,其概率大小用b表示。 <二>重点复习的问题: 1、t值;t分布与标准正态分布的关系。 2、假设检验的基本思想和步骤。 基本思想: 把握“小概率事件在一次抽样试验中是几乎不可能发生”的原理。 步骤: ①建立假设、选用单侧或双侧检验、确定检验水准;②选用适当检验方法,计算统计量;③确定P值并作出推断结论。 3、样本均数与总体均数比较的t检验。 4、两大样本均数比较的u检验。 5、配对设计三种形式的特点及t检验的H。 、H1。 配对设计三种形式的特点: 1)异体配对: 两个受试对象。 2)自身配对: 同一受试对象的两个部位分别接受两种处理。 3)统一受试对象接受某种处理之前和之后的数据,也可以视为自身配对。 6、假设检验时需注意的问题。 (重点是可比性和犯第Ⅰ类及第Ⅱ类错误的含义与概率) 可比性: I类错误: H0为真(实际无差别),假设检验结果拒绝H0,接受H1(推论有差别)所犯的错误称为I类错误(typeIerror),I类错误的概率记作a。 II类错误: H1为真(实际有差别),假设检验结果拒绝H1,接受H0(推论无差别)所犯的错误称为II类错误(typeIIerror),II类错误的概率记作β。 1-β称为检验效能,过去称把握度(poweroftest),即两总体确有差别,按a水准能发现该差别的能力。 <三>一般复习的名词: 自由度、假设检验。 <四>一般复习
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 卫生 统计学 期末 复习 重点