书签分享收藏举报版权申诉 / 16

立即下载加入VIP,免费下载

当前位置：首页 > 人文社科 > 法律资料 > 卫生统计学期末复习重点.docx

卫生统计学期末复习重点.docx

文档编号：2330909
上传时间：2022-10-28
格式：DOCX
页数：16
大小：58.86KB

卫生统计学期末复习重点.docx

《卫生统计学期末复习重点.docx》由会员分享，可在线阅读，更多相关《卫生统计学期末复习重点.docx（16页珍藏版）》请在冰豆网上搜索。

卫生统计学期末复习重点.docx

卫生统计学期末复习重点

《卫生统计学》期末复习提要

一、期末考试有关问题的说明

<一>出题的指导思想、原则及题目类型

出题的指导思想是：

全面考核学生对本课程的基本概念、基本方法，基本技能的掌握情况，考核学生运用所学的知识和方法综合分析与解决实际问题的能力。

出题的原则是：

不超过教学大纲的内容，难度适中但覆盖面较广，基本知识占８０─９０％，稍难或灵活的题目占１０─２０％。

凡自学的章节不考。

<二>答题要求

选择题：

要求选择无误，每题只选一个最佳答案。

计算分析题：

要求完整地写出计算步骤（包括计算公式）、用计算器计算出正确结果，并能对所得结果作出相应的分析结论。

二、期末复习范围和重点

绪言

<一>重点复习的名词：

计量资料：

对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurementdata）。

计量资料亦称定量资料、测量资料。

计数资料：

将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（countdata）。

计数资料亦称定性资料或分类资料。

总体（population）：

表示大同小异的对象（某个测量值）全体。

样本（sample）：

从研究总体中随机抽取的一部分有代表性的个体

变异（variation）：

同一总体内的个体间存在差异。

抽样误差：

消除了系统误差并控制了随机测量误差之后，样本数值仍和总体指标的数值有差异，这种误差称之。

概率:

某事件出现机会大小的量。

<二>重点复习的问题：

1、根据计量、计数、等级资料的概念正确识别统计资料的类型。

等级资料：

将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinaldata），等级资料又称有序变量。

等级资料与计数资料不同：

属性分组有程度差别，各组按大小顺序排列。

等级资料与计量资料不同：

每个观察单位未确切定量，故亦称为半计量资料。

2、统计工作的步骤及搜集资料的来源和要求。

1．设计：

设计内容包括资料收集、整理和分析全过程总的设想和安排。

设计是整个研究中最关键的一环，是今后工作应遵循的依据。

2．收集资料：

应采取措施使能取得准确可靠的原始数据。

3．整理资料：

简化数据，使其系统化、条理化，便于进一步分析计算。

4．分析资料：

计算有关指标，反映事物的综合特征，阐明事物的内在联系和规律。

分析资料包括统计描述和统计推断。

３、抽样研究的原因及目的，产生抽样误差的原因。

<三>一般复习的名词：

同质：

一些个体处于同一总体么就是指他们大同小异，具有同质性。

参数：

：

参数（paramater）是指总体的统计指标，如总体均数、总体率等。

总体参数是固定的常数。

多数情况下，总体参数是不易知道的，但可通过随机抽样抽取有代表性的样本，用算得的样本统计量估计未知的总体参数。

统计量：

统计量（statistic）是指样本的统计指标，如样本均数、样本率等。

样本统计量可用来估计总体参数。

总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。

随机化抽样：

随机抽样（randomsampling）是指按照随机化的原则（总体中每一个观察单位都有同等的机会被选入到样本中），从总体中抽取部分观察单位的过程。

随机抽样是样本具有代表性的保证。

样本含量：

<四>一般复习的问题：

１、卫生统计学的内容及学习卫生统计学的意义。

２、统计工作各个步骤的基本内容和关系。

集中趋势与离散趋势

<一>重点复习的名词：

频数分布表：

当变量值个数较多时，对各变量值出现的频率列表即为频率分布表（frequencydistributiontable）。

中位数（median,M）：

将原始观察值从小到大或者从大到小排序后，位次居中的那个数。

<二>重点复习的问题：

1、对频数分布特征的描述。

频数分布分为集中趋势（centraltendency）和离散趋势（tendencyofdispersion）。

常用描述定量变量集中趋势的统计指标包括算数均数、几何均数、中位数。

算数均数适用于对称分布，特别是正态分布的资料；几何均数适用于可经对数转换为对称分布的资料；中位数适用于各种分布资料，常用于描述偏峰分布的资料。

常用的描述定量变量离散趋势的统计指标包括极差、四分位数间距、方差、标准差和变异系数。

极差只利用最大值和最小值的信息，易受样本含量的影响，很不稳定；四分位数间距适用于各种分布资料；方差和标准差适用于对称分布，特别是正态分布的资料；变异系数常用于量纲不同时，或均数相差较大时变量间变异程度的比较。

实际应用中，常将算数均数和标准差结合对正态分布资料进行统计描述；常将中位数和四分位数间距结合对偏峰分布资料进行统计描述。

2、平均指标：

算术均数、几何均数、中位数的意义及应用条件，算术均数的计算。

3、变异指标：

全距、标准差、变异系数的意义及应用条件，标准差和变异系数的计算。

4、正态分布的两个参数及正态曲线下面积的分布规律。

正态分布的特征：

服从正态分布的变量的频数分布由μ、σ完全决定。

（1）μ是正态分布的位置参数，描述正态分布的集中趋势位置。

正态分布以x=μ为对称轴，左右完全对称。

正态分布的均数、中位数、众数相同，均等于μ。

（2）σ描述正态分布资料数据分布的离散程度，σ越大，数据分布越分散，σ越小，数据分布越集中。

σ也称为是正态分布的形状参数，σ越大，曲线越扁平，反之，σ越小，曲线越瘦高。

正态曲线下面积的分布规律：

如果用其标准差作为衡量单位，则以均数为中心，正负1个标准差内，即（μ-σ，μ+σ）区间内，正态分布曲线下的面积为总面积的68.27%；正负2个标准差内，即（μ-2σ，μ+2σ）区间内，面积为95.44%；正负3个标准差，即（μ-3σ，μ+3σ）区间内，面积为99.74%。

这是由正态分布的性质所决定的。

<三>一般复习的问题：

１、除<二>４外，正态分布的其余特点。

２、ｕ变换的形式和作用。

３、查阅标准正态曲线下面积表的方法。

均数的抽样误差及标准误

<一>重点复习的名词：

均数的抽样误差：

抽样造成的这种样本均数与样本均数之间、样本均数与总体均数之间的差异。

标准误：

用于表示均数抽样误差大小的指标，也叫样本均数的标准差，它反映了样本均数之间的离散程度。

总体均数的可信区间：

用统计量X和Sx确定一个有概率意义的区间，以该区间具有较大的可信度包含总体均数。

<二>重点复习的问题：

1、标准误的意义、计算及应用。

标准误：

用于表示均数抽样误差大小的指标，也叫样本均数的标准差，它反映了样本均数之间的离散程度。

⏹标准误的计算公式：

⏹在实际应用中可通过增加样本含量n来减小样本均数的标准误，从而降低抽样误差。

对于任意分布，在样本含量足够大时，其样本均数的分布近似于正态分布，且样本均数的均数等于原分布的均数，均数的标准误由公式

⏹计算。

2、标准差与标准误的区别与联系。

样本均数标准误的大小与标准差成正比，与样本含量n的平方根成反比，即在同一总体中随机抽样，样本含量n越大，抽样误差越小。

3、总体均数可信区间的意义和计算。

根据总体标准差σ是否已知及样本含量n的大小，总体均数置信区间的计算有t分布和Z分布（标准正态分布）两种方法。

1.t分布方法

当总体标准差σ未知时，正态总体N（μ,σ2）的样本均数的t变换结果服从t分布，若“砍去”t分布双侧尾部面积α=0.05=5%，故有95%的t值满足不等式：

-t0.05/2,ν<

-t0.05/2,ν<μ<+t0.05/2,ν

μ：

（-t0.05/2,ν，+t0.05/2,ν）

总体均数μ的（1-α）可信区间置信区间的一般计算式为

±tα/2,ν

均数的单侧置信区间为

μ>-tα/2,ν

或μ<+tα/2,ν

2正态分布近似方法

（1）当总体标准差σ已知时，总体均数的双侧置信区间为±Zα/2

（2）当σ未知但n足够大时（n>50），t分布的极限分布是标准正态分布，可用zα/2代替公式（5-9）中的tα/2,ν，则总体均数的双侧置信区间为

±Zα/2

同理,与（5-8）和（5-9）式相对应,单侧置信区间则为

-zα或-zα

+zα或+zα

4、总体均数可信区间与正常值范围的区别。

参考值范围

总体均数的置信区间

意义

绝大多数人某项指标的数值范围

指一定的置信度估计总体均数所在的范围

计算

正态分布

双侧±Zα/2

单侧,（-Zα/2S,∞）

或（-∞，+Zα/2S）

偏峰分布

双侧，Px～P100-x

单侧,（PX,∞）或（-∞,P100-X）

正态分布

σ未知：

双侧，±tα/2,v

单侧，（-tα/2,v,∞）

或（-∞,+tα/2,v）

σ已知：

双侧，±Zα/2

单侧，（-Zα,∞）

或（-∞,+Zα）

正态分布或偏峰分布

σ未知但n足够大：

双侧±Zα/2

单侧（-Zα，∞）或（-∞，+Zα/）

应用

判断某项指标正常与否

估计总体均数所在的范围

<三>一般复习的问题：

１、抽样误差的规律。

２、提高对总体均数可信区间估计精度的办法。

均数的假设检验

<一>重点复习的名词：

检验假设Ｈ０：

零假设（nullhypothesis）,又称原假设。

检验水准α：

根据问题的背景，规定一个“小”的概率α，若P值小于α，就认为“P值较小”，若P值不小于α，就认为“P值较大”。

通常取α=0.05或0.01以保证犯假阳性错误的概率不超过0.05或0.01。

这个α称为检验水准。

假设检验中的Ｐ值：

在零假设成立的条件下，出现统计量目前值及更不利于零假设数值的概率。

可比性：

第Ⅰ类错误和第Ⅱ类错误：

：

假阳性错误称为第I类错误（typeIerror），指拒绝了实际上成立的H0，这类“弃真”的错误称为I型错误，其概率大小用a表示；假阴性错误称为第II类错误（typeIIerror），指接受了实际上不成立的H0，这类“存伪”的误称为II型错误，其概率大小用b表示。

<二>重点复习的问题：

1、ｔ值；ｔ分布与标准正态分布的关系。

2、假设检验的基本思想和步骤。

基本思想：

把握“小概率事件在一次抽样试验中是几乎不可能发生”的原理。

步骤：

①建立假设、选用单侧或双侧检验、确定检验水准；②选用适当检验方法，计算统计量；③确定P值并作出推断结论。

3、样本均数与总体均数比较的ｔ检验。

4、两大样本均数比较的ｕ检验。

5、配对设计三种形式的特点及ｔ检验的Ｈ。

、Ｈ１。

配对设计三种形式的特点：

1）异体配对：

两个受试对象。

2）自身配对：

同一受试对象的两个部位分别接受两种处理。

3）统一受试对象接受某种处理之前和之后的数据，也可以视为自身配对。

6、假设检验时需注意的问题。

（重点是可比性和犯第Ⅰ类及第Ⅱ类错误的含义与概率）

可比性：

I类错误：

H0为真（实际无差别），假设检验结果拒绝H0，接受H1（推论有差别）所犯的错误称为I类错误（typeIerror），I类错误的概率记作a。

II类错误：

H1为真（实际有差别），假设检验结果拒绝H1，接受H0（推论无差别）所犯的错误称为II类错误（typeIIerror），II类错误的概率记作β。

1-β称为检验效能，过去称把握度（poweroftest），即两总体确有差别，按a水准能发现该差别的能力。

<三>一般复习的名词：

自由度、假设检验。

<四>一般复习

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 卫生统计学期末复习重点

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：卫生统计学期末复习重点.docx
链接地址：https://www.bdocx.com/doc/2330909.html

卫生统计学期末复习重点.docx

热门标签