卫生管理软件统计名解与简答自己整理.docx
- 文档编号:27895799
- 上传时间:2023-07-06
- 格式:DOCX
- 页数:17
- 大小:61.32KB
卫生管理软件统计名解与简答自己整理.docx
《卫生管理软件统计名解与简答自己整理.docx》由会员分享,可在线阅读,更多相关《卫生管理软件统计名解与简答自己整理.docx(17页珍藏版)》请在冰豆网上搜索。
卫生管理软件统计名解与简答自己整理
一:
名解
参数:
指总体中全部观察单位的观测值所得的特征值,是一个固定的常数,通常是未知的。
统计量:
指由样本计算得到的反映样本资料特征的统计指标,为随机变量,取值在参数附近波动,可作为参数的估计值。
同质:
指观察单位通常具有某种共性,即相同的状况或属性等,观察单位之间常常“大同小异”。
变异:
指同质观察单位之间的差异。
概率:
是描述随机事件发生可能性大小的一个度量,为一个固定的常数,取值在0到1之间,常用p来表示。
频率:
在相同的条件下,独立地重复进行n次实验,随机事件A出现了f次,则称f/n为事件A出现的频率。
抽样误差:
指由抽样引起的样本统计量与总体参数之间的差异,或者不同样本统计量之间的差异。
1.单纯随机抽样:
又称简单随机抽样,是按等概率原则直接从含有N个观察单位的总体中抽取n个观察单位组成样本。
单纯随机抽样是最基本的抽样方法,也是其他抽样方法的基础。
优点:
均数(或率)及标准误的计算简便。
缺点:
总体较大时抽得的样本单元很分散,给实施调查带来困难。
2.分层抽样:
按与研究目的明显有关的因素(或特征),将观察单位分为若干的类型或组别(统计学上称“层”,stratum),然后从每一层中按比例抽取一定数量的观察单位组成样本。
优点:
抽样误差较小,样本对总体有较好的代表性;便于在不同的层内采用不同的抽样方法,有利于调查组织工作的实施;可以对各层独立进行分析。
3.非抽样误差:
指除抽样误差以外的,由各种非随机因素引起的误差,主要包括抽样框误差、无应答误差和计量误差。
非抽样误差成因复杂,可产生于调查工作的各个阶段、各个环节。
非抽样误差难以测度,但可以控制,比如设计科学的调查研究方案、开展预调查、调查人员严格选择与培训、加强调查实施过程的组织管理、监督和检查及资料整理录入加强编码及双录等措施均可减少非抽样误差。
相对数:
是指两个有联系的指标之比。
它可以是两个有联系的绝对数之比,也可以是两个统计指标之比。
率:
是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,用于说明某种现象发生的频率大小或强度,故又称频率指标。
构成比:
也称为构成指标,是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,用以说明某一事物内部各组成部分所占的比重或分布,常用百分数表示。
相对比:
是指两个有关联的指标之比,用以描述两者的对比水平,是对比的最简单形式。
常以百分数或倍数表示,说明一个指标是另一个指标的百分之几或几倍。
1.统计指标:
是反映总体现象综合数量特征的基本概念,用于获取总体现象的实际数量状况及其发展变化情况,包括三个构成要素,即指标名称、计量单位和计算方法。
2.孕产妇死亡率:
是指某年中由于怀孕和分娩及并发症造成的孕产妇死亡人数与同年出生的活产数之比。
3.续发率:
是指在一定观察期内某种传染病在易感接触者中二代病例的百分率。
4.人口总数:
又称总人口数,一般是指一定地域范围内(国家或地区)在某一特定时间的人口数量,是人口统计中最基本的指标。
5.患病率:
又称为现患率或流行率,是指某特定时间内受检人群中现患某种疾病的频率,可以用于描述病程较长或发病时间不易明确的疾病的患病情况。
6.寿命表:
又称为生命表,是指根据特定人群的年龄别死亡率计算出来的一种统计表,用于说明在特定人群年龄别死亡率的条件下人的生命过程。
1.抽样误差:
由随机抽样造成的样本均数与样本均数之间,样本均数与总体均数之间的差异称为均数的抽样误差。
2.置信区间:
按照给定的概率(
)所确定的包含总体参数的一个范围,该范围称为总体参数的置信区间,也称作可信区间。
3.假设检验:
又称作显着性检验,是用于判断样本指标与总体指标之间或样本指标与样本指标之间的差异有无统计学意义的一种统计方法。
4.检验水准:
进行假设检验时,预先设定的小概率事件发生的概率值。
类错误:
又称假阳性错误,即拒绝了原本成立的
时犯的错误。
方差齐性:
指被比较的各组数据其总体的方差相等。
在统计学上,若各方差之间在给定检验水准下没有统计学差异,则称为方差齐性,亦称等方差性、同方差性或方差一致性。
1.组间变异:
处理因素和随机误差引起的变异。
2.组内(误差)变异:
个体差异和测量误差引起的变异。
3.均方:
其实质是方差,由各离均差平方和除以相应自由度获得,反映了变异大小。
1.相关系数
是表示两变量间的相关程度和方向的统计指标。
2.决定系数
是回归平方和与总离均差平方和之比,它反映了回归贡献的相对程度,即在因变量
的总变异中回归关系所能解释的比例。
是对回归模型拟合程度的综合度量,可决系数越大,模型拟合程度越高。
3.回归系数
是表示_应变量
对自变量
在数值上的依存关系_的统计指标。
二:
简答
第一章
3、简答题
1.试简述卫生管理统计的基本步骤
卫生管理统计的基本步骤一般分为统计设计、收集资料、整理资料和分析资料四个步骤。
这四个步骤紧密联系,前一步是后一步的基础,每一个步骤的工作质量都会影响最终结论的正确性。
2.试简述卫生管理统计中常用的数据资料类型,并举例说明。
卫生管理统计中通常将资料分为定量资料、定性资料和等级资料三种类型。
定量资料是测量每个观察单位某项指标得到定量的测量值,表现为数值大小,且有度量衡单位,如某医院出院患者的住院日。
定性资料是将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料,测量值为定性的,表现为互不相容的属性或类别,如某医院住院患者中A型、B型、AB型和O型人数。
等级资料是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察档位数后得到的资料,具有半定量性质,表现为等级大小,如某病患者治愈、好转、无效、死亡的人数。
第二章
2、简单题
软件中数据库的建立分为哪几个步骤,需要注意哪些问题
利用SPSS直接建立数据库一般分为两步,第一步变量设置,在变量视图(VariableView)中完成,第二步数据录入,在数据视图(DataView)中完成。
在建立数据库过程中要注意以下问题:
建立数据库之前应先确定研究中需要的指标,哪些是重要指标,哪些是次要指标,哪些是标识变量,尽量做到数据库中含有研究所需要的每一个指标,同时尽量避免冗余无用的指标。
软件数据输入时,通常需要遵守的原则有哪些
.数据录入基本原则一个观测的数据在一行显示,一个指标即一个变量的数据在一列显示,录入完成后产生一个标准数据格式数据集。
数据录入过程中要注意尽可能用数值变量代替字符变量,便于数据录入;要有标识变量,便于核查;对于多项选择题的录入要采用多重二分法或者多重分类法,切忌将多个选项录入一个变量。
第三章
2、简答题
1.在调查设计时,如何考虑制定质量控制措施
调查研究的质量控制应贯穿于调查工作的各个阶段、各个环节,比如设计科学的调查研究方案、开展预调查、调查人员严格选择与培训、加强调查实施过程的组织管理、监督和检查及资料整理录入加强编码及双录等措施,以减少非抽样误差。
2.采用抽样调查估计总体率时,影响样本量大小的主要因素有哪些
(1)估计的容许误差。
容许误差越大,估计精度越低,需要的样本量越小;反之,容许误差越小,估计精度越高,需要的样本量越大。
(2)估计的置信度。
置信度要求越高,即
的取值越小,则样本含量要求越大。
置信水平一般取95%。
(3)总体的变异程度。
当总体率
越接近,变异程度越大,需要样本量越大;
值偏离越远,变异程度越小,样本量越小。
(4)应答率。
在估算样本量时通常需要根据可能的应答率增加样本量。
设估算出的样本量为
,应答率为
,则校正的样本量为
。
(5)设计效率。
在估算样本量时,应考虑复杂抽样设计的设计效率对研究结果的影响,一般先按照单纯随机抽样设计估计出初始样本量,再乘以设计效率Deff得到最终的样本量。
3.误差主要包括哪两类引起样本量大小的主要因素有哪些
抽样调查中的误差有两大类:
抽样误差和非抽样误差。
抽样误差是由于抽样使样本统计量与总体参数之间的差异。
由于每次抽取样本所包含的观察单位是随机的,所以,不同样本之间以及样本与总体之间会存在偏差,由此产生了抽样误差。
非抽样误差产生比较复杂,有以下几类:
由于抽样框不完善导致的抽样框误差;由于调查获得的数据与所欲调查项目的真值之间不一致而导致的计量误差;由于无应答导致的无应答误差等。
非抽样误差不仅在抽样调查中,在全面调查中也是存在的。
第四章
2、简答题
1.如何编制定量资料频数分布表
定量资料频数分布表的编制:
(1)求出全距(range)。
(2)确定组段数(k)根据样本含量多少确定组段数,一般设8~15个组段,不宜过粗或过细。
(3)求组距(classinterval):
根据资料的分布类型,组距分为相等与不等两种。
(4)确定组限:
数量分组的组限一定要清楚明确,组间的衔接必须严密,不遗漏,也不重复:
即要求第一个组段应包括资料中的最小值,最后一个组段应包括最大值;此外,应遵循“上限不在本组”的规则。
规范的表示方法是采用半开半闭区间(右开左闭区间)的形式,即各组段只写明下限值,而不标出上限值,如0~,15~,30~,但是最后一个组段必须采用闭区间。
(5)列频数表统计各组段频数,在此基础上计算频率、累计频数和累计频率。
2.描述集中趋势与离散趋势的指标各有哪些
参见教材表4-4及4-5对集中趋势及离散趋势统计量的总结。
3.简述中位数和均数的特点与应用条件
中位数和均值都是数据集中趋势的描述统计量,中位数是位置代表值,不考虑极端值,可以适用于不拘分布或分布类型不明的资料;均值考虑全部数据,包括极端值,但是一般适用于对称分布资料,尤其是正态分布资料。
4.简述极差、四分位差、方差、标准差的特点和应用条件。
这四个指标都是反映计量资料的离散程度。
极差和四分位差可用于任何分布,后者比前者稳定,但均不能综合反映各观察值的变异程度;标准差最为常用,要求资料服从对称分布,尤其是正态分布。
5.变异系数在什么条件下使用
变异系数可用于多组资料间度量衡单位不同或均数相差悬殊时的变异程度比较。
第五章
第六章
三、简答题
1.医院统计的主要包括哪些内容
医院统计主要包括工作效率统计、诊断质量统计、治疗质量统计、医疗管理质量统计、护理质量统计和卫生经济管理统计等内容。
2.传染病预防与控制的常用的统计指标有哪些
传染病预防与控制的统计指标主要包括传染病报告质量指标,如传染病漏报率、居民漏报率、医院漏报率、迟报率、漏诊率等;传染病疫情指标,如传染病感染率、发病率、续发率、死亡率、病死率等;预防接种指标,如疫苗接种率、保护率、抗体阳转率等。
3.疾病统计的常用指标包括哪些
疾病统计的常用指标包括发病率、患病率、累积发病率、治愈率、有效率、死亡率、生存率等。
4.寿命表的主要指标包括哪些
寿命表的主要指标包括年龄组尚存人数、年龄组平均存活年数、年龄组生存人年数、年龄组生存总人年数、年龄组平均期望寿命、年龄组死亡率、年龄组死亡概率、年龄组死亡人数等。
第七章
二、简答题
1.应根据资料的性质和分析目的选择合适的统计图。
2.统计图的基本结构及要求有哪些
1)标题,它位于图的下方中间,概括地说明图的内容。
一般情况下,标题应包含图的编号,以便在文字说明时使用方便。
有时标题也包含资料产生的时间、地点或来源。
(2)图域,以纵横轴为坐标绘制的图形,一般取第一象限为作图区,两轴的交点为起点,考虑到图形的美观,长宽之比一般是7:
5。
(3)标目描述被研究的事物与指标,横标目位于横轴的下方,纵标目置于纵轴的左侧。
(4)刻度,指纵横轴上的坐标,刻度数值按从小到大的顺序。
(5)图例,在同一图形中比较两种或多种事物时,需用不同的线形、图示或颜色区分不同内容,应附图例加以说明。
图例可放在图域的右上角空隙处或图中其它适当的位置。
3.普通线图与半对数图的区别是什么
普通线图:
用线段的升降表示某现象随另一现象变化而变化的趋势,纵横坐标均为算术尺度。
半对数线图:
一种特殊的线图,其纵坐标变量取对数尺度,横坐标变量为算数尺度,表示某现象随另一现象变化而变化的速度。
4.直条图与直方图的区别是什么
直条图:
用等宽直条的长短表示相互独立的各项指标数量的大小,其横轴表示分类资料的分组,纵轴表示各指标数量的大小,各组之间是间断的,各直条间留有空隙。
直方图:
用矩形面积表示连续变量的频数(频率)分布,其横轴表示连续变量值的分组,纵轴表示频数或频率,各直条间不留空隙。
5.圆图与构成直条图的区别与联系。
联系:
描述计数资料的构成比。
区别:
比较多个计数资料的构成比时,构成直条图较圆图更适用。
第八章
3、简答题
1.均数抽样分布的特点有哪些
样本均数的抽样分布有如下特点:
(1)各样本均数未必等于总体均数;
(2)各样本均数之间未必相等;
(3)样本均数的分布具有一定的规律,围绕着总体均数,中间多、两边少,左右基本对称,也服从正态分布;
(4)样本均数之间的变异比较原变量明显缩小。
2.假设检验基本思想是什么
假设检验的基本思想有:
(1)小概率事件小概率事件是指在一次随机试验中被认为基本上不会发生的事件,或者发生的概率非常小,可以认为不会发生。
具体发生概率小于多少才算是小概率事件,是需要在解决实际问题时预先设定的,即检验水准
,实际工作当中常取或,无特殊说明,一般为。
设定
即规定发生概率不超过的事件即是小概率事件。
(2)反证法思想是指首先提出假设,假定某事实成立(即原假设),在此基础上选用适当的统计方法来估计该事件发生的概率
。
如果
,说明该事件不是小概率事件,尚不能认为该事实不成立;如果
,说明该事件的发生属于小概率事件,我们就有理由怀疑原假设的正确性,即该事实不成立。
分布曲线的特点有哪些
分布曲线的特点有:
(1)
分布是一簇曲线,而不是单条曲线;
(2)以0为中心,单峰分布,左右对称;
(3)自由度
越小,
越大,
值越分散,曲线的峰越矮,尾部越粗;
(4)随着自由度
的增大,分布逐渐逼近标准正态分布,当
趋近于无穷大时,t分布就完全称为标准正态分布。
4.假设检验的基本步骤有哪些
假设检验的基本步骤有:
(1)建立检验假设,确定检验水准α;
(2)选择检验方法,计算统计量;
(3)根据统计量与α大小关系确定P值;
(4)作出推断结论。
第九章
3、简答题
检验的基本思想及应用条件是什么
基本思想:
t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否是由抽样误差造成的,从而判断差异是否有统计学意义。
应用条件:
①观测个体间独立,即任一个体的观测值不受其他个体观测值的影响;②研究中的分析变量为服从正态分布的定量变量;③两独立样本t检验还要求样本所来自的总体方差相等,即总体方差齐性。
2.配对设计有哪些形式
实际工作中,配对样本常见于三种情况。
第一种情况主要在实验研究中,研究者将受试对象按某些特征(如性别、年龄等可能对研究结果有影响的因素,也称混杂因素)配成对子,再随机分配对子中的每个个体至处理因素的两个不同水平。
除实验研究外,流行病学中常用的1:
1匹配的病例对照研究虽为观察性研究,也可视为配对样本;第二种情况是将每份被测样品一分为二,再分配至不同的方法检测;第三种情况属于自身配对形式,每个受试对象在因素处理前和处理后的比较。
第一种情况又称异源性配对,后两种情况又称同源性配对。
第十章
3、简单题
1.方差分析的基本思想及应用条件是什么
方差分析的基本思想:
根据研究设计类型和研究目的将总变异分解为两个或两个以上部分。
不同部分的变异可用不同因素的作用或随机误差的作用来解释,通过比较某因素所致变异与随机误差,来判断该因素对研究结果是否有影响。
应用条件:
1.各样本来自正态总体。
2.各样本所来自总体的方差相等。
2.在随机区组设计的方差分析中,SS总,SS处理,SS区组及SS误差的含义各是什么
在随机区组设计的方差分析中,
的含义是什么
:
总变异,即总离均差平方和;
:
处理组间的变异;
:
区组间的变异;
:
误差的变异。
3.完全随机设计方差分析和随机化区组设计方差分析在变异分解上有何不同
单因素方差分析时总变异分解为两个部分,即组间变异和组内变异,组内变异即随机误差引起的变异,分解过程可以表示为
;随机区组设计方差分析总变异分解为三个部分,即处理组间变异、区组间变异和组内变异,此处的组内变同样由随机误差引起,具体分解过程可以表示为
。
。
第十一章
一、简答题(略)
第十三章
4、问答题
1.为什么要做r和b的假设检验
因为有两种可能性会造成样本相关系数r或回归系数b不等于零,一种是抽样误差,一种是本质差。
因此得到一个不等于零的r或b时,不能立即下结论说变量x和变量y存在直线相关关系或直线回归关系,必须先作假设检验后再下结论。
2.做线性相关和回归分析时应注意哪些问题
(1)相关与回归分析要有实际意义。
不要将毫无关联的两个事物或现象进行相关或回归分析。
(2)对相关分析的作用要正确理解。
相关分析只是以相关系数
来描述两个变量间相互关系的密切程度和方向,并不能阐明两事物或现象间存在联系的本质。
而且相关并不一定就是因果关系。
(3)注意相关与回归的区别和联系。
(4)作相关与回归分析时,必须关注异常点,异常点即为一些特大特小的离群值。
(5)回归方程的适用范围有其限度,直线回归与相关分析一般是在一定取值区间内对两个变量间的关系进行描述,超出这个区间,变量间关系类型可能会发生改变。
(6)一个有统计学意义的回归方程并不一定具有实践上的预测意义。
3.相关系数与回归系数的联系和区别
两者区别:
(1)在意义上,相关反映两变量间的相互关系,回归反映两变量间的依存关系。
(2)在应用上,说明两变量间的相互关系用相关,说明两变量间的依存变化的数量关系用回归。
(3)资料要求上回归要求因变量Y服从正态分布;X是可以精确测量和严格控制的变量,一般称为一型回归。
相关要求两个变量X、Y服从双变量正态分布。
这种类型资料若进行回归分析称为二型回归。
两者联系:
(1)同一资料计算的r和b,它们的正负号是一致的。
r为正号说明两变量的相互关系同向变化的。
b为正号,说明X增(减)一个单位,Y平均增(或减)b个单位。
(2)对同一资料,r和b的假设检验结果(t值)是一样的。
即对同一样本,二者的t值是相等的
(3)可用回归解释相关,r的平方称为决定系数,r2=SS回/SS总回归平方和的大小取决于决定系数。
回归平方和越接近总平方和,则r2越接近1,说明引入的相关效果越好。
4.线性相关(积差法)与秩相关的应用有什么区别
直线相关(积差法)要求资料符合双变量正态分布,秩相关的资料无特殊要求。
秩相关把计量资料变为等级资料处理,丢失了部分信息。
使用时应注意,能用直线相关(积差法)的尽量不使用秩相关;要进行回归分析的资料,更不宜作秩相关。
5.相关分析的任务:
是分析两个变量间相互关系的密切程度和方向。
回归分析的任务:
是分析两变量间的依存变化的数量关系。
6.回归分析的应用条件
(1)线性(linear)反应变量
的总体平均值与自变量
呈线性关系,可通过散点图判断。
(2)独立性(independent)指任意两个观察值互相独立,可利用专业知识来判断。
(3)正态性(normal)在一定范围内任意给定
值,则对应的随机变量
服从正态分布,可通过专业知识、正态性检验、残差散点图来判断。
(4)等方差性(equalvariance)在一定范围内对应于不同
值,
总体变异程度相同,可通过残差分析来判断。
第十四章
2、简答题
1.多重线性回归可以使用哪些类型的自变量
典型的多重线性回归所使用的自变量类型应该是连续型定量变量,但是如果自变量中含有分类变量,经过适当的处理后仍然适合进行回归分析,二分类变量可以直接使用,名义分类变量可将其转化为若干个二分类变量(哑变量),有序分类变量可以根据不同级别赋予不同数值后按连续变量处理,也可按名义变量的方式处理。
2.多重线性回归分析如何筛选自变量
回归方程中引入什么变量,理想的做法是由研究者根据理论和经验决定。
在缺乏专业依据的情况下,可采用变量筛选技术。
一为全局择优法,二为逐步择优法,理论上讲,全局择优法是对自变量各种不同组合情况进行比较后,从中挑选出一个最优回归方程,但当自变量数目较大时计算量大,此时可以考虑采用逐步择优法,有前进法、后退法和逐步回归法。
3.偏回归系数的标准化有何意义
偏回归系数的意义是当其他自变量固定时,某自变量
每改变一个计量单位所引起的Y的平均变化量。
如研究者感兴趣各自变量对反应变量贡献大小的相互比较,由于各自变量的计量单位及变异度可能不同,回归方程中各自变量的偏回归系数不具可比性。
为此可将原始观测数据进行标准化,然后用标准化后的数据拟合回归方程,此时所获得的回归系数称为标准化偏回归系数。
标准化偏回归系数绝对值越大,所对应的自变量对反应变量Y的影响越大。
4.多重线性回归的应用条件是什么如何核查
多重线性回归具有与简单线性回归相同的前提条件:
线性、独立性、正态性和等方差,即LINE。
但是上述前提条件在进行回归分析之前难以直接考察,通常是在回归方程确定之后通过残差分析来核查。
第十五章
二、简答题
1.logistic回归与多重线性回归的区别:
(1)反应变量的类型不同:
logistic回归适用于反应变量为分类变量的资料,多重线性回归适用于反应变量为连续性定量变量的资料。
(2)模型的基本形式不同:
logistic回归模型的基本形式为,
,多重线性回归模型的基本形式为,
。
(3)回归模型的参数估计方法不同:
logistic回归模型采用极大似然估计法估计参数;多重线性回归模型采用最小二乘法估计参数。
(4)模型和回归系数的的假设检验方法不同:
logistic回归采用似然比法对模型整体进行假设检验,采用wald
检验对每个回归系数假设检验;多重线性回归采用方差分析对模型整体进行假设检验,采用
检验对每个回归系数假设检验。
2.logistic回归主要用途是筛选危险因素、调整或校正混杂因素及预测和判别。
3.简述logistic回归的回归系数与优势比的关系
3.logistic回归系数
与优势比
的关系为
,回归系数
的解释为其他自变量不变时,自变量
每增加1个单位得到的优势比
的自然对数。
,
,自变量(因素)为危险因素;
,
,因素为保护因素;
,
,因素与结局无关联。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 卫生 管理软件 统计 自己 整理