医学统计学之正态分布的概念与特征doc 10页.docx
- 文档编号:27786960
- 上传时间:2023-07-05
- 格式:DOCX
- 页数:11
- 大小:240.10KB
医学统计学之正态分布的概念与特征doc 10页.docx
《医学统计学之正态分布的概念与特征doc 10页.docx》由会员分享,可在线阅读,更多相关《医学统计学之正态分布的概念与特征doc 10页.docx(11页珍藏版)》请在冰豆网上搜索。
医学统计学之正态分布的概念与特征doc10页
医学统计学之正态分布的概念与特征(doc10页)
部门:
xxx
时间:
xxx
整理范文,仅供参考,可下载自行编辑
1统计的工作内容?
P2
实验设计、收集资料、整理资料、分析资料
2资料的类型P2-P3
(1)计量资料:
观察指标用定量的方法测定其数值的大小所得的资料。
一般用度量衡单位表示。
如身高、体重、浓度。
(2)计数资料:
(分类)疗效
(3)等级分组资料
3变异与同质的概念?
P3
(1)变异:
在临床治疗中,用同样的药物治疗病情相同的病人,疗效也不尽相同,即使在实验室里,动物与动物之间也有明显的差异,这种现象称为个体差异或者变异。
(2)同质:
研究对象某一个或者几个属性相同称为同质,例如同种族、年龄、性别的健康人。
4总体样本的概念?
P3
(1)总体:
是同质的个体所构成的全体。
有限总体:
研究单位是有限的。
无限总体:
研究单位是无限的。
(2)样本:
从总体中随机抽取部分有代表性的观察单位。
其实测值的集合。
5误差的类型?
P6
(1)系统误差
(2)随机测量误差
(3)抽样误差
6概率的概念特征?
P6
概念:
描写某一事件发生的可能性大小的一个量度。
特征:
(1)肯定发生的时间成为必然事件。
概率为1
2)可能发生也可能不发生的事件称为随机事件或者偶然事件概率0-1
(3)概率小于等于0.05或者小于等于0.01事件成为小概率事件。
7频率的概念?
频率指样本的实际发生率。
8,频率表的绘制步骤?
P8-P9
(1)求极差:
最大值减最小值
(2)确定组距分组:
组距=极差除以10
(3)划计
(4)计数
9描写集中与离散趋势的指标?
集中趋势:
算术均数、中位数、几何均数
离散趋势:
全距、四分位间距方差、标准差、变异系数
10.频数分布表的用途?
P10
(1)作为陈述资料的形式,可以替代原始的资料,便于进一步分析。
(2)便于观察资料的分布类型,医学研究中常见的资料分布类型可以分为对称分布和偏态分布两大类。
(3)便于发现资料中某些远离群体的特大或者特小的可疑值。
(4)当样本含量比较大时,可用各组段的频率作为概率的估计值。
11医学参考值的范围的含义是什么?
P22
医学参考值的范围传统上称作正常值范围,指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。
其确切含义为从选择的参照总体上获得的所有检查结果,用统计方法建立百分位数界限时所得到的区间称为参考值范围。
习惯上包含95%的参照总体的范围。
12均数中位数两者的关系?
见笔记
正态分布时:
均数=中位数
正偏态分布时:
均数大于中位数均数=中位数=众数
负偏态分布时:
均数小于中位数
13正态分布的主要特征?
P20
第一节正态分布的概念和特征
一、正态分布的概念
由表1.1的频数表资料所绘制的直方图,图3.1
(1)可以看出,高峰位于中部,左右两侧大致对称。
我们设想,如果观察例数逐渐增多,组段不断分细,直方图顶端的连线就会逐渐形成一条高峰位于中央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的光滑曲线图3.1(3)。
这条曲线称为频数曲线或频率曲线,近似于数学上的正态分布(normaldistribution)。
由于频率的总和为100%或1,故该曲线下横轴上的面积为100%或1。
图3.1频数分布逐渐接近正态分布示意图
为了应用方便,常对正态分布变量X作变量变换。
(3.1)
该变换使原来的正态分布转化为标准正态分布(standardnormaldistribution),亦称u分布。
u被称为标准正态变量或标准正态离差(standardnormaldeviate)。
二、正态分布的特征:
1.正态曲线(normalcurve)在横轴上方均数处最高。
2.正态分布以均数为中心,左右对称。
3.正态分布有两个参数,即均数
和标准差
。
是位置参数,当
固定不变时,
越大,曲线沿横轴越向右移动;反之,
越小,则曲线沿横轴越向左移动。
是形状参数,当
固定不变时,
越大,曲线越平阔;
越小,曲线越尖峭。
通常用
表示均数为
,方差为
的正态分布。
用N(0,1)表示标准正态分布。
4.正态曲线下面积的分布有一定规律。
实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数(频数分布)或观察值落在该区间的概率。
正态曲线下一定区间的面积可以通过附表1求得。
对于正态或近似正态分布的资料,已知均数和标准差,就可对其频数分布作出概约估计。
查附表1应注意:
①表中曲线下面积为-∞到u的左侧累计面积;②当已知μ、σ和X时先按式(3.1)求得u值,再查表,当μ、σ未知且样本含量n足够大时,可用样本均数
和标准差S分别代替μ和σ,按
式求得u值,再查表;③曲线下对称于0的区间面积相等,如区间(-∞,-1.96)与区间(1.96,∞)的面积相等,④曲线下横轴上的总面积为100%或1。
正态分布曲线下有三个区间的面积应用较多,应熟记:
①标准正态分布时区间(-1,1)或正态分布时区间(μ-1σ,μ+1σ)的面积占总面积的68.27%;②标准正态分布时区间(-1.96,1.96)或正态分布时区间(μ-1.96σ,μ+1.96σ)的面积占总面积的95%;③标准正态分布时区间(-2.58,2.58)或正态分布时区间(μ-2.58σ,μ+2.58σ)的面积占总面积的99%。
如图3.2所示。
图3.2正态曲线与标准正态曲线的面积分布
14医学医学参考值的范围?
P22
范围:
传统上称作正常值范围,指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。
参考值的范围?
目的:
a基于临床实践,着眼于个体。
划分正常人与异常人的界限。
B基于预防医学实践,着眼于人群。
标准误与标准差的特点?
(1)标准误特点:
荡样本例数为n一定时,标准误与标准差成正比。
(2)标准差的特点:
当标准差一定时,标准误与样本含量n的平方根成反比。
16.标准误的用途?
P30-P31
A衡量抽样误差的大小
B估计总体均数的置信区间
C用于假设检验
样本均数的标准差可用于衡量抽样误差的大小。
17置信区间的概念?
概念:
假设检验亦称显著性检验,是统计推断的另一重要内容,其目的是比较总体参数之间有无差别。
步骤:
a建立假设和确定检验水准。
b选择检验方法和计算检验统计量。
c确定P值和做出统计推断的结论。
18t检验的注意事项?
P41-P42
A假设检验结论正确的前提。
B检验的方法选用及适用条件。
C双侧检验与单侧检验的选择。
D假设检验的结论不能绝对化。
E正确理解P值得统计意义。
D假设检验和可信区间的区别
19假设检验中的两种错误及判定方法?
P42-P43
三)检验的两类错误
称H0真而被拒绝的错误为第一类错误或弃真错误;称H0假而被接受的错误为第二类错误或取伪错误。
记p(I)=p{拒绝H0|H0真};P(II)=p{接受H0|H0假}
20两独立样本t检验的概念P37?
两独立样本t检验又称成对T检验,它适用于完全随机设计的两样本均数的比较,其目的是检验两样本所来自总体的均属是否相等。
21什么事方差齐性?
P39
22假设检验的基本步骤?
基本步骤
1、提出检验假设(又称无效假设,符号是H0))和备择假设(符号是H1)。
H0:
样本与总体或样本与样本间的差异是由抽样误差引起的;
H1:
样本与总体或样本与样本间存在本质差异;
预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作α,通常取α=0.05或α=0.01。
2、选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如X2值、t值等。
根据资料的类型和特点,可分别选用Z检验,T检验,秩和检验和卡方检验等。
3、根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。
若P>α,结论为按α所取水准不显著,不拒绝H0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;如果P≤α,结论为按所取α水准显著,拒绝H0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。
P值的大小一般可通过查阅相应的界值
23差分析对资料的要求?
A每个个体的测量值相互独立
B服从正态分布或近似服从正态分布。
C总体的方差相等
24方差分析的用途?
用途:
适用于多个平均值进行假设检验,以检验所得的多个平均值是否来自相同总体。
25方差分析的基本思想?
方差分析的计算公式?
P47
26方差分析的具体步骤?
A提出检验假设,确定检验水准。
Ho:
u1=U2=U3,H1:
U1、U2、U3不全相等a=0.05
B计算检验统计量F值
C确定P值,做出推断结论。
F=MS处理间/MS处理内
27.单因素方差分析的公式P47
28.相对数的概念?
概念:
相对数是两个有关的绝对数之比,也可以是两个统计指标值比,计算相对数的意义主要是把基数化作相等,便于相互比较。
29.相对数常用的指标及其概念?
(1)率:
表示在一定范围内某种现象的发生数与可能发生的总数之比,说明某现象的强度或者频度。
通常以百分率(%)千分率、万分率(/万)、十万分率(/十万)
率=某事物或现象发生的实际数/某事物或现象发生的所有可能数X比例基数
(2)构成比:
表示某事物内部组成部分在整体中所占的比重
构成比=某一组成部分的观察单位数/同一事物各组成部分的观察单位X100%
(4)相对比:
即比值是两个有关指标值之比,说明一个指标是另一个指标的几倍或百分之几。
相对比=甲指标/乙指标或相对比=甲指标/乙指标X%
甲乙两指标的性质可以相同也可以不同。
如反映医院工作效率的门诊人次数与床位数之比,反映人口密度的人口数与土地面积之比。
构成比的特点:
A分子是分母的一部分,包含在分母中无单位。
B各部分构成比之和等于1,若四舍五入造成构成比之和不等于1,则应进行适当调整,使其等于1.C当事物内部某一部分的构成比发生变化时,其他各部分的构成比也会相应发生变化。
30.相对数应注意的事项?
事项:
A计算相对数时观察单位数应足够大。
分母大于等于30.
B分析时构成比和率不能混淆。
C几个率的平均率不一定等于其算数均值。
D相对数的相互比较应注意可比性。
31率的标准化及其意义?
P60
意义:
率的标准化是为了在比较两个不同人群的患病率、发病率、死亡率等资料时,消除其内部构成(如年龄、性别、工龄、病程长短等)的影响
32.行和列表卡方检验的注意事项?
P76
33.相关?
是用来测量和描述两个变量间关系的统计技术。
是对两个变量在自然环境下观察。
对变量没有控制有着操纵。
33相关关系的特点?
A关系的方向:
相关可以分为两个基本类型:
正相关和负相关
B关系的形成:
关系的形成形式分为线性和非线性。
C关系的程度:
测量了与特定相关形式的拟合程度,如线性相关测量了数据点与直线的匹配程度。
34.相关分析的概念?
预测:
SAT与大学学习
效果度:
新的智力测验与标准智力测验、学习成绩和问题解决能力等关联。
信度:
一个测量工具根据其稳定而得到的测量结果的程度而决定是否可信。
理论验证:
理论的预测可以有两个变量的相关来检验。
35皮尔逊相关系数?
样本的系数用R来表示。
(1)R的绝对值在-1和1之间
(2)R的绝对值越接近1,两个变量的关联程度越强。
(3)正相关时R值在0和1之间这时一个变量增加,另一个变量也增加。
负相关时,R值在-1和0之间,此时一个变量增加,另一个变量将减少。
R无法解释两个变量间的因果关系(教堂数与犯罪数成正比
受数据全距的影响(不应该向相关结果外推
受一个或两个极端值有巨大影响,在判断相关有多好时,不能解释成为比例。
R的平方测量了可由相关解释的数据的变异的比例。
36.直线回归就是用来描述一个度量如何依赖于另一个变量。
其任务就是找出一个变量随另外一个变量变化的直线方程。
我们把这个方程叫做直线回归方程。
回归方程:
Y=a+bx其中a是回归方程在Y轴上的截距,即当X=0时的Y值,b为样本的回归系数,即回归直线的斜率,表示当X变动一个单位时,Y平均变动b个单位。
37相关与回归的区别?
P32
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学统计学之正态分布的概念与特征doc 10页 医学 统计学 正态分布 概念 特征 doc 10