欢迎来到冰豆网! | 帮助中心 分享价值,成长自我!
冰豆网
全部分类
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • 党团工作>
  • ImageVerifierCode 换一换
    首页 冰豆网 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    武汉大学医学统计学 实习册答案.docx

    • 资源ID:30305129       资源大小:39.87KB        全文页数:23页
    • 资源格式: DOCX        下载积分:10金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    武汉大学医学统计学 实习册答案.docx

    1、武汉大学 医学统计学 实习册答案前言:由于Soner最近事情比较多,迟迟才总结出这一这份答案,再次深表歉意,特此鞠上一躬,此答案部分来源于网络,部分来源于书本以及课件总结,特感谢Soner的师兄师姐们的热情解答,以及统计学老师们的悉心教导,还有同年级兄弟姐妹的资料提供。 。实习一1 总体(population):根据研究目的所确定的同质观察单位的全体。2 样本(sample):从总体中随机抽取的部分个体。3 参数(parameter):总体的统计指标或特征值。4 统计量(statistic):由样本所算出的统计指标或特征值。5 概率(probability):在重复试验中,事件A的频率,随着试

    2、验次数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A出现的概率,记作P(A)或P。6 频率(relative):在n次随机试验中,事件A发生了m次,则比值f=m/n=A发生的试验次数/试验的总次数称为A在n次试验中出现的频率。7 变异(variation):同质事物间的差别。8 指标(indicator):说明总体综合数量特征和数量关系的数字资料。简答与思考题1 什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何联系与区别?医学统计学:是应用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科。统计学:是研究数据的收集、整理、分析与推断的科学卫生统计学:是

    3、把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。生物统计学:是一门探讨如何从不完整的信息中获取科学可靠的结论从而进一步进行生物学实验研究的设计、取样、分析、资料整理与推论的科学。2 医学统计资料主要来源于哪些方面?有何要求?医学统计资料主要有实验数据和现场调查资料、医疗卫生工作记录、报表和报告卡等。实验数据是指在试验过程中活的数据;现场调查资料主要来源于大规模的流行病调查获取的资料;医疗卫生工作记录有门诊病历卡、住院病历卡、化验报告等;报表有卫生工作基本情况年报表、传染年(月、日)报表、疫情旬(年、月、日)报表等;报表卡有传染病发病报告卡、出生报告卡

    4、、死亡报告卡等等。这些资料的收集过程中,必须进行治疗控制,包括它的统一性、确切性、可重复性。这些原始数据的精度和偏差应用明确的范围。3 当今医学研究的趋势和特点如何?医学统计方法主要有哪些?医学统计学在本世纪二十年代以后才逐渐形成为一门学科。解放前,我国学者即致力于把统计方法应用到医学中去,但人力有限、范围较窄。解放后,随着医学科研工作的发展,本学科得到迅速普及与提高,通过大量实践,在不少方面积累了自己的经验,丰富了医学统计学的内容,而电子计算机的作用,更促进了多变量分析等统计方法在医学研究中的应用。4 医学统计资料的类型有哪些?(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,

    5、所得资料称为计量资料。计量资料也称定量资料、测量资料,其变量值是定量的,表现为数值大小,一般有质量衡单位。如某一患者的身高(cm)、体重(kg)脉搏(次/分)等(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位称为计数资料。计数资料也称定性资料或分类资料。其观察值是定性的, 表现为互不相容的类别或属性,如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数。(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。等级资料又称为有序变量。如患者的治疗结果可分为治愈、好转、有效、死亡。5 误差、系统误差、随机测量误差、抽样误

    6、差有何区别?对误差的控制各有何要求?如何控制?误差:一个量的观测值或计算值与其真值之差,即一个量在测量、计算或观察过程中由于某些错误或通常由于某些不可控制的因素的影响而造成的变化偏离标准值或规定值的数量 ,误差是不可避免的。系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差,要尽量查明原因,必须克服。随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作技术不稳定,不同实验操作员之间的操作差

    7、异,电压不稳定及环境温度差异等因素造成测量结果的误差,对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是有抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。实习二平均数(average):也叫平均值,是一组数据典型或有代表性的值,这个值倾向于落在根据数据大小排列的数据的中心,包括算术平均值、几何平均数、中位数等。

    8、均数(mean):指在一组数据中所有数据之和再除以数据的个数,是反应数据集中趋势的一个指标。几何均数(geometric):是用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平中位数(median):将一组观察值按升序或降序排列,位次居中的数,常用M表示百分位数(percentile): 是一种位置指标,以Px表示,一个百分位数Px将全部观察值分为两个部分,理论上有x%的观察值小于Px小,有(1-x%)的观察值大于Px全距(极差)(range):最大与最小观察值之差。标准差(standard):是描述个体值变异程度的指标,为方差的算术平方根。变异系数(coefficient of v

    9、ariation):用于观察指标单位不同或均数相差较大时两组资料变异程度的比较,用CV表示。计算:标准差/均数*100%。简答与思考题1 试诉频数表的要素与用途?要素:组段、频距。用途:描述资料的分布特征和分布类型。频数分布有两个重要特征:集中趋势和离散趋势。大部分观察值向某一数值集中的趋势称为集中趋势,常用平均数指标来表示,各观察值之间大小参差不齐。频数由中央位置向两侧逐渐减少,成离散趋势,是个体差异所致,可用一系列的变异指标来反映。便于进一步计算有关指标或进行统计分析。当数据较多且需手工计算时,常先编制频数表,再进行统计计算发现特大、特小的可疑值。如果频数表的一端或两端出现连续几个组段的频

    10、数为零后,又出现少数几个特大值或特小值,使人怀疑其是否准确,需进一步检查和核对并做相应处理。当样本含量比较大时,可用各组段的频率作为概率的估计值。2 描述单变量资料的统计指标分哪两大类,分别是什么指标?分类:描述数据分布集中趋势的指标:算术均数、几何均数、中位数描述数据分布离散程度的指标:极差、四分位数间距、方差、标准差、变异系数。3 试诉平均数、标准差、差异系数的含义与用途、平均数的指标的概念和作用:概念:平均数表示一组同质计量数据集中趋势的位置和平均水平。作用:是一组计量数据平均水平的代表值,可作为不同组间的比较值。标准差:反映数据的离散程度,反映一组数据变量值的变异程度,组间单位相同时,

    11、S越小,表示数据的变异程度越小。变异系数:标准差和平均数的比值,即s/a。应用:1)组间单位不同时变异程度的比较。2)比较组单位相同,但均数相差悬殊的组间变异程度。4 什么对象可以作为医学正常参考值的正常人?如何制定95%正常参考值范围?所谓正常人不是指机体任何器官、组织的形态和机能都正常的而是符合特定水平的人1)确定诊断指标为“定性”或“定量”2)计量数据要确定其分布(正态或偏态)3)计量资料考虑制定单侧诊断界值还是双侧诊断界值。4)有足够的样本例数(一般不低于100例)5 标准正态分布曲线下面积有何分布规律?所有的正态分布曲线,在v左右的相同倍数的标准差范围内的面积相同。并且,在v范围内的

    12、面积约为68.3%;在v1.96范围内的面积约为95%;在v2.58范围内面积约为99%。6 同一资料的标准差是否一定小于均数?均数和标准差是两类不同性质的统计指标,标准差用于描述数据的变异程度,变异程度大,则该值大,变异程度小,则该值小,标准差可大于均数,也可小于均数。实习三:抽样误差(sampling error):在同一总体中随机抽取样本含量相同的若干样本,是样本指标之间的差异以及样本指标与总体指标的差异。标准误(standard error SE):表示样本均数间的变异程度。可信区间(confidence interval):按一定的概率或可信度(1-)用一个区间估计总体参数所以范围,

    13、这个范围称作可信度1-的可信区间,又称置信区间。假设检验(hypothesis test):用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。第一类误差:统计学上规定,拒绝了实际上成立的H0,这类“弃真”的错误称为型错误或第一类错误,型错误的概率用表示第二类误差:统计学上规定,不拒绝实际上不成立的H0,这类“存伪”的错误称为型错误或第二类错误,型错误的概率用表示。t分布(t-distribution):在总体均数为u,总体标准差为的正态总体中随机抽取n相等的

    14、许多样本,分别算出样本均数,这些样本均数呈正态分布,而当样本含量n不太小时,即使总体不呈正态分布,样布均数的分布也接近正态。思考题1 标准差和标准误有何区别与联系区别:(1)含义不用s描述个体变量值(x)之间的变异度大小,s越大,变量值(x)越分散;反之变量值越集中,均数打代表性就越强标准误是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小(2)与n的关系不同:n增大时,s(恒定)标准误减少并趋于0(不存在抽样误差)(3)用途不同s:表示x的变异度大小,计算cv,估计正常值范围,计算标准误等x:参数估计和假设检验联

    15、系:二者均为变异度指标,样本均数的标准差及为标准误,标准差与标准误成正比2 统计描述与统计推断分别应掌握哪些要点1)研究特点不同:描述统计学研究如何简缩数据并描述这些数据的方法,一般包括:统计调查方法,分类原理,汇总,统计表,统计图,频数分配,时间数列,指数,相关,估计推算等。推断统计学研究如何在随机抽样的基础上推论有关总体数量特征的方法,一般包括:统计推断原上推论有关总体数量特征的方法,一般包括:统计推断原理,实验设计,估计理论,抽样调查,复变数分析,序列分析,误差理论,假设检验,决策理论等。2)研究样本不同:描述统计学研究大样本理论,所谓大样本即包括多数个体或多数数值的样本;推断统计学肝究

    16、小样本理论,所谓小样本即包括少数个体或少数数恼的样本。3)应用统计的性质不完全相同。描述统计学派在应用统计生物统计、经济统计等方面,仍残留者凯特勒的实质科学的影响;推断统计学在应用统计物理统计、田间设计、质量管理、经济预测等方面,基本上已转变为通用的方法论科学。3 t检验、z检验的公式有哪些类型,在应用上有何异同t检验:当样本例数n较小时,要求样本取自正态总体。t检验的类型:单样本t检验,独立t检验,配对t检验z检验:样本例数较大,或n虽小而总体标准差已知。相同点:集中位置都为0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)不同点:t分布是一簇分布曲线,t 分布的曲

    17、线的形状是随自由度的变化而变化,标准正态分布的曲线的形状不变,是固定不变的,因为它的形状参数为1。4 在统计推断过程中,如何区别单侧检验与双侧检验如果将拒绝性概率平分于理论抽样分布的两侧,称为双侧检验。例如选定显著性水平= 0.05,双侧检验就是将概率所规定的拒绝区域平分为两部分而置于概率分布的两边,每边占有 =0.025。双侧检验只强调差异是否显著而不强调方向性。 如果将拒绝性概率置于理论抽样分布的一侧(左侧或右侧),称为单侧检验(右侧检验或左侧检验)。单侧检验强调差异的方向性。 在具体的假设检验中,选择双侧检验或单侧检验可分为以下三种情况: 第一种:H0:=0 :0 双侧 第二种:H0:0

    18、 :0 单侧(左侧) 第三种:H0:0 :0 单侧(右侧) 5 总体可信区间与正常值范围有何不同应注意:可信区间与参考值范围的意义、计算公式和用途均不同。1.从意义和用途来看95参考值范围是指同质总体内包括95个体值的估计范围,而总体均数95可信区间是指按95可信度估计的总体均数的所在范围。可信区间用于估计总体参数,总体参数只有一个 。参考值范围用于估计变量值的分布范围,变量值可能很多甚至无限 。2.从计算公式看:若指标服从正态分布,95参考值范围的公式是:1.96s。总体均数95可信区间的公式是:。前者用标准差,后者用标准误。前者用1.96,后者用为0.05,自由度为v的t界值。6 假设检验

    19、和总体均数区间估计有何联系假设检验:是对总体做出某种假定,然后根据样本信息推断总体是否成立的一类统计学方法总称。假设检验有三个基本步骤:建立假设和确定检验水准;选择检验方法和计算检验统计量;确定P值和做出统计推断结论。总体均数的估计:1、点估计:样本统计量直接作为总体指标的估计值。它未考虑抽样误差的大小。2、区间估计:按预先给定的概率(1-)确定的包含未知总体参数的可能范围。7 简述第1类错误与第2类错误的区别与联系区别:型错误(弃真):拒绝实际成立的H0,型错误的概率记为。(1a)即置信度:重复抽样时,样本区间包含总体参数()的百分数。当p而拒绝H0时,只能犯型错误,不可能犯型错误。型错误(

    20、存伪):不拒绝实际不成立的H0,型错误的概率记为。(1)即把握度(或检验效能:两总体确有差别,被检出有差别的能力。当p而拒绝H0时,只能犯型错误,不可能犯型错误。联系:对同一资料,与反方向变化,若要同时减小与,唯一的办法是增加样本含量。实习四1 方差分析的基本思想是什么方差分析的基本思想就是按研究目的和设计类型,将总变异的离均差平方和SS和自由度v分别分解成若干部分,并求得各相应部分的变异;其中的组内变异或误差主要反映个体差异或抽样误差,其它部分的变异与之比较得出统计量F值,由F值的大小确定P值,并做出推断。 2 方差分析有何特性1)各样本是相互独立的随机样本2)各样本来自正态分布3)各处理组

    21、总体方差相等,及方差齐3 t检验与F检验的适用条件和应用范围有何异同t检验适用于两个样本均数的比较,F检验适用于多个样本的比较。t检验的应用条件:要求各样本来自相互独立的正态总体且各总体方差齐。方差分析的应用条件(1)各样本是相互独立的随机样本,且来自正态分布总体。(2)各样本的总体方差相等,即方差齐性。4 配对比较的t检验与配伍组比较的方差分析之间有何关系?两独立样本均数比较的t检验与两独立样本均数比较F检验之间有何联系1)两者都要求比较的资料服从正态分布;2)而且两样本均数的比较及方差分析均要求比较组有相同的总体方差;3)配伍组比较的方差分析是配对比较t检验的推广,成组设计多个样本均数比较

    22、的方差分析是两样本均数比较t检验的推广;4)对于两个样本之间的比较,方差分析和t检验效果是相同的, 两独立样本均数比较应用t检验的条件之一就是方差齐性,其中要判断两总体方差是否相等,就可以用F检验。简单的说就是检验两个样本的方差是否有显著性差异,这是选择何种T检验(等方差双样本检验,异方差双样本检验)的前提条件。5 多个样本均数比较方差分析的获得组间差异有统计意义(P0.05),问是否已完成该资料的分析?为什么?没有。拒绝H0 ,接受H1 ,表示总体均数不全相等,而要知道哪两两均数不相等和哪两辆均数不等,还需要进一步作多重比较。实习五1 常用相对数指标有哪些?它们在计算和意义上有何不同?率(强

    23、度相对数,频率相对数)、构成比、相对比应用相对数时应注意的问题: 计算相对数的分母一般不宜过小。 分析时不能以构成比代替率。 不能用构成比的动态分析代替率的动态分析。 对观察单位数不等的几个率,不能直接相加求其总率。 在比较相对数时应注意可比性。 对样本率(或构成比)的比较应随机抽样,并做假设检验。2 率的标准化的意义及基本思想是什么?当比较的两组资料内部各小组率明显不同,且各小组观测例数的构成比也明显不同时,直接比较两个合计率是不合理的。因为期内部构成比不同,往往影响合计率的大小,需要统一的内部构成进行调整后计算标准化率,使其具有可比性,这种方法称为率的标准化。率的标准化的基本思想:要比较两

    24、个总率时,发现两组资料的内部构成(如年龄、性别构成等)存在明显不同,而且影响到了总率的结果,这时就不宜再直接比较总率,而应考虑采用标准化法。标准化法的基本思想,就是采用统一的标准(统一的内部构成)计算出消除内部构成不同影响后的标准化率(调整率),然后再进行比较。3 两组计数资料比较可否用z检验?如可以,有何适用条件?如果总体为正态而方差又已知,使用Z检验就可以了;如果总体并非正态而总体方差也是未知的,在样本容量大于30时,可以用Z检验如果总体非正态而样本容量又小于30,既不能用Z检验也不能用t检验,需要使用非参数检验。4 卡方检验的适用范围和各个公式的适用条件是什么?卡方检验用于:推断两个及两

    25、个以上总体率或构成比是否有差别,两个分类变量间有无相关关系,多个率的趋势检验,以及两个率的等效检验等。此外,也用于频数分布的拟合优度检验。对不同的设计类型的资料,检验的应用条件不同: (1) 完全随机设计两样本率的比较 1) 当n40,且T5时,用非连续性校正值; 若所得P,则改用四格表的确切概率法。 2) 当n40,且有1T5时,用连续性校正值。 3) n40,或有T1时,不能用检验,应当用四格表的确切概率法。 (2) 配对设计四格表 1) 当b+c40, 2) 当b+c0.05,而非参数检验结果P0.05?如果出现上述情况,此时应怎样解释检验结果能。采用秩和检验。实习七1 相关与回归的区别

    26、与联系区别: 意义 :相关反映两变量的相互关系,即在两个变量中,任何一个的变化都会引起另一个的变化,是一种双向变化的关系。回归是反映两个变量的依存关系,一个变量的改变会引起另一个变量的变化,是一种单向的关系。 应用:研究两个变量的相互关系用相关分析。研究两个变量的依存关系用回归分析。 研究性质:相关是对两个变量之间的关系进行描述,看两个变量是否有关,关系是否密切,关系的性质是什么,是正相关还是负相关。回归是对两个变量做定量描述,研究两个变量的数量关系,已知一个变量值可以预测出另一个变量值,可以得到定量结果。 相关系数r与回归系数b :r与b的绝对值反映的意义不同。r的绝对值越大,散点图中的点越趋向于一条直线,表明两变量的关系越密切,相关程度越高。b的绝对值越大,回归直线越陡,说明当X变化一个单位时,Y的平均变化就越大


    注意事项

    本文(武汉大学医学统计学 实习册答案.docx)为本站会员主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2022 冰点文档网站版权所有

    经营许可证编号:鄂ICP备2022015515号-1

    收起
    展开