统计学实验报告Word下载.docx
- 文档编号:19656584
- 上传时间:2023-01-08
- 格式:DOCX
- 页数:16
- 大小:188.70KB
统计学实验报告Word下载.docx
《统计学实验报告Word下载.docx》由会员分享,可在线阅读,更多相关《统计学实验报告Word下载.docx(16页珍藏版)》请在冰豆网上搜索。
问卷的设计直接关系到数据的有用性和代表性,是问卷调查中至关重要的环节。
设计问卷要严谨、科学,并符合问卷设计规范。
(3)、问卷发放:
主要涉及将问卷发放到调查对象,并完成问卷的填写。
(4)、问卷回收:
(5)、数据初步整理:
Excel是很好的数据处理软件,也可以实现数据整理。
1、数据的编码:
编码是对数据进行初步分组和确定数字代码的过程。
它可以把复杂的文字用简单的代码代替,有利于简化数据输入和处理。
如:
统计男生女生消费情况,我们在统计时可以将男生用数字“1”来进行编号代替,而女生则用数字“2”代替,同时分清变量和数据。
2、数据的录入:
在Excel中录入数据只要激活单元格就可以进行数据的输入,这就要求熟悉Excel的基本操作。
统计数据录入中最重要的是要保证数据格式完整。
需要通过“格式-单元格格式”(Ctrl+1)菜单来实现。
对于录入重复数据,一般都习惯使用复制功能,但是Excel在简单复制数据时不能保证格式的完整性,这个时候,就需要单击鼠标右键,使用“选择性粘贴”,进行设置来实现复制的格式要求。
对于已经输入的数据,则可以使用“格式刷”来保证数据的性质不变。
3、数据导入:
使用“文件-打开”菜单,或是使用“数据-导入外部数据-导入数据”菜单,导入数据。
通过数据导入可以很完整的保持原始数据的性质,数据形式的一致性,为于后期的统计工作提供便利。
4、数据的筛选:
Excel同样提供数据的筛选功能,满足对数据的选择。
使用工具栏中数据-筛选-自动筛选项,完成简单的筛选工作。
如果选择“自定义”,自动筛选还可以根据条件筛选出数据在某一范围内符合条件的记录,自定义中可以用“与”、“或”来约束区分条件。
数据筛选项中还有高级筛选,以满足更更多筛选条件。
5、数据的排序:
数据的排序是将数据按次序排列的工作,可以实现数据的升序、降序排列。
在选中需排序区域数据后,点击数据-排列(升序排列或降序排列)工具按钮,数据将按升序(或降序)快速排列。
“数据-排序”菜单可进行最多三级的条件排列。
同时,“数据-排序”菜单还可进行自定义排序,一般要自定义特殊的排序要求,需要先使用“工具-选项-自定义序列”,手工输入新的排序序列,然后在“数据-排序”菜单打开的排序对话框中点击“选项”按钮,在新弹出的对话框的“自定义排序次序”下拉框中选择手工输入的排序次序。
6、数据文件的保存:
保存经过初步处理的Excel数据文件。
可以使用“保存”工具按钮,或者“文件-保存”菜单,还可以使用“文件-另存为”菜单。
实验二描述数据的图表方法
1、频数频率表—frequency函数的应用:
步骤:
(1)、打开一组原始数据:
(2)、在空白单元格输入分组数据(109、119、129、139、149);
(3)、间隔一列激活与分组数据同等数量的单元格;
(4)、选择fx函数,在选择类型中选择统计,然后选中frequency函数,点击确定;
(5)、在date-array选框中点击后面选择区域,然后鼠标拖动选取A2-H5单元格;
(6)、同理在Bins-array选框后面点击,用鼠标选取I2-I6单元格;
(7)、此时使用“Ctrl+Shift+Enter”组合键得到频数返回结果;
(8)、对结果进行修饰,在上面单元格加上“频数”、“频率”“分组”等表头,然后在频数后一列计算频率。
频率计算有两种方法:
方法一:
用每组频数除以频数总数“30”
(1)、激活频数第一个数后一列单元格,输入“=d14/30”敲回车返回结果;
(2)、然后使用拖拉权柄,得到后面结果;
(3)然后选中所有得到的频率结果,点击鼠标右键,选择“设置单元格式”选择“百分比”返回百分数。
方法二:
使用绝对和相对引用公式,该公式的好处在于,当源数据发生改变后,频率结果会自动更正。
(1)激活后一列的一个单元格,在单元格中输入公式“=d14/sum($d$14:
$d$18)”回车,得到返回结果;
(2)、同上,用拖拉权柄得到以下数据,然后右键选择“设置单元格格式”选择“百分比”然后给数据区域加边框。
2、统计图:
直方图:
(1)、使用工具菜单下“数据分析”选项,打开“数据分析”对话框,选择“直方图”;
(2)、分别在输入区域、接收区域、和输出区域选择对应区域,不选“标志”选框,勾选图表输出选项和“累计百分率”选项;
(3)、对图表进行部分改进。
饼状图:
(1)、同时选中数据中“分组”和“频率”所在的列,在图表向导中选择饼状图;
(2)、选中“数据标志”选项卡,选中值和百分比选项;
(3)、选择“完成”。
折线图:
(1)、同时选中数据中“分组”和“频数”列,在工具栏中选择图表向导,选择折线图,在选择相关选项;
(2)、点击“完成”。
实验三统计数据的描述
一、使用函数描述:
1、算数平均数的计算:
方法:
(1)、激活一个空白单元格,点击Fx在常用函数中选择Average,弹出函数参数对话框;
(2)、弹出对话框之后,由于原始数据个数没有超出30个,所以点击number选框后的区域选框,选择要求平均数的数据,点击“确定”返回平均数;
单值函数的计算方法大同小异。
2、中位数:
激活一个空白单元格,点击Fx,在函数类别下拉框中选择“统计”,然后选择“median”,点击确定,选择数据区域,点击“确定”返回结果。
3、众数:
激活一个空白单元格,点击Fx,在函数类别下拉框中选择“统计”,然后选择“mode”,点击确定,选择数据区域,点击“确定”返回结果。
4、标准误差:
激活一个空白单元格,在Fx右侧手动输入“=stdev(数据区域)/sqrt(count(数据区域)),”按回车键返回结果。
5、峰度:
激活一个空白单元格,点击Fx,在函数类别下拉框中选择“统计”,然后选择“kurt”,点击确定,选择数据区域,点击“确定”返回结果。
6、偏度:
激活一个空白单元格,点击Fx,在函数类别下拉框中选择“统计”,然后选择“skew”,点击确定,选择数据区域,点击“确定”返回结果。
7、四分位数:
(1)、激活一个空白单元格,点击Fx,在函数类别中选择“统计”,然后选择“quartile”,点击确定;
(2)、点击“array”右侧的箭头,选中所需的数据,选中需要计算四分位的数据,在“quart”中输入数字“0—4”中的数据,然后点击“确定”返回结果。
8、百分位数:
(1)、激活一个空白单元格,点击Fx,在函数类别中选择“统计”,然后选择“percentile”,点击确定;
(2)、同四分位数的计算,点击“array”右侧的箭头,选中所需的数据,在“K”中填入“0—1”数据,然后点击“确定”返回计算值。
9、变异系数:
(1)、激活一个空白单元格,在Fx右侧手动输入“=stdev(数据区域)/average(数据区域)”按回车键返回值。
二、使用“描述统计”工具:
(1)、点击工具菜单下“数据分析”菜单,打开数据分析对话框,分析工具“描述统计”,点击“确定”按钮,弹出“描述统计”对话框;
(2)、在“描述统计”对话框中,点击“输入区域”右边的下拉箭头,选中所需分析数据;
(3)、分组方式,选择“逐列”,选择合适的数据输出区域,点“标志位于第一行”、“击汇总区域”、“平均数置信度”、“第K大值”、“第K小值”;
(4)、点击“确定”返回计算结果。
实验四参数估计
一、抽样:
1、随机数发生器的使用:
随机数发生器是一个能随机获得任意想要的数据,数组的工具。
使用方法:
(1)、点击工具栏中“工具”菜单下的“数据分析”项,选中“随机数发生器”;
(2)、在弹出的对话框中依次输入想要数据的参数和限制值;
(3)、选择输出区域,点击确定,在指定区域输出随机数据。
2、数据抽样:
注:
软件提供的数据抽样工具,是一种重复抽样(有放回的抽样),且一次只能给一个数据变量抽样。
(1)、同样点击工具菜单下“工具”选项相下的“数据分析”项,选中“抽样”,点击确定,在对话框中输入定义数据;
在选择“抽样方法”的时候可以选择“周期”或是“随机”如果选择“随机”就要设置样本数。
(2)、点击确定生成随机数据。
二、参数估计:
参数估计是对数据进行推断统计的一种方法,它是相对于描述统计而言的,对数据进行系列的分析。
总体方差已知,大样本,对总体的值进行估计的参数估计:
(1)、将抽出的数据当做统计数据使用,复制到一个新的工作表中;
(2)、在A1单元格中输入a(可任意命名数组名),选中数据所在的A所在的列,点击“插入”菜单下“名称”下“指定”项,在对话框中选中“首行”复选框,点击“确定”,数组即被命名为“a”以后调用数组直接用“a”即可;
(3)、在右边空白单元格中输入相应参数名称;
(4)、对相关参数进行计算(样本均值)。
用axerage函数,利用数组名称“a”,求得:
(5)、构建函数表单框架:
、按住ctrl键选中“样本个数”、“样本均值”、“总体标准差”、“置信水平”、“抽样标准差”、“z值”所在单元格;
、选择工具菜单下“插入”菜单下“名称”选项下“指定”选项,在对话框中选择“最左列”项。
(6)、抽样标准差的计算:
在参数名称右边单元格输入计算公式(如下图),回车返回计算结果。
(7)、Z值的计算:
Z值的计算用到公式:
“=ABS(NORMSINV((1-置信水平)/2)”。
(8)、置信区间半径的计算:
公式法
在右边单元格输入“=z值*抽样标准差”回车返回结果:
直接引用统计函数“confidence”函数
、选中“置信区间半径”右边第二个单元格;
、选择fx函数卡片,选择“统计”类别,在列示框中选择“confidence”函数;
、在对话框中分别按要求输入相关数值;
、点击确定得到结果
(9)、置信区间下限:
置信区间下限等于样本均值-置信区间半径;
(10)、置信区间上限:
方法同上,只是上限等于样本均值+置信区间半径;
回车得到返回值。
三、其他函数表单:
其他函数表单的计算和前面例子大同小异,最主要的就是构建好函数表单框架,其他函数表单类型大致如下:
、以样本比率推断总体比率
、以样本方差推断总体方差
、两个总体方差比的区间估计
实验五假设检验
一、随机获得数据样本:
1、随机发生器:
(1)、点击“工具”--“数据分析”中随机数发生器;
(2)、根据需要设置随机数据条件(这里设置变量个数为1,随机数个数为50个,正态分布)并选择适当输出区域,点击确定生成数;
(3)、把得到的数据命名为“a”,便于以后数据的调用。
二、进行假设检验数据分析:
1、命名第一列数据:
点击“插入”选项中“名称”项中的“指定”项,选中“首行”选框,点击确定:
2、输入相关数据项目,构建假设检验表单:
1、输入已知量
2、对计算量进行依次计算
样本均值的计算:
激活项目名称后一单元格,并输入计算公式“=average(a)”回车返回样本均值:
抽样平均误差的计算:
(1)、首先对该项涉及的数据进行命名;
选中“总体标准差”和“样本单位”单元格及后面数据项单元格;
选择“插入”“名称”中“指定”项,并选中“最左列”选框;
(2)、同上样本均值的计算方法,在单元格中输入公式回车。
Z检验统计量的计算:
(1)、首先对相关数据进行命名,同时选中“样本均值”“总体均值假设值”“抽样平均误差”单元格及后面数据项单元格,同上面方法一样进行命名。
(2)、在相应单元格输入公式,回车返回结果:
检验区间下限计算:
(1)、先对“置信水平”项进行命名,再同上在单元格中输入公式,回车返回结果:
检验区间上限计算:
(1)、同下限计算方法一样,先进行命名,再输入公式,回车:
3、得出结论:
根据以上计算步骤,及得出的结果,输入公式看是接受h0还是拒绝h0
得出结论:
拒绝h0
实验六方差分析
一、单因素方差分析:
(1)、打开要分析的数据;
(2)、构建原假设h0:
u1=u2=…..=uk;
备择假设h1:
u1、u2、u3…...uk(不是全部的ui都相等(i=1,2,3,….k);
(3)、选择“工具”菜单中“数据分析”,再在子菜单中选择“单因素方差分析”选项;
(4)、在弹出的对话框中选择因子数据选框,分组方式选择“列”;
并选中“标志位于第一行”复选框;
a框默认显著性系数为0.05;
输出区域点击右侧箭头选择一个右方和下方都无数据的单元格;
(5)、点击对话框中“确定”按钮;
(6)、判断条件:
若在一个给定的显著性水平a下,如果计算的F检验统计量大于F的临界值就拒绝原假设,反之,不拒绝原假设。
若在一个给定的显著性水平a下,如果P值小于a就拒绝原假设,反之,不拒绝原假设。
二、双因数方差分析:
1、无重复的双因素方差分析:
(1)、打开数据;
(2)、同但因数方差分析一样,构建原假设和备择假设;
(3)、选择“工具”菜单中“数据分析”,再在子菜单中选择“无重复双因素方差分析”选项;
(4)、在对话框中选中“标志”复选框;
输出区域点击右侧箭头选择一个右方和下方都无数据的单元格。
(5)、点击“确定”按钮。
在一个给定的显著性水平a下,如果计算的F检验统计量大于F的临界值,行因素P小于显著性系数0.05就拒绝原假设,反之,不拒绝原假设。
2、可重复的双因素方差分析:
(1)、同上构建原假设和备择假设;
(2)、选择“工具”菜单中“数据分析”,再在子菜单中选择“可重复双因素方差分析”选项;
(3)、在对话框中选择输入区域,每一行样本的行数输入每个行因素的个数;
(4)、点击对话框中“确定”按钮。
(5)、判断条件:
在一个给定的显著性水平a下,如果计算的F检验统计量大于F的临界值,行因素P小于显著性系数0.05就拒绝原假设,反之,不拒绝原假设。
二、实验心得报告成绩:
_________
(一)心得体会:
由于种种原因,统计学实验课没有上完,虽然老师让我们自己学习剩下的实验,但自学难免有点吃力,感觉有点遗憾。
以前总感觉,统计学是一门理论性很强的课程,但在第一节理论课上,卢老师就给我们纠正了此观点:
统计学是你们实用性很强的科学,也是对理论知识要求比较高的学科,社会的发展,各行各业都离不开统计,上是国家政策实行的依据,小到生活中的点滴。
在上了统计学实验课之后,这种观念更是深入我的心里,才真实的感觉到统计学的实践价值,它对科学的研究提供了强大的数据依据和理论支撑。
统计学是一门集数据收集、数据整理、数据分析再得出结论的科学。
目的是探索数据内在的数量规律性。
从定义中不难看出,统计学是一门针对数据而展开探求的科学。
在实验中,对数据的筛选和处理就成为了比较重要的内容和要求了。
同时对数据的分析也离不开相关软件的支持,我们的统计学实验授课是以Excel软件为统计数据工具,原本数据统计软件有很多专业的工具,如:
SAS、SPSS、EXCEL等,SPSS是相对专业的统计软件,但老师说既然同一个任务能用最简单的方法、工具达到目的,为何要用复杂的方法,我觉得说得很对,EXCEL软件提供了强大的数据统计功能,完全能满足我们实验和一般的数据统计工作。
数据的收集、整理、分析贯穿了统计学的始终,而数据的整理、分析特别是数据的分析很大部分都是通过统计软件来实现的。
前期的数据的收集可以是间接数据(即直接用别人已经收集、统计出来的现成数据),也可以是直接数据(即通过访问、问卷等方式得到的原始一手数据),在后期的数据的分析阶段则要借助于统计软件的数据分析功能。
在整个实验中,数据的录入和描述分析是关键,然后对数据进行初步的统计分析,比如计算平均值、众数等入门,然后对一组数据进行参数估计、假设检验、方差分析、相关与回归等的分析,探索数据的内在联系和规律,从中得出结论并对社会和日常生活提供本质的结论,指导社会经济建设。
通过统计软件对数据的分析可以提高数据处理的效率,可以使数据分析达到事半功倍的效果。
通过实验过程的进行,对统计学的有关知识点的复习也与之同步。
在将课本知识与实验过程相结合的过程中,实验步骤的操作也变的得心应手。
也给了我们一个启发,在实验前应该先将所涉内容梳理一遍,带着问题和知识点去做实验可以让我们的实验过程不在那么枯燥无谓。
同时在实验的同步中亦可以反馈自己的知识薄弱环节,实现自己的全面提高。
老师在讲实验课的时候紧密结合了统计学理论知识,第一次让我感觉理论知识与实践贴合的这么近,自己对理论课的学习又有了一种激励,并感觉知识就是力量,它带给我们是实际的运用能力。
通过本次实验课的学习,我更加认识到理论与实际是相互促进的,也是紧密相关的。
而且,统计学是一门操作性极强的科学,是需要严谨的科学态度才能完成的工作。
在这门课上我学到了很多东西,不只是数据的整理、分析的能力,更多的是严谨的科学态度,理论结合实际的思想。
(二)、数据分析:
下面将对一组数据进行分析:
运用实验课数据案例(2007年15在全国6个省市的本科录取分数线),数据只取前六所高校。
2007年15所高校在全国6个省市的本科录取分数线(单位:
分)
北京
天津
山东
河北
湖北
黑龙江
1清华大学
文科
591
638
613
597
637
理科
615
629
688
657
646
673
2北京大学
600
589
650
618
620
685
651
677
3中国人民大学
570
595
577
624
596
605
630
614
4复旦大学
568
539
616
579
625
582
655
610
5上海交通大学
510
524
612
565
543
583
581
664
658
6北京师范大学
548
544
588
551
609
572
641
601
626
以下对数据进行整理分析:
1、计算各个大学在不同省文科理科录取的平均分数:
(1)、在数据表后加一列:
“总分”项,和“平均分”项
(2)、激活下一个单元格,在单元格中输入“=sum(c3:
h3)”回车,得到清华大学文科在六生录取的总分;
(3)使用拖拉权柄工具,计算出以下全部总分:
(4)、在“平均分”下一个单元格输入“=i3/6”,回车
(5)、再次使用拖拉权柄计算下面数据
2、画出六高校在六省文理科录取平均分柱状图:
(1)、同时选中学校、文理科及平均分项;
(2)、选择工具栏绘图工具,选择“柱状图”;
(3)、在对话框中设置标题、图标等属性;
(4)、点击“完成”
3、计算以上文理科分数的最大值、最小值、方差、标准差的计算:
各个指标具体算法,前面已经说明,这里不再详细阐述。
4、数据的筛选---选出平均分大于或等于600的学校及类别:
(1)、选中平均分所在的列n2到n14单元格,选择“数据”--“筛选”—“自动筛选”项;
(2)、点击表中下拉三角,选择“自定义”选项;
(3)、在弹出的对话框中设置想要的属性:
(4)、点击确定:
从以上分析得出:
2007年,几所高校理科录取分数普遍高于文科分数,几所高校在不同省市理科录取分数普遍在600分以上。
人大的录取分数标准差最小,说明人大在各个省录取分数波动不大;
相反,中国科学技术大学录取分数的标准差最大,说明中国科技大学文理科录取分数比较大。
5、对六所高校理科录取分数进行参数估计:
(1)、筛选出理科项;
(2)、建立一个参数估计的函数表单;
(3)、计算各项数值:
总体方差已知,均值的置信区间估计
样本统计量
样本个数
6
样本均值
609.25
用户输入
总体标准差
36.14727
置信水平
0.95
计算结果
抽样标准差
26.1411
Z值
-0.20083
置信区间半径
25.04832
置信区间上限
634.2983
置信区间下限
584.2117
(三)、意见和建议:
总的来说,统计学实验这门课我认为是非常有价值的,而且课堂纪律,老师讲课方面都很好,但还是提几个建议,希望能让这门课变得更加完美:
(1)、课堂上讲的知识点太局限,每个实验不一定只是针对一组数据进行分析,也不应该只为了得到一组数据分析结果为目的,而要多方面讲解这类知识的运用,更多的交给大家实际运用软件解决实际问题的能力。
(2)、这是一门很有实用价值的课程,不应该只为了达到教学任务,而是要让同学们学到真正的实用技巧
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 实验 报告