数学统计学实验报告.docx
- 文档编号:7123198
- 上传时间:2023-01-20
- 格式:DOCX
- 页数:25
- 大小:862.23KB
数学统计学实验报告.docx
《数学统计学实验报告.docx》由会员分享,可在线阅读,更多相关《数学统计学实验报告.docx(25页珍藏版)》请在冰豆网上搜索。
数学统计学实验报告
统计学实验报告
一、实验步骤总结
实验一、数据的搜集与整理
(一)、数据的搜集
1、间接数据搜集:
方法一:
直接进入专业数据库网站查询数据。
如进入中华人民共和国国家统计局。
方法二:
通过网络获取二手数据的方式即使用搜索引擎。
比如,可以使用谷歌网站,搜索成都市2011年经济数据。
2、直接数据搜集:
途径:
科学实验、观察研究、直接调查
科学实验需要复杂的统计程序去设计,而合适的实验设计又属于专门的学科,因此,在此不是我们研究的对象;
观察研究是通过直接观察某一行为来搜集数据;
直接调查通过设计调查问题的方式,来获取对应数据,它主要包括普查、重点调查、典型调查、统计报表等调查方式。
一般情况下以直接调查途径中的抽样调查为主要调查方式。
抽样调查搜集数据的具体步骤:
(1)、调查方案设计
(2)、调查问卷设计(明确目的、明确数据搜集方法、征询意见、修改)
(3)、问卷发放与收回
(二)、数据的整理
一般数据的初步处理:
编码、录入、导入、筛选、排序、保存数据文件
注意:
对于相对地址和绝对地址的区别与应用
步骤:
1、数据编码:
用特写的数字来表示的一种技术,一个码点代表一条信息记录(系统性、标准性、实用性、扩充性、效率性)
2、数据的录入(注意对于快捷键的使用,例如单元格的切换可以使用鼠标,也可以在激活一个单元格以后用Enter键(或者Tab)键,向下(或者向右)切换单元格。
在单元格内部的换行可以使用“Alt+Enter”。
此外要注意Excel在简单复制数据时不能保证格式的完整性,这个时候,就需要单击鼠标右键,使用“选择性粘贴”,进行设置来实现复制的格式要求。
)
3、数据的导入
方法一:
文件—打开”菜单,打开“打开”对话框,在文件类型下拉框中选中所有文件,然后找到你想要文件的位置,双击鼠标左键或单击打开按钮,就可以进入导入向导。
方法二:
使用“数据—导入外部数据—导入数据”菜单,打开“选取数据源”对话框,在文件类型下拉框中选中所有文件。
4、数据的筛选(在excel中提供了以下两种数据的筛选操作)
自动筛选(用于简单数据筛选):
(1)、选择“数据-筛选-自动筛选”菜单
(2)、通过每列第一个单元格下拉箭头确定筛选数据位置
高级筛选:
(1)、选择“数据-筛选-高级筛选”菜单,进入高级筛选区
(2)、选择区域确定筛选数据条件区域
5、数据的排序
数据的排序是将数据的次序排列整理并显示出来的过程,排序功能主要靠“升序排列”或“降序排列”工具按钮和“数据—排序”菜单实现。
(1)一般排序:
选中区域,使用“数据-排序”菜单,打开“排序”,录入主关键词、次要关键词和第三关键词的条件设置
(2)自定义排序:
使用“工具-选项”菜单,打开“选项”,点击“自定义序列”,在“输入序列”中手工输入排序次序。
6、数据文件的保存
可以使用“保存”工具按钮,或者“文件-保存”菜单,也可以使用“文件-另存为”菜单。
实验二、描述数据的图表方法(以数值数据的图表为主要)
(一)、频数频率表(Frequency函数制作法)
频数频率表是数值型数据分成有序组必须注意选择合理的组数,确定合理的组宽确定每组的边界以避免重复。
依据Frequency函数来获取频数频率表:
1、激活多个单元格并输入数据
2、选中未使用的单元格,点击函数调用卡片打开“插入函数”对话框从选择类型下拉框选中“统计”,在选择函数框中选择Frequency函数。
(注:
函数只能在激活的单元格里使用)
3、点击“插入函数”对话框确定按钮进入“函数参数”对话框。
出现参数date-array用来计算频率的一个数组,或对数组单元区域的引用,参数bins-array是数据接收区间,为一数组或对数组区域的引用,设置对date-array进行频率计算的分段点。
(二)、直方图
1、激活单元格并输入两列数据;
2、打开“工具”—“数据分析”—“直方图”
3、单击确定按钮,进入“直方图”分析数据库对话框,输入相关的区域,点击确定,得到直方图分析工具库扩展函数的返回结果。
(三)、饼图
1、单击工具栏中的“图表向导”,在图形类型中选择“饼图”,并对子图表类型进行选择
2、在数据区域中确定自己要进行表示的数据域,一般情况下在“系列产生”中选择“列”(注:
一般进行鼠标选择,是数据的地址更加精确)
3、在“图表选项”中,对图进行“标题、图列、数据标志”的设置
4、对图表的输出位置进行选择,单击“完成”,返回结果,生成饼图
(四)、折线图
1、点击工具栏中的“图表向导”,在图形类型中选择“饼图”,再选择子图表类型进
2、在数据区域中确定数据域,在“系列产生”中选择“列”
3、在“图表选项”中,对图进行“标题、坐标轴、网络线、图列、数据标志、数据表”的设置,从而使得标示出来的折线图完整且美观
4、对图表位置进行确定,单击“完成”,返回结果,生成折线图
(五)、散点图
1、选中作图区域,点击工具栏中的“图表向导”,在图形类型中选择“XY散点图”
2、选择系列产生在“列”,对“图表标题、X轴Y轴”设置,单击完成,图表生成。
实验三、统计数据的描述
(一)使用函数描述(一般情况下都拥有两种方法,导用函数与手工设置)
度量数据集中趋势的方法有均值、中位数、众数。
计算均值有三种方法:
算术平均数(Average)、几何平均数(Geomean)、调和平均数(Harmean)。
调用之前首先要激活一个空的单元格,然后输入函数公式。
1、max-min复合函数(两种方法)
(1)①在录有数据的Excel中选择一个单元格,调用函数,在选择函数中选中其中的max函数
②在数据区域中进行数据的选择,单击确定
③同样,选择一个单元格,调用函数,在选择函数中选中其中的min函数
④在数据区域中进行数据的选择,单击确定
⑤利用前面得出的结果,计算最大值与最小值的差
(2)、在一个空白的单元格中手工输入“=max(bx:
by)-min(bz:
bm)”
2、Percentile(百分位点函数)(两种方法)
(1)①Excel中选择一个单元格,调用函数fx
②在“插入函数”的“或选择类别”中选择“统计”
③选择“percentile”函数,单击确定,进入函数参数的设置
④函数参数的设置,设置完后,单击确定,返回结果
(2)在一个空白单元格里手工进行函数的输入:
“=percentile(bx:
y,c)(c=0.01,0.02,0.03,…0.98,0.99)”
3、quartile函数(四分位点函数)(两种方法)
(1)①Excel中选择一个单元格,调用fx
②在“插入函数”的“或选择类别”中选择“统计”
③选择“quartile”函数,单击确定,进入函数参数页面
④函数参数的设置,单击确实,返回结果
(2)在一个空白的单元格中手工输入:
“=quaritle(bx:
by,c)(c=0,1,2,3,4···)”
(二)描述统计工具(两种方法)
一、1、使用“工具-数据分析”菜单,打开“数据分析”对话框,在分析工具中选择“描述统计”
2、在“描述统计”对话框中进行数据的选择同时选中复选框汇总统计、平均数置信度、第k大值、第k小值,点击描述统计对话框对话按钮,得到描述统计结果(可以选择多组数据进行)
3、进行数据分析的输入、输出选项的设置、点击确定,返回结果
二、手工输入(例:
计算变异系数)“=stdev(bx:
ix)/average(bx:
ix)”,
实验四、参数估计
(一)抽样
1、点击菜单栏的“工具—数据分析”菜单
2、在对话框中选择“抽样”
3、如上图,在“输入区域”、“输出区域”进行域的选择
4、点击“抽样”对话框的确定按钮,返回结果
(二)参数估计
输入公式和函数,进而进行点估计,区间估计等。
(1)点估计问题,就是用样本函数计算出的样本估计量值,直接代表对应总体参数的值。
(2)区间估计问题:
1、在总体标准差已知,对均值的置信区间进行区间估计。
使用函数CONFINDENCE(alpha,standard-dev,size)最后,进行对数据的保存。
可以使用“保存”工具按钮,或者“文件-保存”菜单,或者使用“文件-另存为”菜单。
其中使用函数表单进行参数区间估计在excel中常用。
表单使用步骤:
第一步:
使用“插入—名称—指定”菜单
第二步:
打开“指定名称”对话框,选择“首行”复选框,点击确定就完成了对数据的命名
第三步:
构建函数表单框架:
大样本抽样以样本均值推断总体均值
样本统计量
样本个数
=Count(样本数据)
样本均值
=Average(样本数据)
用户输入
总体标准差
置信水平
计算结果
抽样标准差
=总体标准差/Sqrt(样本个数)
Z值
=ABS(Normsinv((1-置信水平)/2))
置信区间半径
=Z值*抽样标准差
置信区间下限
=样本均值-置信区间半径
置信区间上限
=样本均值+置信区间半径
第四步:
输入框架下对应的数据函数公式,使用Count,Average,ABS,Normsinv.等函数。
其中ABS(number)函数返回数字的绝对值,number可以是任意有效地数值表达式。
Normsinv(probability)函数返回标准正态累积分布函数的反函数值,probability是正态分布的概率值。
2、在总体标准差未知,对均值的置信区间进行区间估计。
随机变量X服从正态分布,则统计量服从自由度为n-1的t分布。
(1)第一步第二步同上,但是表单应构建为
样本统计量
样本个数
=Count(样本数据)
样本均值
=Average(样本数据)
样本标准差
=Stdev(样本数据)
用户输入
置信水平
计算结果
抽样标准差
=样本标准差/Sqrt(样本个数)
自由度
=样本个数-1
T值
=tinv(1-置信水平,自由度)
置信区间半径
=T值*抽样标准差
置信区间下限
=样本均值-置信区间半径
置信区间上限
=样本均值+置信区间半径
第三步:
输入框架下对应的数据和函数公式。
在函数表单中,TINV(probability,degrees-freedom),probability为对应双尾t分布的概率,也就是显著性系数,degrees-freedom为分布的自由度。
(2)“描述统计”对话框的“平均数置信度”复选框
“描述统计”对话框的“平均数置信度”复选框也能返回置信区间半径,使用“工具—数据分析”菜单,打开“数据分析”对话框,从分析工具栏下框中选择“描述统计”,点击确定进入“描述统计”对话框,输入区域点击右侧箭头,选中一列单元格;输出区域选择一个未使用的单元格。
“汇总统计”、“平均置信度”、“第K大值”、“第K小值”中只选中“平均值置信度”复选框,保持默认值是95%,点击确定按钮,得到返回结果。
总体方差的估计,就是以样本方差来推断总体方差。
对于来自正态总体的简单随机样本,抽样分布服从自由度为n-1的卡方分布,
样本统计量
样本个数
=Count(样本数据)
样本方差
=Var(样本数据)
用户输入
置信水平
计算结果
自由度
=样本个数-1
ɑ/2卡方值
=Chiinv((1-置信水平)/2,自由度)
1-ɑ/2卡方值
=Chiinv(1-(1-置信水平)/2,自由度)
置信区间下限
=自由度*样本方差/(ɑ/2卡方值)
置信区间上限
=自由度*样本方差/(1-ɑ/2卡方值)
函数表单使用Chiinv(probability,degrees-freedom)函数来计算卡方值,probability是卡方分布的单尾概率,degrees-freedom为自由度。
两个总体方差之比的区间估计,就是用两个样本方差之比对总体方差之比进行估计,两个样本方差之比的抽样分布服从自由度为n1-1和n2-2的F分布。
其函数表单框架以及对应输入的函数公式如下:
样本统计量
样本1个数
=Count(样本数据1)
样本2个数
=Count(样本数据2)
样本1方差
=Var(样本数据1)
样本2方差
=Var(样本数据2)
用户输入
置信水平
计算结果
第一自由度
=样本1个数-1
第二自由度
=样本2个数-1
ɑ/2F值
=Finv((1-置信水平)/2,第一自由度,第二自由度)
1-ɑ/2F值
=Finv(1-(1-置信水平)/2,第一自由度,第二自由度)
置信区间下限
=样本1方差/(样本2方差*(ɑ/2F值))
置信区间上限
=样本1方差/(样本2方差*(1-ɑ/2F值))
使用Finv(probability,degrees-freedom1,degrees-freedom2)来计算F值,参数probability是累积F分布的概率值,degrees-freedom1是分子自由度,degrees-freedom2是分母自由度。
实验五、假设检验
(一)
1、点击“工具”,选择“数据分析”
2、选择相应的假设检验工具
3、进行相关的数据输入
4、利用函数表单进行假设检验
注:
函数表单构建的基本思路是:
(1)、确定需进行假设检验的总体参数
(2)、确定抽样样本统计量及其服从的分布
(3)、进行假设设计(单侧,双侧)
(4)、确定置信水平
(5)、计算检验统计量
(6)、计算置信水平下的检验区间(或检验临界值)
(7)、比较检验统计量与检验区间(或检验临界值),得出结论
(二)
1、点击“工具”,选择“数据分析”
2、选择相应的假设检验工具,“双样本平均差分析”
3、进行相关的数据输入
注:
主要分析工具库:
Z-检验:
双样本均值分析
F-检验:
双样本方差
t-检验:
双样本等方差假设
t-检验:
双样本异方差假设
t-检验:
成对双样本均值分析
实验六、方差分析
(一)单因素方差分析
1、使用菜单栏的“工具--数据分析”选择“方差分析:
单因素方差分析”,点击“确定”打开“方差分析:
单因素方差分析”对话框。
2、在“输入区域、输出区域”进行选择,分组方式选择“列”单选框;输入区域数据包含标志,选中“标志位于第一行”复选框
3、a框默认显著性系数为“0.05”输出区域点击右侧箭头选择F1单元格,点击“方差分析:
单因素方差分析”对话框确定按钮,返回结果。
注:
单因素的分析要满足相关的三个假设前提
(1)数据的随机性和独立性
(2)数据的正态性
(3)方差的一致性
此外,
(1)由方差分析表中的统计量F与F临界值比较。
前者大则说明分类自变量对数值型因变量具有显著影响;反之,则说明分类自变量对数值型因变量影响不显著。
(2)由P值和给定的显著性系数α比较。
前者小则说明分类自变量对数值型因变量具有显著影响;反之,则说明分类自变量对数值型因变量影响不显著。
附:
单因素方差分析表
差异源
离差平方和SS
自由度Df
均方MS
统计量F
P值
F临界值
组间
SSA
k-1
MSA
MSA/MSE
组内
SSE
n-k
MSE
总计
SST
n-1
——
——
—
——
(二)双因素方差分析(与单因素方差分析基本相同)
1、无重复双因素方差分析(各个因数相互独立)
(1)、点击菜单栏的“工具”-数据分析”选择“方差分析之无重复双因素分析
(2)、选中标志对话框
(3)、a默认为“0.05,返回结果
无重复双因素方差分析表:
差异源
离差平方和SS
自由度Df
均方MS
统计量F
P值
F临界值
行因素
SSR
k-1
MSR
FR
列因素
SSC
r-1
MSC
FC
误差项
SSE
(k-1)*(r-1)
MSE
—
总计
SST
kr-1
—
—
另:
(1)由方差分析表中的统计量F与F临界值比较。
前者大则说明分类自变量对数值型因变量具有显著影响;反之,则说明分类自变量对数值型因变量影响不显著。
(2)由P值和给定的显著性系数α比较。
前者小则说明分类自变量对数值型因变量具有显著影响;反之,则说明分类自变量对数值型因变量影响不显著。
2、可重复双因素方差分析
(1)、点击菜单栏的“工具-数据分析”,选择“方差分析:
可重复双因素分析
(2)、选中标志对话框
(3)、a默认为“0.05,返回结果
(4)、与其他不同的是需要在“每一样本的行数”上的填写:
每一行因素重复试验的次数
差异源
离差平方和SS
自由度Df
均方MS
统计量F
P值
F临界值
行因素
SSR
k-1
MSR
FR
列因素
SSC
r-1
MSC
FC
交互作用
SSRC
(k-1)*(r-1)
MSRC
FRC
误差项
SSE
kr(m-1)
MSE
—
总计
SST
krm-1
—
—
以上分析注意不要把因素名称选在其中。
注:
通常分别取α=0.05和α=0.01,按F所满足的不同条件作出不同的判断:
1、F≤F0.05不显著
2、F0.05 3、F>F0.01高度显著(可用“**”表示) 另: (1)由方差分析表中的统计量F与F临界值比较。 前者大则说明分类自变量对数值型因变量具有显著影响;反之,则说明分类自变量对数值型因变量影响不显著。 (2)由P值和给定的显著性系数α比较。 前者小则说明分类自变量对数值型因变量具有显著影响;反之,则说明分类自变量对数值型因变量影响不显著。 二、实验心得报告 (一)心得体会 虽然只是短短的6讲课,但是对我们的整个统计学的学习很重要。 其实我们总是说中国的教育模式不好,埋没了学生的动手实践能力,但是在我看来,我国的教育模式在一点点改善,老师的教学方式也在逐渐更近,学生的动手机会也越来越多。 随着科学技术的发展,尤其是在科学领域,人的种种成就越来越依赖于先进的科学技术,而统计软件的应用正是减轻了统计工作的难度,因此,掌握这门技术可想而知对我们将来的工作显得十分重要。 统计学是指导我们在日常工作生活中如何进行数据资料的收集、整理和分析的一门方法论科学。 对统计数据进行处理一般需要借助一定的统计分析工具来完成。 因此,统计学试验是运用Excel的统计分析功能,进行数据的搜集整理和显示.并进行统计数据的录入、分组、汇总及各种常用统计图表的绘制,它通过一系列的抽样设计、样本统计量的构造和计算以及检验和概率推断,帮助我们实现对总体参数的近似估计,从而在有限经验样本的基础上实现对总体或现实世界的认识。 统计从统计方法构成划分为两大部分内容,分别是描述统计和推论统计,描述统计又包括了统计图表、差异量数、集中量数、相对量数、相关量数等五小部分。 推论统计部分包括推断统计的数学基础、参数估计、假设检验、方差分析、回归分析、卡方检验和非参数检验七部分。 两大部分再划分为四个部分: 统计的基础、统计检验、参数估计、回归分析。 统计基础部分包括描述统计整体和推断统计中的数学基础;统计检验包括参数检验和非参数检验,而参数检验又分为假设检验和方差分析,非参数检验包括卡方检验和大纲中非参数检验部分。 我认为统计学上机实验的目的主要是让我们学生巩固和运用所学的基础知识和基本技能,建立统计意识和思想,运用收集数据的方法,并能够根据数据的特点选用恰当的统计方法进行分析和推断,获得相关经验,进一步理解统计的特点与规律,培养与提高学生独立从事统计工作的能力,并使学生接受深刻的专业思想教育。 通过学习数据的搜集与整理,我们基本上能够熟练地运用excel的操作界面,并且完成了数据的输入、导入、保存、编码、分类筛选、排序等数据处理工作。 通过实验二,我们学会了描述数据的图表方法,将数据转化成为直观的统计表和生动形象的统计图。 通过实验三,数值型描述度量的学习,我们学会了应用统计软件,描述统计数据的集中程度、离散程度、分布偏态及峰度等分布特征。 通过实验四,我掌握了excel中应用函数表单进行参数估计的方法和步骤,并且在抽样数据获取的基础上,计算样本统计量,对对应总体参数进行区间估计。 通过实验五,我学会了应用函数表单进行假设检验。 通过实验六,我初步掌握了应用工具库进行方差分析的方法和步骤。 在此,通过以下几个具体的实验数据来进行实验的说明。 1.数据筛选(筛选大于8000的数据) 2.数据的排序(按新政策实施后的升序排列) 3.新政策实施前后柱状图 4. 5.数值型描述度量。 6.用描述统计工具分析样本数据 7.方差分析 以上为整个实验的过程。 当然,在实验的过程中,我们也遇到了种种问题。 最主要的就是由于统计学理论知识部分不扎实,因此课程到后面的方差分析和假设检验的部分感觉比较困难,因此感觉十分的恼火,而且自己也没有花费更多的实践区巩固所学知识,导致的结果就是最后做实验报告时发现自己还得从头再来,就像零基础的学生似的。 因此,此次实验不仅让我学到了统计学的相关知识,而且更使我明白作为一名学生,如果想要深入研究一些理论必须能够静得下心来,仔细琢磨。 统计学跟其他学科不一样,它是建立在数理统计基础之上的,因此也需要我们的理科思维比较多,通过一学期的实验课程又加强了我的动手操作能力,真的是收益匪浅。 不过,通过实验过程的进行,我对统计学的有关知识点的复习也与之同步。 在将课本知识与实验过程相结合的过程中,实验步骤的操作也变的得心应手。 也给了我们一个启发,在实验前应该先将所涉内容梳理一遍,带着问题和知识点去做实验可以让我们的实验过程不在那么枯燥无谓。 同时在实验的同步中亦可以反馈自己的知识薄弱环节,实现自己的全面提高。 (二)建议 总的来说,这6节课上的十分满意。 首先,真的发自内心感谢老师对我的帮助。 谢谢老师在我们问及问题时不厌其烦地重复自己已经讲过的东西。 在这6讲课中,老师就统计学原理实验课程中要求掌握的6个实验为我们进行了细心讲解的。 但是,对于我们来说,这一学期,初次与统计学接触,真的不是那么熟稔,感觉学习的时间是特别的不够用,而且统计实验的课程容量虽然不大,但是对于理论知识掌握不熟练的我们来说十分困难,需要我们去吸收和消化的东西特别的很多。 要想真正掌握并应用这门学科,在以后的学习道路上,我们还应该要多练习、多操作,达到学以致用的效果。 在此对于本门课程,提出一些相关的建议。 首先,似乎听起来一个微不足道的问题,但我还是认为有必要拿出来说一下。 实验室的仪器设备反应慢不要紧,很现实的问题是电脑不够用,不能达到一人一机,因此我们需要提前很久去占座位,我认为这样既浪费我们的时间由不利于每个学生都很好的接受老师的知识。 希望老师能够像学院领导反映情况。 其次,由于统计学是一门比较繁杂的课程,学习的过程需要的是耐心,但是每个人在电脑面前坐久了必然会疲劳,接受知识的效率也变低了,虽然老师讲得很有激情,但是学生可能在后期有听不进去的可能,因此我觉得对于我个人来说,如果老师能讲一点让我们操作一会,弄明白后再进入下一个环节效果可能会好。 再次,我们都知道实验课的关键还是在于对于实验的操作,在实验课的上课期间,老师用在讲解方面的时间比较多,当然不是累赘,但是我们总感觉练习的时间是特别不
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 统计学 实验 报告