中南财大spss实验报告2下载.docx
- 文档编号:480520
- 上传时间:2022-10-10
- 格式:DOCX
- 页数:21
- 大小:507.70KB
中南财大spss实验报告2下载.docx
《中南财大spss实验报告2下载.docx》由会员分享,可在线阅读,更多相关《中南财大spss实验报告2下载.docx(21页珍藏版)》请在冰豆网上搜索。
中南财大spss实验报告2下载
《统计分析软件》实验报告
实验序号:
B0901152-2 实验项目名称:
描述统计分析过程
学号
姓 名
专业、班
实验地点
文波机房
指导教师
杨超
时间
20131005
一、实验目的及要求
实验目的:
(1)掌握数据集中趋势和离中趋势的分析方法;
(2)熟练掌握各个分析过程的基本步骤以及彼此之间的联系和区别。
实验要求:
(1)根据已经建立的数据文件作频数分析、描述分析;
(2)对数据文件作数据探索性分析和平均数分析。
(3)根据软件运行结果,对其进行分析与评价。
二、实验设备(环境)及要求
微型计算机,SPSS、EViews等统计分析软件
三、实验内容与数据来源
1.下表是一电脑公司某年连续120天的销售量数据(单位:
台)。
试对其进行频数分析,计算均值、中位数、众数、四分位数,标准差、最大值、最小值、全距,偏度、峰度系数;画出直方图、茎叶图、箱线图;解释结果并说明其分布特征。
234
159
187
155
158
172
163
183
182
177
156
165
143
198
141
167
203
194
196
225
177
189
203
165
187
160
214
168
188
173
176
178
184
209
175
210
161
152
149
211
206
196
196
234
185
189
196
172
150
161
178
168
171
174
160
153
186
190
172
207
228
162
223
170
208
165
197
179
186
175
213
176
153
163
218
180
192
175
197
144
178
191
201
181
166
196
179
171
210
233
174
179
187
173
202
182
154
164
215
233
168
175
198
188
237
194
205
195
174
226
180
172
211
190
200
172
187
189
188
195
2.下表是某班同学月生活费资料,试对其进行描述分析,并对结果作出说明。
月生活费(x)
人数(f)
300以下
2
300-400
3
400-500
6
500-600
9
600-700
7
700-800
5
800-900
4
900以上
2
合计
38
3.某项调查要研究城市居民居住年限的长短与对该地区百货公司熟悉程度之间的关系。
随机调查266户居民,收集数据如下表:
(1)针对上述问题及数据应采用什么统计分析方法?
(2)说明表中数据如何录入到spss软件中,并将数据输入到数据编辑窗口,数据文件保存为“data2_3.sav”。
(3)分析城市居民居住年限的长短与对该地区百货公司熟悉程度之间是否相关。
四、实验步骤与结果
第一题
操作步骤:
1.在进行分析之前,先将数据导入SPSS。
先将word数据复制到excel,并排成一纵列,保存为文件《no2.xls》:
表1excel文件《no2.xls》
2.打开SPSS21.0,打开文件《no2.xls》读取数据:
图1读入excel表中的数据
3.选择“分析”→“描述统计”→“频率”命令,弹出如下图的对话框。
点击“频率”对话框,选择变量V1,点击中间的右箭头,使变量V1进入右边的列表框:
图2“频率”对话框
4.点击“统计量”按钮,弹出如下对话框。
选中“四分位数”、“均值”、“中位数”、“众数”、“标准差”、“范围”、“最小值”、“最大值”、“偏度”、“峰度”。
图3“频率:
统计量”对话框
5.点击“继续”,回到《频率:
统计量》界面。
点击“图标”按钮,选择“直方图”,点击继续。
回到《频率:
统计量》界面,点击“确定”,等待分析结果。
0
图4“频率:
图表”对话框
结果分析
1.描述性统计表
表2描述性统计表
从表1中可以读出一下信息:
有效样本数为120,没有缺失值。
销售平均值为184.57,标准差为21.681,最大值为237,最小值为141。
2.频数分布
表3频数分布表(部分)
表2给出了电脑公司的销售额的频数分布。
该表从左到右分别是有效地样本值、频数、频数占总数的百分比、有效数占总数的百分比、累计百分比。
3.直方图
图5直方图
图6是电脑公司销售额的直方图,从图中可以看出销售额近似服从正态分布,而且集中趋势集中在175。
4.茎叶图
表6茎叶图
图是数据的茎叶图。
从左到右分别是频数、茎、叶三部分。
其中茎代表数值的整数部分,叶代表数值的小数部分。
由每行的茎叶构成的数字再乘以茎宽,则为实际数据的近似值。
5.箱线图
图7箱线图
图8给出了电脑公司销售额数据的箱线图,其中箱为四分位间距的范围,所谓四分位距就是百分数75代表的值减去百分数25代表的值。
中间的粗线表示平均数,上面和下面的细线分别表示最大值和最小值。
第二题
操作步骤:
1.将word中的数据(去除最后“合计”一行)复制粘贴到excel表格中,并保存为文件《no2-2.xls》。
表4excel文件《no2-2.xls》
打开SPSS21.0,读入文件《no2-2.xls》中的数据,如图8:
图8SPSS读入数据后界面
选择“分析”→“描述统计”→“描述”命令,弹出如下窗口:
图9“描述性”窗口
在“描述性”对话框的左侧列表框中选择“人数(f)”,单击中间的右箭头,使之进入“变量”列表框。
选择“将标准化得分另存为变量”复选框。
图10“描述性”窗口II
单击“描述性”对话框右上角的“选项”按钮,弹出“描述性”对话框。
选择“均值”,在“离散”选项组中选择“标准差”、“方差”、“范围”、“最小值”、“最大值”、“均值的标准误”复选框。
在“分布”选项组选择“峰度”、“偏度”复选框。
在“显示顺序”选项组中选择“变量列表”复选框。
设置完毕后,单击“继续”按钮返回“描述性”对话框。
图11“描述:
选项”对话框
单击“确定”按钮,等待输出结果。
结果分析:
1.如表5,样本个数为8个,极差为7,最小值为2,最大值为9,均值为4.75,均值的标准误为0.881.标准差为2.493,方差为6.214,偏度系数为0.526,峰度系数为-0.653。
表5描述统计量
描述性统计具有将原始数据转换成标准化的取值并以变量形式存入当前的数据库,如图12:
图12原始数据标准化后的数据窗口
第三题
答:
(一)题干中的问题及数据应采用列联表分析方法。
(二)1.为了将数据录入SPSS软件中,先新建SPSS文件,在变量视图窗口将“熟悉程度”定义为字符型变量,将“居住时间”和“计数”定义为数值型变量,对两个变量进行相应的值标签操作,对“熟悉程度”变量用“1”表示“不熟悉”,用“2”表示“熟悉”;对“居住时间”变量用“1”表示“小于13年”,用“2”表示“13-30年”,用“3”表示“30年以上”,如下图:
图13变量视图
返回数值视图,录入相关数据。
录入完成后,数据窗口如下图:
图14数据视图
将文件保存为《data2_3.sav》。
图15保存的文件
(三)对数据展开分析,步骤如下:
1.对数据进行预处理,以计数变量对升学变量进行加权。
选择“数据”→“加权个案”命令,弹出如下对话框。
在“加权个案”对话框中选中“加权个案”单选按钮,然后在左侧的列表框中选中“计数”,单击中间右箭头,使之进入“频率变量”列表框。
单击确定按钮,完成数据预处理。
图16“加权个案”对话框
2.选择“分析”→“描述统计”→“交叉表”命令,弹出如下对话框。
图17“交叉表”对话框
选择“熟悉程度”并单击中间右箭头使之进入右侧“行”列表框。
选中“居住时间”并单击中间第二个右箭头使之进入“列”列表框。
因为没有别的变量参与列联表分析,所以不需要定义层控制变量。
最后选中“显示复式条形图”复选框。
如下图:
图18“交叉表”对话框II
3.选择检验统计量的计算方法。
单击“精确”按钮,选中“仅渐进法”单选按钮,单击“继续”按钮返回“交叉表”对话框。
如下图。
图19“精确检验”对话框
4.选择相关统计检验。
单击“交叉表”对话框右侧的“统计量”按钮,在该对话框中可以设置相关统计检验。
选中“卡方”复选框,用于检验“熟悉程度”与“居住时间”之间是否相关。
如下图:
图20“交叉表:
统计量”对话框
5.选择列表框单元格中需要计算的指标。
单击“交叉表”对话框右侧的“单元格”按钮,在该对话框中设置相关输出内容。
在“计数”选项组中选中“观测值”复选框,在“百分比”选项组中选择“行”、“列”、“总计”复选框,在“非整数权重”选项组中选中“四舍五入单元格计数”复选框。
设置完毕后,单击“继续”按钮返回“交叉表”对话框。
图21“交叉表:
单元显示”对话框
6.最后确定排序方法。
单击“交叉表”对话框右侧的“格式”按钮,在该对话框中可以设置行变量的排序方式。
这里选中“升序”单选按钮。
图22“交叉表:
表格”对话框
7.设置完毕,单击“确定”按钮,等待输出结果。
结果分析:
1.数据信息:
如下表所示,本题有样本数266,没有缺失值。
表6样本统计:
案例处理摘要
2.列联表
如表所示,居住时间小于13年的人中,46.4%的人熟悉程度为不熟悉,53.6%的人熟悉程度为熟悉;居住时间为13-30年的人中,39.1%的人熟悉程度为不熟悉,60.9%的人熟悉程度为熟悉;30年以上的人中,50.4%的人熟悉程度为不熟悉,49.6%的人熟悉程度为熟悉。
表7列联表
3.卡方检验结果
如表所示,卡方检验结果:
表8卡方检验
可以看出,卡方值为14.201,自由度为2,双侧概率为0.001.由于p值为0.001,小于0.05,可以认为熟悉程度与居住时间有显著关系。
五、分析与讨论
本次实验内容为描述性统计分析,分为“频数分析”、“描述性分析”和“列联表分析”三个部分。
频数分析是描述性分析中常用的方法之一,通过频数分析,我们得到了详细的频数表和平均值、最大值、最小值、方差、标准差、极差、平均数标准误、偏度系数和峰度系数等重要的描述统计量。
还可以进一步分析得到合适的统计图,使我们对数据的分布特征有初步的认识。
描述性分析的特色是通过分析,可以得到由原始数据转化成的标准化的取值,并且可以将标准化值以变量的形式存入数据库,以便进一步分析。
相关描述统计量主要有平均值、最大值、最小值、方差、标准差、极差、平均数标准误、片对系数、峰度系数等,分析的功能也是比较全面有用的。
列联表分析是通过多个变量在不同取值情况下的数据分布情况,从而进一步分析多个变量的一种描述性分析方法。
列联表指定了两个以上的变量,在老师给出的题目中分别为行变量和列变量(如果需要还可以进行分层分析)。
通过列联表分析,不仅可以得到交叉分组下的频数分布,还可以通过分析得到变量之间的相关关系。
此次实验让我掌握了数据描述性统计分析的软件操作方法,收获非常大。
我将继续深入学习SPSS相关知识,在学习中注重上机操作,提高自己的数据分析能力。
六、教师评语
签名:
杨超
成绩
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中南 spss 实验 报告 下载