高级心理统计学第1讲.docx
- 文档编号:8708874
- 上传时间:2023-02-01
- 格式:DOCX
- 页数:11
- 大小:261.23KB
高级心理统计学第1讲.docx
《高级心理统计学第1讲.docx》由会员分享,可在线阅读,更多相关《高级心理统计学第1讲.docx(11页珍藏版)》请在冰豆网上搜索。
高级心理统计学第1讲
高级统计与SPSS应用
傅亚强
2013年2月
前言
Inthehistoryofeverycivilization,ideashaveproventobemoredurablethandata(Randall,1926).
Itmaybetruethatwithoutgreatideas,therearenogreatdata(Butterfield,1968),becauseideasarewhatmakedatameaningful.
一、学习本课程的要件
1、要有耐心:
充分理解课程的复杂性和冗长性,仔细阅读相关书籍;
2、要将学习的重点放到:
各种统计方法的应用条件(策略性知识-什么数据什么时候用什么方法);
3、要将课程学习和自己的课题研究结合起来:
只在实际应用中,才能真正领会统计方法与研究方法的内在意义;
4、要充分阅读各种参考书;
5、要在讨论中发现问题、解决问题。
二、本课程的主要内容简介
表1-1课程框架
章次
内容
一
高级统计之基本概念
二
数据的初步整理
三
假设检验与非参数数检验
四
回归分析
五
因素分析
六
结构方程模型
七
认知与实验心理学数据分析
八
教育心理学数据分析
九
心理健康数据分析
十
社会心理学数据分析
十一
神经认知心理学数据分析
三、课程学习总目标
1、准确掌握各种统计方法的应用条件
2、熟练掌握SPSS的各项统计功能,以及数据的分析Excel
3、能将上述知识应用到科研实践中去
四、心理学研究的特征
1.随机性:
没有一个人能两次跨进同一条河。
多次测量大样本
2.模糊性:
短时记忆容量有限;超长儿童比较自信。
3.条件性:
早期经验对儿童发展的影响,不会单独起作用。
4.逻辑性:
找到现象或特征之间有意义的本质的内在联系。
如压力、期望、能力、自我评价和焦虑之间的关系。
(离散变量连续变量)
5.交互性:
影响人的行为的因素是十分复杂的,一种因素在影响人的行为时,这种影响力会受到其它因素的影响。
变量之间的关系要考虑清楚
6.复杂性:
排除其它解释的高难度性质。
多指标考核,控制好额外变量
(1)比较A、B、C、D4种飞机降落显示格式的使用效率。
(Ponomarenko,1998;Bedny,2004)
图1-1战斗机座舱下视显示画面
(2)最初的几次试验中,A最优,BCD较差
(3)但是后面的试验中,BCD的成绩显著上升,而A的成绩保持最初水平
(4)研究者下结论,A界面不可接受
(5)被试访谈中出现意外,他们认为A最好用,BCD使用起来比较困难,但他们认为这项研究的目的在于考察他们在困难任务中的飞行能力。
而且他们认为BDC最难,只有BCD才能显示他的能力,所以在后面的试验中,他们努力在BCD条件下准确完成任务。
(6)如果以作业绩效为指标,A可能比不过BCD,但是以心理负荷为指标,A就会显示出优势。
(避免自变量发生混淆可以将实验顺序打乱作业绩效过程指标添加生理指标)
第一讲高级心理统计学的基本概念
一、变量
1、变量:
指在数量上或质量上可变的事物的属性。
2、变量的水平:
变量的取值。
3、实验中的几种变量
自变量:
实验者所操纵的,对被试反应产生影响的变量、原因。
因变量:
由操纵自变量而引起的被试者的某种特定反应。
相关变量:
凡是对因变量产生的影响的变量。
额外变量:
某一实验中不用于研究的那些相关变量。
4、变量的随机性
5、中介变量(分析中介变量逻辑分析过程中介变量往往是引发事情的原因)
考虑自变量X对因变量Y的影响,如果X通过影响变量M来影响Y,则称M为中介变量。
图1-2中介变量两例
【讨论】
性别和网络成瘾之间是什么中介变量呢
忽视自变量与因变量间潜在变量的影响,可能会扭曲自变量和因变量的关系。
考虑一个学会感判断(judgmentoflearning,JOL)的准确性和学习成绩关系的例子。
一般认为元认知监控对学习者的学习具有重要作用,然而很多研究却发现,JOL的准确性与学习成绩间的关系并不是想象的那么直接明朗,甚至得出了相反的结论,为什么会如此K.W.Thiede(2003)在对以往研究进行分析与梳理的基础上,通过实证研究解答了这一疑问:
以往研究之所以不能确切描述JOL准确性和学业成绩关系的原因是因为以往研究没有检视学习者的自我调控学习行为在JOL准确性和学习效果间的作用,也即忽视了一个重要的潜在变量。
(陈启山,2006,<心理学研究中应用统计方法应注意的几个问题>)
二、心理学研究数据的性质
从数学的角度来研究社会和自然现象可以把这些现象分为以下三类:
(科学研究的三种)
(1)确定现象:
事前可预言的现象,即在准确地重复某些条件下,它的结果总是肯定的。
如:
在一个标准大气压下给水加热到100℃便会沸腾。
比如质量守恒定律、牛顿定律反映就是这类现象。
研究这类现象的数学工具有数学分析、几何、代数、微分方程等。
(2)随机现象:
事前不可预言的现象,即在相同条件下重复进行试验,每次结果未必相同,或知道事物过去的状况,但未来的发展却不能完全肯定。
如:
以同样的方式抛置硬币却可能出现正面向上也可能出现反面向上;走到某十字路口时,可能正好是红灯,也可能正好是绿灯。
研究这类现象的数学工具是概率论和统计。
(3)模糊现象:
事物本身的含义不确定的现象。
如:
“情绪稳定”与“情绪不稳定”,“健康”与“不健康”,“年青”与“年老”。
研究这类现象的数学工具是模糊数学。
确定性现象与随机现象的共同特点是事物本身的含义确定;随机现象与模糊现象的共同特点是不确定性,随机现象中是指事件的结果不确定,而模糊现象中是指事物本身的定义不确定。
概率论与统计学将数学的应用从必然现象扩大到随机现象的领域,模糊数学则将数学的应用范围从清晰确定扩大到模糊现象的领域。
客观世界作用于事物各个个体的因素分为基本因素和次要因素两类,基本因素决定事物的必然规律,次要因素使事物呈现统计规律。
人们所能认识而且能够控制的因素是基本因素,而大量的次要因素未能为人们所认识或未能被人们所控制,但只要存在次要因素的影响,就必然会有所表现。
比如发射炮弹,其基本因素也是人们所能控制的是它的初始条件--初速、发射角等,这些可以通过弹道方程(必然规律)计算出炮弹的落地点,但炮弹在飞行过程中会受到空气的阻力--风速、风向、空气的湿度、温度等的影响,它们使得炮弹不能落在它的准确的目的地。
科学研究的目的,就是要发现反映事物本质的客观规律,即排除偶然性的掩盖与干扰,为此必须首先认识偶然性。
于是统计学应运而生,统计学不是直接研究事物本质的必然规律,而是通过随机现象来发现事物的统计规律,并把它应用于对客观规律的认识和把握。
【讨论】
心理学研究中遇到的变量是确定的、随机的,还是模糊的
为什么心理学中的现象可以用概率统计方法进行分析
实验中一般会给变量及结果(水平)下操作定义
为了更接近随机数据的要求,心理学研究在采集数据时应特别注意哪些关键点
操作定义信效度实验变量的操纵实验数据是否符合或接近某种概率分布
心理学研究同其他学科一样,都是为了建立现象间的因果关系,那么统计结论在因果关系构建中的作用是怎样的即如何看待统计结果在构建因果关系中的作用
作用微弱(无法直接验证因果关系提供证据)额外变量的控制效果
自变量的操纵是否合理因变量的测量是否合理
三、量化研究设计的比较
1、主要目的
调查法
相关法
实验法
由样本推论总体
对于总体的描述与解释
探讨变量间关系
建立系统知识
探讨因果关系
建立系统知识
2、样本特性
调查法
相关法
实验法
大样本
总体代表性
中型样本
分层抽样
小样本
随机样本、随机分配
3、研究工具
调查法
相关法
实验法
结构化问卷
标准化测验或量表
实验设备与软件
4、研究程序
调查法
相关法
实验法
抽样与调查
抽样理论
测验理论与技术
测验编制与实施
实验设计
实验操纵
5、测量尺度
调查法
相关法
实验法
类别变量为主
连续变量为主
类别自变量
连续因变量
6、统计分析
调查法
相关法
实验法
次数分布
卡方检验
非参数统计
相关分析
回归分析
因素分析
平均数差异检验
方差分析
协方差分析
四、统计学的基本概念
(一)随机变量与误差
1、随机:
事件发生的结果不可预知
2、机率:
事件发生的可能程度
3、误差:
测量结果与变量的真值之间、数学函数与测量结果之间均存在一定的差异。
4、统计模型的目的不在消除或减少误差,而是希望对误差函数的行为有所了解,即尽可能地去解释误差发生的原因。
(二)数据的种类
1、点计数据:
如人数,班级数,男女数等。
2、度量数据:
借助于一定的测量工具或一定的测量标准而获得的。
(1)比率数据:
有绝对零点和等距单位,如身高、体重,反应时,感觉阈值等,差、倍数有意义。
(从零点定义的角度来理解)
(2)等距数据:
有等距单位,但无绝对零点,如温度,各种能力测验分数等,倍数无意义,只有差数才有意义。
(3)顺序数据:
既无相等单位,也无绝对零点,如评定等级,喜爱等级,品质等级等,成绩名次等。
3、称名数据:
反映事物在组别、种类上的不同。
不说明事物之间的数量差异,中按事物的性质不同,将被观测事物加以划分。
如:
令男为1、女为0;令实验组为1,控制组为2。
表1-2称名变量
数学成绩
72
89
80
91
87
组别
1
0
1
0
0
【讨论】
常用的统计方法与数据测量水平是否匹配
(三)总体、样本和个体
1、总体:
具有某种特性的一类研究对象的全体。
2、个体:
构成总体的每一个基本元素。
个体不一定是人或物,也可指心理活动,即指某种实验条件下的某一反应,或指每一个实验结果、每一个实验数据等,例如反应时间、推理能力、学习方法等。
故又称为随机事件或样本点,相应地,总体又称为样本空间。
3、样本:
从总体中抽取的作为观察对象的一部分个体。
总体的性质是由组成总体的各个体的性质而定,所以要了解总体的性质,必须对每一个个体进行观测,这是最好的办法,但是实际上这是做不到的,也没必要做到。
在心理研究及应用中,一般通过对样本的观察测量来达到对总体进行研究的目的。
4、样本容量:
样本中所包含的个体数目,用N或n表示。
样本越大,越能代表总体,因此,样本容量不同,统计方法也不一样。
5、有限总体和无限总体。
总体本身的大小,有限还是无限,这要依据所研究的问题的推理范围而定,同时总体与样本也可以互相转换变化。
【讨论】
抽样调查中得到的样本常常是有偏样本和小样本,是否有问题
如何减少这些问题对因果推论的负面影响
中心极限定理对取样的启示。
利用样本统计量对总体参数进行估计时的误差主要是偏差(bias)和变异(variability)。
可以采用以下手段以减少这些误差:
(1)尽量使用随机样本。
说来非常简单,但在现实世界中,简单随机样本一点也不简单;
(2)样本要足够大。
抽样调查的取样缺陷是任何统计方法也无法事后弥补的,所以,在面对调查结果及相信它之前应该思考以下几个问题:
(1)谁做的调查
(2)调查的总体是什么(3)样本是怎样选取的(4)样本有多大(5)用什么方式联络被试获得的数据(6)调查的回应率是多少
七、统计方法选择的基本依据
1、研究目的
(1)描述性课题:
描述统计,因素分析,聚类分析
(2)因素型实验:
总体平均数差异检验,方差分析,非参数检验
(3)函数型实验:
相关分析,回归分析,路径分析
(4)减少数据维度:
因素分析
(5)被试或样品分类:
聚类分析,判别分析
2、数据的测量层次
(1)计数数据:
百分比,列联相关,χ2检验
(2)等级数据:
中数,百分位数,等级相关,非参数检验
(3)等距变量:
算术平均数,标准差,积差相关,t检验,Z检验,F检验,方差分析,回归分析
3、概率分布类型
图1-3数据分布
(1)正态分布:
参数方差分析,回归分析,因素分析
(2)非正态分布:
非参数分析
4、研究设计
(1)样本数目
小样本(N<30):
非参数检验
大样本(N>30):
参数检验
(2)自变量水平的数量
2个水平:
平均数假设检验
2个水平以上:
方差分析
(3)自变量的数目
单一自变量:
单因素方差分析
多自变量:
多因素方差分析,多元回归分析,
(4)因变量的数目
单一因变量
多因变量:
路径分析
(5)研究设计类型
完全随机设计:
独立样本t检验
重复测量设计:
相关样本t检验
八、心理研究的数据统计分析步骤
图1-4假设检验的过程
图1-5方差分析的方法选择过程
【参考书目】
王重鸣,心理学研究方法,人民教育出版社。
杨治良主编,实验心理学,浙江教育出版社。
张敏强,教育与心理统计学,人民教育出版。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高级 心理 统计学