第六章---抽样--社会调查与研究方法课件.ppt
- 文档编号:30853204
- 上传时间:2024-03-02
- 格式:PPT
- 页数:173
- 大小:2.24MB
第六章---抽样--社会调查与研究方法课件.ppt
《第六章---抽样--社会调查与研究方法课件.ppt》由会员分享,可在线阅读,更多相关《第六章---抽样--社会调查与研究方法课件.ppt(173页珍藏版)》请在冰豆网上搜索。
社会调查与研究方法社会调查与研究方法主讲:
刘杰ResearchintheSocialSciencesResearchintheSocialSciences第六章抽样1抽样的意义与作用2概率抽样的原理与程序3概率抽样方法4户内抽样与PPS抽样5非概率抽样抽样抽样是研究设计的主要内容之一,也是社是研究设计的主要内容之一,也是社会调查的一个重要步骤,它不仅与研究目的会调查的一个重要步骤,它不仅与研究目的及研究内容紧密相关,而且还直接关系到资及研究内容紧密相关,而且还直接关系到资料的收集、整理与分析,同时它还涉及到整料的收集、整理与分析,同时它还涉及到整个研究的费用以及应用的范围。
个研究的费用以及应用的范围。
在本章中,你们将了解在本章中,你们将了解到社会科学到社会科学家如何通过选择一小部分人进行研究,家如何通过选择一小部分人进行研究,并将结论推及到千百万未被研究的人。
并将结论推及到千百万未被研究的人。
抽样调查(Samplingsurvey)运用一定的方法在调查对象总体中抽取一部分调查对象作为样本,并对样本调查结果来推断总体的方法一、基本术语元素(element)元素是构成总体的最基本单位,是搜集信息的单位和进行分析的基础ElementAnelementisthatunitaboutwhichinformationiscollectedandwhichprovidesthebasisofanalysis.Typically,insurveyresearch,elementsarepeopleorcertaintypesofpeople.However,otherkindsofunitscanconstitutetheelementsforsocialresearch;families,socialclubs,orcorporationsmightbetheelementsofastudy.(Note:
Elementsandunitsofanalysisareoftenthesameinagivenstudy,thoughtheformerreferstosampleselectionwhilethelatterreferstodataanalysis.)总体(population)总体是构成它的所有元素的集合总体通常与构成它的元素(Element)共同定义:
总体是构成它的所有元素的集合,而元素则是构成总体的基本单位。
(一个总体所包含的元素数常用大写字母N表示)PopulationPopulationApopulationisthetheoreticallyspecifiedaggregationofstudyelements.Forexample,specifyingtheterm“collegestudents”wouldincludeaconsiderationoffull-timeandpart-timestudents,degreecandidatesandnon-degreecandidates,undergraduateandgraduatestudents,andsimilarissues.研究总体研究总体是在理论上明确界定的个体的集合体它必须受几个方面的限定:
内容、单位、范围、时间StudyPopulationStudyPopulationAstudypopulationisthataggregationofelementsfromwhichthesampleisactuallyselected.Asapracticalmatter,youareseldominapositiontoguaranteethateveryelementmeetingthetheoreticaldefinitionslaiddownactuallyhasachanceofbeingselectedinthesample.Evenwherelistsofelementsexistforsamplingpurposes,thelistsareusuallysomewhatincomplete.Somestudentsarealwaysomitted,inadvertently,fromstudentroster.Sometelephonesubscribersrequestthattheirnamesandnumbersbeunlisted.Thestudypopulation,then,istheaggregationofelementsfromwhichthesampleisselected.调查总体调查总体是研究者从中实际抽取调查样本的个体的集合体它往往是对研究总体的进一步界定,即对时间、范围做更进一步规定一般地说,样本只能推论调查总体而不是研究总体ObservationObservationPopulationPopulationAnobservationPopulation,orunitofdatacollection,isanelementsfromwhichinformationiscollected.Again,theunitofanalysisandunitofobservationareoftenthesametheindividualpersonbutthatneednotbethecase.Thustheresearchermayinterviewheadsofhouseholds(theobservationunit)tocollectinformationaboutallfamilymembersofthehouseholds(theunitsofanalysis).样本样本(sample)就是从总体中按一定方式抽取出的一部分元素的集合一个样本就是总体的一个子集抽样所谓抽样(sampling),指的是从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程过程抽样是从总体中按一定方式选择或抽取样本的过程抽样单位(samplingunit)抽样单位就是一次直接的抽样所使用的基本单位指在抽样各阶段中考虑选取的某个元素或者某组元素在更复杂的抽样中,需要采用不同层次的抽样单位SamplingUnitSamplingUnitAsamplingunitisthatelementorsetofelementsconsideredforselectioninsomestageofsampling.Inasimple,single-stagesample,thesamplingunitsarethesameastheelements.Inmorecomplexsamples,however,differentlevelsofsamplingunitsmaybeemployed.Forexample,youmightselectasampleofcensusblocksinacity,thenselectasampleofhouseholdsontheselectedblocks,andfinallyselectasampleofadultsfromselectedhouseholds.抽样框抽样框(samplingframe)又称做抽样范围,它指的是一次直接抽样时总体中所有抽样单位的名单SamplingFrameSamplingFrameAsamplingframeistheactuallistofsamplingunitsfromwhichthesample,orsomestageofthesample,isselected.参数值参数值(parameter)也称为总体值,它是关于总体中某一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现在统计中最常见的参数值是某一变量的平均值参数值只有通过对总体中的每一个元素都进行调查或测量才能得到ParameterParameterAparameteristhesummarydescriptionofagivenvariableinapopulation.统计值统计值(statistic)也称为样本值,它是关于样本中某一变量的综合描述是样本中所有元素的某种特征的综合数量表现抽样的目的之一,就是要通过这些样本值去估计和推断各种参数值抽样设计的目标,就是尽可能使所抽取的样本的估计量接近总体的参数值StatisticStatisticAstatisticisthesummarydescriptionofagivenvariableinasample.Samplestatisticsareusedtomakeestimatesofpopulationparameters.抽样误差概率抽样方法很少能提供与所要推论的总体参数值完全相等的统计值SamplingErrorSamplingErrorProbabilitysamplingmethodsseldom,ifever,providestatisticsexactlyequaltotheparametersthattheyareusedtoestimate.Probabilitytheory,however,permitsustoestimatethedegreeoferrortobeexpectedforagivensampledesign.置信水平与置信区间置信水平与置信区间是测量抽样误差程度的两个关键概念我们用置信水平来表示样本统计值的精确度,它是指样本统计值落在参数值某一正负区间内的概率置信区间是某个统计值的扩展,可使我们的置信度提高CCononfidenceLevelsandConfidencefidenceLevelsandConfidenceInIntervalstervalsWeexpresstheaccuracyofoursamplestatisticsintermsofalevelofconfidencethatthestatisticsfallwithinaspecifiedintervalfromtheparameter.Forexample,wemaysayweare95percentconfidentthatoursamplestatisticsarewithinplusorminus5percentagepointsofthepopulationparameter.二、抽样的作用在社会研究中,抽样主要解决的是对象的选取问题,即如何从总体中选山一部分对象作为总体的代表的问题抽样方法是架在研究者十分有限的人力、财力和时间与庞杂、广阔、纷繁、多变的社会现象之间的一座桥梁例:
1984年美国总统选举预测与实际结果比较%里根蒙代尔时代时代/扬基拉维奇扬基拉维奇今日美国今日美国/黑蛇发女怪黑蛇发女怪哥伦比亚广播公司哥伦比亚广播公司/纽约时代周刊纽约时代周刊盖洛普民意测验盖洛普民意测验/新闻周刊新闻周刊实际投票结果实际投票结果盖洛普民意测验盖洛普民意测验/新闻周刊新闻周刊美国广播公司美国广播公司/华盛顿邮报华盛顿邮报哈里斯民意测验哈里斯民意测验罗珀民意测验罗珀民意测验646463636161595959595959575756565555363637373939414141414141434344444545三、抽样的类型抽样方法非概率抽样概率抽样多段抽样系统抽样分层抽样整群抽样简单随机抽样偶遇抽样判断抽样定额抽样雪球抽样一、概率抽样的基本原理“世上没有两片完全相同的树叶”,现实社会中更没有两个完全相同的人。
在各种社会总体都普遍存在异质性的现实面前,严格的概率抽样程序与方法就必不可少。
而概率样本所要反映的正是总体本身所具有的那种内在的异质性结构。
同质性与异质性概率抽样基本前提:
异质性投掷硬币事件发生的客观概率概率抽样的合理性:
随机事件的发展变化规律一个100人组成的总体44位女性汉族44位男性汉族6位女性少数民族6位男性少数民族一个方便的样本:
易得,但没有代表性抽样的最终目的在于通过对样本的统计值的描述来相对准确地勾画出总体的面貌。
概率抽样的方法可以帮助我们实现这一目标。
并且可以对这种勾画的准确程度作出估计。
随机抽取(randomselection)是这一过程的关键。
所谓随机抽取,就是保证总体中的每一个个体都有同等的机会入选样本。
或者说,总体中的每一个成员被抽中的概率相等(也即被抽中的机会相等)。
而且,任何一个个体的入选与否,与其他个体毫不相关,互不影响。
或者说,每一个个体的抽取都是相互独立的,是一种随机事件。
对于投掷硬币的结果(总体)来说,只有正面和反面(个体)两种可能。
每次投掷硬币相当于一次抽样过程(从两种可能性中抽取一种);这种抽样是随机的(两种可能性都可能出现,且出现的机会均等)尽管一次具体的随机抽样(一次投掷)只会有一种结果,或者说出现某一种情况(正面或反面)的概率为100;但是若下次不同的抽样的结果,却总是趋向于两种情况出现的次数各为50即趋向于两种不同结果本身所具有的概率,或者说趋向于总体内在结构中所蕴涵的随机事件的概率。
最好的例子:
投掷硬币这个例子告诉我们,在各种随机事件的背后,存在着事件发生的客观概率,正是这种概率决定着随机事件的发展变化规律。
概率抽样之所以能够保证样本对总体的代表性,其原理就在于它能够很好地按总体内在结构中所蕴涵的各种随机事件的概率来构成样本,使样本成为总体的缩影。
概率抽样的一个基本原则如果总体中的每一个体被抽去为样本的概率相同,那么,从这个总体中抽去的样本就具有对该总体的代表性。
概率抽样的优点概率抽样虽然无法完美地代表总体,但较其他抽样方法更具代表性概率理论使我们能够估计样本的精确度和代表性抽样的独立性要求任何一个元素的抽取都不影响到其他元素被抽取的概率。
放回抽样不放回抽样二、抽样分布抽样分布是根据概率的原则而成立的理性分布。
显示出:
从一个总体中不断抽取样本时,各种可能出现的样本统计值的分布情况。
例:
我们先来看一个总体为10个个案的平均数抽样分布。
假如这10个人参加工作的年限分别为6、7、8、9、10、11、12、13、14、15年。
举例:
总体为10个个案的平均数的抽样分布样本容量为1,10次取样样本容量为2,45次取样样本容量为3,120次取样变化趋势平均数的范围将逐步缩小(即底部越来越窄);相同的平均数会相应增多;全部平均数的分布向总体平均数集中的趋势也会越来越明显。
样本容量为4,210次取样样本容量为5,252次取样中心极限定理在一个含有N个元素且平均数为,标准差为的总体中,抽取所有可能含有n个元素的样本。
全部可能的样本数目为m:
若用,来分别表示这m个样本的平均数,那么,样本平均数的分布将是一个随n愈大而愈趋于具有平均数和标准差的正态分布。
定理说明当当nn足够大时(通常假定大于足够大时(通常假定大于3030),无论),无论总体的分布如何。
其样本平均数所构成的分总体的分布如何。
其样本平均数所构成的分布都趋于布都趋于正态分布正态分布。
正态分布图正态分布的特点:
1、单峰对称;2、平均数、中位数、众数合一,都在峰点;3、包含了95%(出现概率)的面积注:
平均值往左或往右1.964、包含了90%的面积,即面积和标准差(方差开方)之间有一个固定换算。
其中:
Xi为分布中任何一个值,是平均数;是标准差。
Z是距离平均数的标准差单位,又称Z分数,同时也表示与平均数之间的面积。
例某校同学的身高为正态分布,平均值为170cm,标准差为10cm。
问:
(1)高于平均数1.5个标准差的同学身高是多少?
(2)162cm身高的同学距离平均数有几个标准差?
(3)95%的同学身高会在什么范围内?
解1:
解2:
解3:
(150.4189.6)三、抽样的一般程序界定研究总体和调查总体制定抽样框决定抽样方案实际抽取样本评估样本质量抽样的程序界定总体:
对从中抽取样本的总体范围与界限作明确的界定。
这一方面是由抽样的目的所决定的。
另一方面,界定总体也是达到良好的抽样效果的前提条件。
案例:
1936年文摘杂志总统民意测验这一实例告诉我们,要有效地进行抽样,必须事先了解和掌握总体的结构及各方面的情况,并依据研究的目的明确地界定总体的范围。
样本必须取自明确界定后的总体,样本中所得的结果,也只能推广到这种最初已作出明确界定的总体范围中。
制定抽样框:
根据已经明确的总体范围,收集总体中全部抽样单位的名单,并通过对名单进行统一编号来建立其供抽样使用的抽样框。
需要注意的是,当抽样是分几个阶段、在几个不同的抽样层次上进行时,则要分别建立起几个不同的抽样框。
决定抽样方案:
根据研究的目的要求依据各种抽样方法的特点以及其他有关因素。
实际抽取样本:
从抽样框中抽取一个个的抽样样本,构成调查样本。
依据抽样方法的不同,以及依据抽样框是否可以事先得到等因素,实际的抽样工作既可能在研究者到达实地之前就完成,也可能需要到达实地后才能完成。
即既可能先抽好样本,再下去直接对预先抽好的对象进行调查或研究;也可能一边抽取样本一边就开始调查或研究。
评估样本质量:
样本评估:
对样本的质量、代表性、偏差等等进行初步的检验和衡量,其目的是防止由于样本的偏差过大而导致调查的失误。
方法:
将可得到的反映总体中某些重要特征及其分布的资料与样本中的同类指标的资料进行对比。
四、抽样设计的原则目的性原则可测性原则可行性原则经济性原则目的性原则指在进行抽样方案设计时,要以课题研究的总体方案和研究的目标为依据。
以研究的问题为出发点,从最有利于研究资料的获取,以及最符合研究的目的等因素来考虑抽样方案和抽样方法的设计。
可测性原则指的是抽样设计能够从样本自身计算出有效的估计值或者抽样变动的近似值。
在研究中通常用标准误来表示。
这是统计推断必需的基础,是样本结果与未知的总体值之间客观、科学的桥梁。
可行性原则是指研究者所设计的抽样方案必须在实践上切实可行。
它意味着研究者所设计的方案能够预料实际抽样过程中所可能出现的各种问题,并设计了处理这些问题的方法。
经济性原则主要指的是抽样方案的设计要与研究的可得资源相适应。
这种资源主要包括研究的经费、时间、人力等等。
概率抽样简单随机抽样系统抽样分层抽样整群抽样多段抽样非概率抽样偶遇抽样判断抽样定额抽样雪球抽样概率抽样是按照概率原理进行的,它要求样本的抽取具有随机性。
随机原则就是使总体中每一个体都有一个已知不为零的被选机会进入样本。
特点:
能够避免抽样过程中的人为误差,保证样本的代表性。
概率抽样分为两大类:
等概率抽样和不等概率抽样。
一、简单随机抽样(simplerandomsampling)又称纯随机抽样,是概率抽样的最基本形式。
AtypeofprobabilitysampleinwhichtheunitscomposingapopulationareAtypeofprobabilitysampleinwhichtheunitscomposingapopulationareassignednumbers,asetofrandomnumbersisthengenerated,andtheunitsassignednumbers,asetofrandomnumbersisthengenerated,andtheunitshavingthosenumbersareincludedinthesample.Althoughprobabilitytheoryhavingthosenumbersareincludedinthesample.Althoughprobabilitytheoryandthecalculationsitprovidesassumethisbasicsamplingmethod,itisseldomandthecalculationsitprovidesassumethisbasicsamplingmethod,itisseldomusedforpracticalreasons.usedforpracticalreasons.常用的方法:
A、总体元素较少时,类似于抽签方法。
B、总体元素较多时,随机数表法基本原理:
从N中抽取n练习练习11:
我系共有学生300人,系学生会打算采用简单随机抽样的办法,从中抽取60人进行调查。
具体方法(总体元素少时):
先编制一个抽样框,把总体各单位编上号码写在纸片上搓成纸团,作成签和阄(给每个学生编号,从001到300,并写在纸片上);然后,把签和阄放在一个盒子内搅拌均匀;最后,随机从盒子内抽取签和阄,被抽中的签和阄上的号码所代表的单位就是样本,直到抽满规定的样本为止(从300张纸条里抽取60张,并找相关同学)。
特点:
总体单位很多时,写号码的工作量就很大,搅拌均匀也不容易,因而此法经常在总体规模较小的时候使用简单随机抽样随机数表总体元素多时,采用随机数表利用随机数表进行抽样的具体步骤:
先取得一份总体所有元素的名单(即抽样框)将总体中所有元素一一按顺序编号根据总体规模是几位数来确定从随机数表中选几位数码以总体的规模为标准,对随机数表中的数码逐一进行衡量并决定取舍根据样本规模的要求选择出足够的数码个数依据从随机数表中选出的数码,到抽样框中去找出它所对应的元素对照附表中的随机数表,练习随机抽样。
要从3000个人(或其他分析单位)的总体中用简单随机抽样的方法选取100个人作为样本进行调查。
练习2步骤首先,将总体中所有的人编码:
本例中编码为1-3000。
接下来的问题是从随机数表中随机选取100个数字。
这100个数字所对应的人就是样本。
接下来是确定所选择的随机数需要几位数。
需要有四位数字才能保证所有人都有被选中的机会。
(如果总数为21654的话,需要选择五位数的随机数)。
因此,我们要从0001到9999的数字中抽取100个随机数。
我们可以随意确定表格中选取数字的顺序:
依纵列的方向向下选取,也可以依纵列的方向往上选取,由左到右或者由右到左,也可以依对角线的方式选取。
什么方式并不重要,关键是从头到尾贯彻使用这种方法。
这里我们为了方便选择从纵列方向,当一列到了末端时,可以从下一列最顶端选起,当一页选完以后,可以从下一页的第一纵列继续选取。
现在,我们决定从那里开始。
可以闭着眼睛随便戳一个数字。
也可以随意想一个行号和列号,譬如第五行第三列作为开始。
假设我们从第五行第三列的第三个数字作为起点,会看到这个数字是0906,那么第一个样本就为0906,由第三列往下,我们选择0041,2507,2683,然后从下一列开始。
依次进行,选足100个随机数。
样本的编码就为0906等。
随机数表抽样例随机数表中的数码选用的数码不选用的原因8432990906105387302
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六 抽样 社会调查 研究 方法 课件