换一换

冰豆网 > 资源分类 > DOCX文档下载

预览

各种抽样方法之选择步骤及优劣比较.docx

资源ID：11516270 资源大小：47.39KB 全文页数：35页
资源格式： DOCX 下载积分：10金币

快捷下载

账号登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要10金币

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

加入VIP,免费下载

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

各种抽样方法之选择步骤及优劣比较.docx

1、各种抽样方法之选择步骤及优劣比较各種抽樣方法之選擇、步驟及優劣比較http:/bidm.stat.fju.edu.tw/school/DOWNLOAD/抽樣補充講義.doc一、簡介調查之目的即在蒐集資料，由資料中獲得訊息，以對未知狀況或現象，加以瞭解，提供決策參據。調查方式可採普查或抽樣調查。普查：即對欲研究對象(母體)中每一份子均加以調查。抽樣調查：由所欲研究對象(母體)中抽取一部分份子(樣本)，加以調查蒐集資料。普查之優缺點與必要性：1.普查優點： (1)包羅母體中每一份子，最能陳示母體狀況。(2)可做各細分特性之統計分析。(3)不致產生抽樣誤差。2.普查缺點：(1)耗費大量人力，物力，

2、財力。(2)整理時間過長，統計結果常有過期之憾。(3)調查問卷不易深入。(4)易導致非抽樣誤差。3.普查必要性：(1)基本國勢之陳示。(2)各種抽樣調查之母體。(3)細分特性之陳示。(4)各種抽樣調查估計之權數。抽樣調查：抽樣調查係自調查對象之母體中抽取一部份個體，加以觀察，然後再推估母體之現象。抽樣調查成為科學的調查方法，乃是由於推測統計理論的發展，加上近年來統計的重要性倍增，依據調查資料與現存事實進行之交叉分析結果頗獲各方關心，主要原因須歸功於統計在經濟發展中所發揮的功能，所以統計學中的抽樣調查不僅是一門學問，業已成為研究社會問題與經濟現象的主要工具之一。1.抽樣之基本觀念(1)抽樣不過

3、是一個方法、手段、其最終目標仍在推論。(2)對於各種抽樣方法，建立直覺的瞭解，以及探求其優點及限制。(3)注意各種抽樣方法之觀念及使用時機。(4)不要見樹而不見林。(注意樣本之代表性)2.抽樣之基本原則(1)所抽樣本能以代表母體。(代表性)(2)以樣本訊息估計母體之特性，要儘可能精確，並且可測度其可信度(精確性)。(3)取樣成本要儘量少。(成本低)(4)配合不同之母體狀況及行政限制下，採取適宜方法(即考量實務問題)。亦即如何達到快速、準確、具代表性而又能配合實務。(可行性)3.抽樣的步驟建立母體分析母體決定抽樣方法選定估計量估計量的變異數信賴區間決定樣本大小樣本抽出方式樣本與母體差異分析4.抽

4、樣調查優點(1)抽樣調查可節省人力與財力。(2)抽查可縮短調查與整理時間。(3)抽查所抽出之樣本可做更詳細之調查。(4)抽查可迅速獲得調查結果。(5)可配合研究特性與機動性之行政措施。本章的概述最主要目的是作為導讀之用，期望讀者在念完本章節後對抽樣調查有些許初步的認識與興趣，並在往後各章內容中均有非常詳細的介紹。現在，就讓我們一同進入抽樣調查的世界裡，一探抽調的神奇之美。二、抽樣方法之分類抽樣方法分類：可粗分為非機率抽樣與機率抽樣。(一)非機率抽樣：亦即樣本不按照其機率予以抽出，而是由抽樣者之主觀抽出或自願樣本。優點：在某些調查時，有其必要性。缺點：(1)難以評斷樣本之代表性。(2)無法估計精

5、確度。(3)樣本偏差往往較大。非機率抽樣之種類：1.便利樣本(偶然樣本) 事先不預定樣本，碰到即問或自動回答者。如街頭訪問或主動打電話回答問題者。缺點：注意樣本之偏激性及兩極化。2.立意樣本(判斷樣本) 由抽樣者立意抽取之樣本。如民間代表、意見領袖、學者、專家或代表性之樣本。3.滾式樣本(輻射樣本) 利用樣本尋找樣本，亦即利用樣本之滾雪球方式或輻射力抽取樣本。如都市中之原住民抽樣。使用時機：可用於當樣本不易取得時，或針對特殊族群之調查。4.配額樣本：按母體某些特性予以配置樣本，但取樣時卻由調查員任意抽取。非機率抽樣有時雖然可予使用，惟在其結果之引用上，要特別注意，亦即其結果之參考性大於其實際

6、之代表性。(二)機率抽樣：抽取之樣本是按照樣本之機率隨機抽出。優點：1.樣本較具代表性。2.可計算估計之精確度。3.可隨不同之抽樣設計採取不同之抽樣方法。4.隨之不同之抽樣方法，採取相互配合之估計方法。機率抽樣之種類：1.簡單隨機抽樣不對母體加以任何修飾或分割，而使每一樣本均有相同之被抽中機率。2.分層隨機抽樣將母體按照某些特性，分成數個不重疊的組群，這些組群即稱為層，而再由各層分別抽取樣本。3.系統抽樣將母體之元素按順序編號後，有系統的每隔一定間隔抽取一個樣本之方法。4.集體抽樣將母體中相鄰近之個體排成為一集體，而以集體為抽樣單位，即每一抽樣單位為一集體之抽樣單位。5.兩段集體抽樣

7、首先抽出一些樣本集體，再由樣本集體內抽出部分基本個體。6.分層集體抽樣將母體內之集體予以分層後，再由各層抽取樣本。三、各種抽樣方法之適用時機、步驟及估計量(一)影響抽樣調查結果準確度的因素為使抽樣估計值能達到估計全事物的目的，需考慮影響其準確的各種因素：原始資料的變異程度樣本數的大小抽樣方法分層抽樣法抽樣的不同(二)估計值準確度構成的條件不偏性(unbiased ness)有效性(efficiency)充分性(sufficiency)一致性(consistency)1.不偏性(unbiased ness)定義，其中表示期望值。本定義即說明，統計量的期望值等於參數，這種性質叫做不偏性。舉例來說

8、，假設某母體大小為，且母體平均為，今從母體內抽取出一組樣本，求得平均為，若，則稱為的不偏估計值。2.有效性(efficiency)定義；此定義的意思是說，若同時有二個統計量(及)，其中一個統計量的變異數較另一個統計量的變異數為小，則變異數小的那個統計量便具有有效性。舉例來說，假設母體平均值為，而估計的統計量有中位數(median)及算術平均數(arithmetic mean)，但因為前者的變異數大於後者的變異數，則算術平均數具有效性。3.充分性(sufficiency)定義；此定義的意思是說，假設母體參數為，但若樣本統計量可直接由樣本觀測值去估計，而與無關，則叫具有充份性。4.一致性(cons

9、istency)定義；此定義的意思是說，當樣本大小趨近於無窮大()時，統計量即等於參數，這種性質叫做符合一致性。例如，當增大為時，則所求得的趨近於，亦即，故可知具有一致性。(三)估計的方法在某些情況下，如所需的原始資料不易得到，或得到的資料所要花費的金錢、時間較多時，可用輔助變數(auxiliary variable or concomitant variable)，此類變數值的取得代價較低。舉例來說，目測值花費時間、金錢較評估估計值所費均少，估計得較準確的估計值，每個抽樣單位有兩個變數值，與之間有相關(correlation)存在，母體總合必須已知。另外，估計值估計的方法有下列二種：(1)比

10、率估計法(ratio estimation)，和(2)迴歸估計法(regression estimation)。(四)母體與參數及樣本與統計量1.母體與參數同類個體的全部記錄集合一起，使組合成一個全體(aggregate)，這個全體稱為母體(population)，母體種類很多，表示其特徵的方法有圖表法、常數法等。利用常數法研究母體即由母體中計算出若干穩定常數，此等常數有介紹母體特性的作用稱為參數(parameters)包括有四類：(1)測定母體趨中性：主要有算術平均、型量、中位數等。(2)測定分散度：主要有變異數、均方、標準偏差。標準偏差愈大，則母體中所有個體間的變異愈大。(3)測定偏歪度：

11、主要有Fisher氏的係數，E. S. Pearson氏的係數。(4)測定頻度分布的曲線峰度：常用有Fisher氏的係數，及Geary氏的係數。2.樣本與統計量母體涵蓋範圍很大，資料經統計分析後，所得結論的適當範圍必很大；所須顧慮者，乃在於母體範圍過大時，蒐集、計數、度量及統計工作隨著浩大，所費時間、金錢往往無法許可，故只好由樣本資料來推斷母體的特性。來自同樣個體的全部N個個體中只抽出n個單位進行計數，度量而得個單位的記錄(Nn)集結此n個單位記錄在一起，便構成一個樣本(sample)，再由樣本資料求得某一統計值來估計參數，此估計值稱為統計量(statistic)。因樣本有抽樣變異，故統計量亦

12、有抽樣變異，如把母體中可能發生的樣本全部取出，然後求得各樣本的某種統計量，再求統計量的總平均值，此總平均值稱為某統計量的期望值，若某統計量的估計方法適當，則該統計量即母體參數。抽樣方法的不同，及抽樣單位的不同會改變統計量的大小，改變對該母體的代表程度。(五)各種抽樣方法之適用時機、步驟及估計量1.簡單隨機抽樣法(simple random sampling)簡單隨機抽樣是一種最基礎且最簡便的抽樣方法。它的優點是(i)當母體底冊完整時，直接由母體中抽出樣本，方法簡單；和(ii)每一單位被抽中的機率均相等，參數的估計較簡單。而它的限制是(i)母體底冊不易取得，或取得很費時，費力且費錢；(ii)母體

13、內樣本單位太多時，作業不方便；(iii)樣本分配較分散，行政作業較不易；和(iv)樣本代表性恐有不足(尤其當樣本點差異大時或重要性不同時)。因此，使用簡單隨機抽樣的最佳時機，便是當(i)母體內樣本單位不多，且有完備名冊，可茲編號時；(ii)母體內樣本單位間的差異不大時(對研究的目的而言)；和(iii)對母體資訊無法充份獲得時。簡單隨機抽樣法的準確度會受下列二因素的影響，即(i)母體本身的變異，和(ii)樣本的大小。以下以算術平均值為例來分別說明。例子(1)母體本身的變異：分別對原始母體當變異數較小和變異數較大時，計算簡單隨機抽樣法的所有可能的樣本組合，結果列在表4-1及表4-2內。表4-1 簡

14、單隨機抽樣法的所有可能的樣本組合(原始母體變異數較小)樣本順序樣本個體樣本總計樣本平均母體123456789101112131415161718192021abcdeabcdfabcdgabcefabcegabcfgabdefabdegabdfgabfegacdefacdegacdgfacefgadefgacdefbcdegbcdfgbcefgbdefgcdefg38.438.739.138.939.339.639.339.740.040.239.640.040.340.540.940.140.540.841.041.441.77.687.747.827.787.867.927.867.948

15、.008.047.928.008.068.108.188.028.108.168.208.288.34a=6.9b=7.4c=7.7d=8.1e=8.3f=8.6g=9.0N=7n=5T=56=8.0總計840.0平均40.0表4-2 簡單隨機抽樣法的所有可能的樣本組合 (原始母體變異數較大)樣本順序樣本個體樣本總計樣本平均母體123456789101112131415161718192021abcdeabcdfabcdgabcefabcegabcfgabdefabdegabdfgabfegacdefacdegacdgfacefgadefgacdefbcdegbcdfgbcefgbdefgcd

16、efg2627293436373638394638404148503941424951535.25.45.86.87.27.47.27.67.89.27.68.08.29.610.07.88.28.49.810.210.6a=1b=2c=4d=6e=13f=14g=16N=7n=5T=56=8.0總計840.0平均40.0比較表4-1及表4-2，可看出同樣的抽樣方法、同樣大小的母體及樣本，在表4-1中由於原始母體的變異小，樣本平均的變異也隨著變小，而大多能代表母體平均，也就是說有較大的準確度。而在表4-2中，因為母體變數由1到16的間，大小相差甚多，結果可能的樣本組合平均值由5.2變化到10.

17、6，故其準確度較小。(2)樣本的大小：同樣的也分別對當樣本大小不同時，計算簡單隨機抽樣法的所有可能的樣本組合，結果列在表4-3及表4-4內。表4-3 當n=4時簡單隨機抽樣法所有可能的樣本組合樣本順序樣本個體樣本總計樣本平均母體1234567891011121314151617181920212223242526272829303132333435abcdabceabcfabcgabdeabdfabdgacdeacdfacdgbcdebcdfbcdgabefabegabfgacefacegacfgadefadegadfgbcefbcegbcfgbdefbdegbdfgcdefcdegcdfga

18、efgdefgcefgdefg13202123222325242527252628303133323435343637333536353738373940444547493.255.005.255.755.505.756.256.006.256.756.256.507.007.508.008.258.008.508.758.509.009.258.258.759.008.759.259.509.259.7510.0011.0011.2511.7512.25a=1b=2c=4d=6e=13f=14g=16N=7n=4T=56=8.0總計1120.0280.00平均280.08.00表4-4 當n

19、=6時簡單隨機抽樣法所有可能的樣本組合樣本順序樣本個體樣本總計樣本平均母體1234567abcdefabcdegabcdfgabcefgabdefgacdefgbcdefg404243505254556.677.007.178.338.679.009.17a=1b=2c=4d=6e=13f=14g=16N=7n=6T=56=8.0總計336.056.01平均48.08.00表4-3中，當n=4時的樣本平均由3.25至12.25間便動，而在表4-4中，當n=6時的樣本平均則由6.67至9.17間變動，可見其準確度差異相當的大。我們可由這二個表而歸納出一個結論，亦即大樣本的準確度較大，而小樣本的準

20、確度較小。2.分層抽樣法(stratified sampling)按照某種原因或其他一定的標準，將所含抽樣單位個數分別定為，但；這些分枝的母體簡稱為層(stratum)。再以簡單隨機抽樣法，分別從各層獨立的抽出個單位組成一個含有個單位的樣本，根據此樣本中各單位的平均與母體各層單位的個數去推估母體平均。亦即，其中N為母體中單位總數，而h為層號。往往調查對象的母體中，包含每一抽樣單位附隨的某種特性的變數間具有很大的變異性，即分散度很大，或具有歪度很大的分布。此時倘若置的不理，而採用簡單隨機抽樣法從整個母體中抽出樣本，則可能在分布兩端的單位便沒有被抽中的機會，或者抽出太多極端的樣本，因而失去母體的代

21、表性，以致估計的準確度不高。反之，假如按照母體分布的狀態，將其抽樣單位分為大、小二層或更細分的，使各層內的單位間的變異程度較低，而各層間的變異程度較高；根據變異數分析原理，層間變異愈大則層內變異愈小，因此各層樣本的代表性將會增高，將其合併以估計整個母體總合或平均值必能獲得準確度很高的估計結果。分層隨機抽樣在實際應用上是最常用的一種抽樣方法。通常欲調查的母體內各個抽樣單位，當其間變異甚大，即分散度很大或具有歪度(skewness)時，若採用簡單隨機抽樣，則可能造成分散在兩端的樣本將不被抽中或抽中太多，如此抽出的樣本不具高度代表性，反而使估計誤差過大，因此有使用分層隨機抽樣的必要。舉例來說，欲估計

22、超級市場的平均營業額，即要對超級市場按超市大小分層後再作抽樣。分層隨機抽樣法的優點是(i)可增加樣本代表性；(ii)可提高估計的確度；(iii)可分別獲得各層的訊息，並做各層間的比較分析；(iv)可在各層設立行政單位，以便於執行；和(v)可視各層情形，採取不同的抽樣方法。而它的限制是(i)分層變數的選取(要與所欲估計的特徵值具有高度相關)；(ii)層數的釐定(要適當並配合母體的分配狀況)；(iii)分層標準的決定(各層不能有重疊現象)；(iv)各層樣本的配置方法；和(v)分層後，樣本資料的整理及估計較複雜。因此，使用分層隨機抽樣法的最佳時機，便是當(i)母體內樣本單位的差異較大時；和(ii)分

23、層後能達到層間差異大，層內差異小的原則。原則上要使層內變異小，而層間變異大；各層不能有重疊現象。3.分層隨機抽樣法的配置問題由前面所述我們已經知道當分組得宜時，分層隨機抽樣法較簡單隨機抽樣法的準確度來的大，然而在總樣本個數n確定的情況下，各層究竟應該分別抽取多少，才能獲得最高的準確度？進一步的說，也就是在固定的成本下，要如何使準確度達至最高？而在要求的準確度的下，又如何使成本減至最低？這些皆是屬於配置上的問題。一般的配置方法可分為均等配置、比例配置、Neyman配置和最適配置等四種，下面我們將以民國六十四年度二期作坪割資料各鄉鎮各鄉鎮應抽的農家數(或坵田數)為例，將此四法分別加以說明並討論。(

24、1)均等配置(equal allocation)在所有配置法中，最簡單的就是將總樣本個數平均配置於各層的中。換句話說，也就是由各層中抽取相同個數的樣本，此即所謂均等配置。在均等配置中，第h層的樣本數為 ()其中n為總樣本個數，L為總層數。以坪割為例，民國六十四年二期作所採用的即是一種均等配置，亦即在29個鄉鎮中，每鄉鎮均抽取4小區，便構成了n=116的樣本。由於均等配置並未討論各層本身所含單位的多寡及層內變異的大小，自然它的準確度一般說來不會很高，因此也只適用於各層大小略為相等且變異程度相似的母體下使用。(2)比例配置(proportional allocation)比例配置是按照各層含有單位

25、數多寡的比例來配置樣本的，用公式來表達即是也就是 , (4.3.1)其中為第h層所含有的單位數()。在坪割計畫中，每一小區包括10到20公頃的水稻耕地，取其中間值我們以15公頃為每一小區面積，那麼以15公頃來除該鄉的水稻耕地總面積即為該鄉所擁有的小區數，也就是值，即(第h鄉的水稻栽培面積)。為了與前面均等配置做一比較，我們仍以294=116作為總樣本個數(也就是n值)，而N為族群大小()，將、n、N等代入式(4.3.1)中即可得各鄉鎮所應抽取的小區數。若以宜蘭縣羅東鎮為例，而羅東水稻栽培面積1429.40公頃，除以15得為95，各鄉鎮計算結果得，則羅東鎮應抽取的小區數為。除了比例配置外，尚有其

26、他更精細完備的配置方法，如後述的Neyman配置、最適配置等。但是比例配置法也有它的優點，即(i)比例配置法不須要知道各層內的變異數；(ii)比例配置法未涉及成本，因此各層的單位抽樣成本也不必明瞭；和(iii)由其他配置法(如Neyman配置、最適配置)所獲得的準確度的提高，並不是很大，但手續卻較繁雜。當然若各層內變異程度相差很大時，由Neyman或最適配置所得的準確度的提高超過比例配置法的簡便時，比例配置法是不宜被採用的，但無論如何比例配置法是一種簡單而經常被使用的配置方法。(3)最適配置法(optimum allocation)最適配置法是在總預算成本為C，樣本個數固定為n，第h層單位抽樣

27、成本為的情況下，欲使平均的變異數為最小時所採用的一種配置方法。最適配置中第h層所須抽出的樣本數為 (4.3.2)其中為第h層的層內均方。由上列公式我們可看出是和成正比例的，也就是說當或大時，第h層就必須多抽些樣本。這意義是顯而易見的，即當層內各單位間的差異越大，越是須要較大的樣本才能具有代表性。由上式我們也可看出是和成反比的，也就是應該從較小的層內抽取較多的樣本個數。若各層單位的抽樣成本相等，且變異情形相似，則式(4.3.2)中的和便可略去，而簡化為，即成為比例配置法。由最適配置這個名詞的表面意義，我們即可知道在者四種配置法中它是最適的，因為它不但考慮了成本，更獲得了最高的準確度；只是一般說來

28、每層的單位抽樣成本很難正確的計算，像坪割資料就是因為沒有成本的函數，所以不能以最適配置法計算出每鄉鎮應抽出的最適小區數。(4) Neyman配置(Neyman allocation)在某些情形下，各層的單位抽樣成本差異不大，因此式(4.3.2)中的可省略而變成了 . (4.3.3)此法首先由Neyman提出，故稱為Neyman配置。以坪割計畫中各鄉鎮所的小區數為例，和比例配置時相同，n也仍是116。只是另外必須再計算各鄉鎮內小區變異數，開方後得，由計算，即可獲得Neyman分配下各鄉鎮所應採取的小區數。由以上所述我們可以下一結論：最適配置是最完美的配置方法，但當各層單位抽樣成本未知時可採用Neyman配置，又當各層內變異程度約略相似時可採用比例配置。而由坪割計算結果我們得到比例配置的相對效率，是均等配置的1.556倍，Neyman配置是均等配置的2.529倍，Neyman配置是比例配置的1.625倍，更可作為配置法重要性的一個驗證。由於比例配置法在實務上使用最多，故下例中便此方法加以介紹。【例】假設某公司欲

注意事项

本文（各种抽样方法之选择步骤及优劣比较.docx）为本站会员主动上传，冰豆网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知冰豆网（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。