统计学之样本大小

上传人:沈*** 文档编号:150736775 上传时间:2022-09-10 格式:PPTX 页数:36 大小:532.58KB
收藏 版权申诉 举报 下载
统计学之样本大小_第1页
第1页 / 共36页
统计学之样本大小_第2页
第2页 / 共36页
统计学之样本大小_第3页
第3页 / 共36页
资源描述:

《统计学之样本大小》由会员分享,可在线阅读,更多相关《统计学之样本大小(36页珍藏版)》请在装配图网上搜索。

1、本资料来源2 2第四章第四章 樣本大小樣本大小3 3樣本大小之選擇樣本大小之選擇樣本不要過大,過大浪費成本;但也不要過小,過小則會有太大的抽樣誤差。如何決定適當的樣本大小?在機率抽樣的情況下,有關樣本大小的決定及樣本統計顯著性的判斷,可藉由機率法則的運用。(也就是說,有公式可供計算啦!)但在非機率抽樣的情況下,除了依靠抽樣人員的主觀判斷或假設外,實無客觀之科學方法可資應用。4 4估計平均數時的樣本大小估計平均數時的樣本大小母體變異數已知於母體變異數(2)已知之情況下,樣本數(n)之求算公式為:為顯著水準或風險水準,(1-)即信賴係數或信賴水準;顯著水準表示檢定者主觀認定統計量出現極端數值的機率

2、。信賴係數愈高愈好,表示估計精準。e為可容忍誤差為母體標準差:是用來衡量觀測值與平均值間的離散程度。先別忙著計算樣本數,由於本書是介紹Excel之書籍,故得對所使用到的各相關函數先介紹一下。22/eZn5 5基本定義標準差變異數標準隨機變數平均值 mXZXNXNNii2212)(1)(16 6常態分配之Z值一般統計學之常態數值(Z),係利用查常態分配表(附錄二)來得知。如:Z0.025為1.96、Z0.05為1.645。但於Excel下,則可利用NORMSINV()標準常態分配反函數來查得;而若知道Z值,也可以NORMSDIST()函數來求得其機率。7 7標準常態分配標準常態分配NORMSDI

3、ST()NORMSDIST()NORMSDIST(z):由z值求機率其作用為求自標準常態分配(=0,=1)的左尾開始,累加到z值處的總面積(機率)。即,下圖之陰影部份:8 8有了此函數,即可省去查常態分配表某z值之機率的麻煩。如:(詳範例光碟Ch04.xlsxNORMSDIST工作表)=NORMSDIST(-1.96)=NORMSDIST(-1.96)為為0.0250.025=NORMSDIST(-1.645)=NORMSDIST(-1.645)為為0.050.05=NORMSDIST(0)=NORMSDIST(0)為為0.50.5=NORMSDIST(1.96)=NORMSDIST(1.96

4、)為為0.9750.9759 9常態分配(normal distribution)是次數分配呈中間集中,而逐漸向左右兩端勻稱分散的鐘形曲線分佈。根據中央極限定理,不論原母體的分配為何?只要樣本數夠大(n=30),樣本平均數 的分配,會趨近於常態分配。X1010標準常態分配反函數標準常態分配反函數NORMSINV()NORMSINV()NORMSINV(NORMSINV(累計機率累計機率):由機率求z值NORMSINV(probability)NORMSINV(probability)其作用為於標準常態分配(=0,=1),求某累計機率所對應之Z值。有了此函數,即可省去查常態分配表之Z值的麻煩。如

5、:(詳範例光碟Ch04.xlsxNORMSINV工作表)=NORMSINV(0.025)為-1.96=NORMSINV(0.05)為-1.645=NORMSINV(0.5)為0=NORMSINV(0.95)為1.645=NORMSINV(0.975)為1.961111標準常態分配表標準常態分配表一般統計學之教科書,均會附有標準常態分配表(如:附錄二),以利查常態數值(Z)。由於,常態分配是對稱的分配,故一般僅附上正值之部分,表內之累計機率,是由Z值為0時開始累計。如:Z值1.96,查得1.96之0.475,表示由標準常態分配中央(Z=0)開始,累計到Z=1.96的機率。即,下圖之陰影部份:12

6、12如要查負值之部份,仍以正值查表。然後,以0.5減去表內之累計機率即可。如:Z值-1.96,查得1.96之0.475,以0.5-0.475=0.025,即是自左尾開始累計到Z值為-1.96的機率。相反地,若要計算由Z值為-1.96開始累計到右尾的機率,則將查得之值(0.475)加上0.5,即0.975。通常,=0.05時,如要查Z/2值,是找尋右尾機率為0.025時之Z值,即找出由左尾累積得0.975之Z值1.96。若用Excel之NORMSINV()函數來求算,其公式應為:(詳範例光碟Ch04.xlsx依査Z值工作表)=NORMSINV(1-0.05/2)=NORMSINV(1-0.05/

7、2)1313於Excel下,利用NORMSDIST()函數即可輕易建立標準常態分配表。其建立步驟為:(詳範例光碟Ch04.xlsx常態分配表工作表)1.於A2輸入Z字串,A3輸入0.0(僅顯示0),A4輸入0.12.選取A3:A4,切換到常用索引標籤,按數值群組之 增加小數位鈕,使兩數均可擁有一位小數3.拖曳A3:A4右下角之複製控點,拉到A33位置,複製出0.0、0.1、0.2、2.9、3.0等數值14144.於B1輸入Z值的小數第二位字串5.於B2輸入0.00(僅顯示0),C2輸入0.016.選取B2:C2,按數值群組之 增加小數位鈕,使兩數均可擁有2位小數7.拖曳B2:C2右下角之複製控

8、點,拉到K2位置,複製出0.00、0.01、0.02、0.08、0.09等數值15158.於B2:K2尚呈選取之狀態,切換到常用索引標籤,按儲存格群組 格式鈕之下拉鈕,續選自動調整欄寬(I),將各欄調整成最適欄寬9.選取B1:K1,按對齊方式群組 跨欄置中鈕,讓Z值的小數第二位字串,於這幾欄內跨欄置中161610.於B3輸入=NORMSDIST($A3+B$2)-0.511.拖曳其右下角之複製控點,往右複製到K3171712.於B3:K3尚呈選取之狀態,按兩次按數值群組之增加小數位鈕,使各數均可有4位小數13.於B3:K3尚呈選取之狀態,按儲存格群組格式鈕之下拉鈕,續選自動調整欄寬(I),調整

9、成最適欄寬14.雙按K3右下角之複製控點,將B3:K3往下複製到K33,即完成整個建表工作1818母體變異數已知時的樣本大小學過所需之幾個函數後,現在,可以來計算於母體變異數(2)已知之情況下的樣本數(n)。式中:為顯著水準或風險水準,(1-)即信賴係數或信賴水準e為可容忍誤差為母體標準差22/eZn1919假定,母體變異數2=6.25(=2.5),於風險顯著水準=0.05(Z/2=1.96)的情況下,希望對母體均數的估計誤差e不超過0.3,其樣本數應為多大?將=2.5與Z/2=1.96代入公式至少應取得267個樣本,才能有95%的保證其誤差不超過0.3。以Excel來安排相關之數字與公式,將

10、為:(詳範例光碟Ch04.xlsx估計均數樣本數已知工作表)2673.05.296.12nB欄各儲存格之公式分別為:母體標準差母體標準差 =SQRT(B1)=SQRT(B1)Z Z/2/2=NORMSINV(1-B3/2)=NORMSINV(1-B3/2)樣本數樣本數n n=(B4=(B4*B2)/B5)2B2)/B5)22020假定,電力公司根據過去之調查經驗,知道用戶用電度數的母體變異數為48000(2=48000)、於顯著水準=0.05(Z/2=1.96)的情況下,希望對母體平均用電度數的估計誤差不超過5度,其樣本數應為多大?將相關之數字輸入Excel即可算出,至少應取得7376個樣本,

11、才能有95%的保證其估計誤差不超過5度:(詳範例光碟Ch04.xlsx估計均數樣本數已知1工作表)2121馬上練習以範例光碟Ch04.xlsx大學生零用金樣本數工作表進行計算。假定,大學生之平均每月零用錢為1200元,其變異數為368,560。至少應取得多少樣本?才能有95%的信賴水準,保證其估計誤差不超過100元。2222習題三假定大學畢業生之平均每月收入為26500元,其變異數為4202500。至少應取得多少樣本?才能有9X%(X為學號最後一位數字)的信賴水準,保證其估計誤差不超過1000元2323平方根SQRT()函數SQRT(SQRT(數值數值)SQRT(number)SQRT(num

12、ber)本函數是用來求某數值的平方根,若數值為負值,本函數將回應#NUM!之錯誤。如:(詳範例光碟Ch04.xlsx平方根工作表)2424事實上,有無此函數並不很重要。利用 運算符號運算符號也可達成開方之動作。如:=64(1/2)之結果即=SQRT(64);但若要求開三方,那SQRT()可就無能為力了。但仍可利用 運算符號來解決(乘冪為1/3即等於開三方):2525母體變異數未知的樣本大小事實上,實務上很多數情況是無法得知母體變異數(2)。若是母體變異數未知,則可以過去調查之樣本變異數(S2)來替代。若過去也無類似之調查,可先做一小規模試訪,以利計算樣本變異數。然後,再來計算樣本數:式中:為顯

13、著水準或風險水準,(1-)即信賴係數或信賴水準e為可容忍誤差S為樣本標準差22/eSZn2)(11XnS2626於Excel中,樣本變異數可以VAR()函數來求得,其語法為:VAR(VAR(數值數值1,1,數值數值2,.)2,.)VAR(number1,number2,.)VAR(number1,number2,.)數值1,數值2,.為要計算變異數之儲存格或範圍引數,它是對應於某母體抽樣選出的1到255個數字引數樣本,方括號包圍之部份可省略。樣本變異數(S2)的計算公式為:其值恰為樣本標準差(S)之平方,也是用來衡量觀測值與平均值間的離散程度。122nnxxn2727由於,母體變異數未知。故舉

14、行一次試訪,以範例光碟Ch04.xlsx估計均數樣本數未知工作表,取得120位大學生之手機平均月費。計算出其樣本變異數(S2)為109,593、於顯著水準=0.05(Z/2=1.96)的情況下,希望對母體手機平均月費的估計誤差不超過30元,其樣本數應為多大?將相關之數字輸入Excel,即可算出,至少應取得468個樣本,才能有95%的保證其估計誤差不超過30元:22/eSZn2828馬上練習由於,母體變異數未知。故舉行了一次試訪,取得40位大學生之信用卡每月平均簽帳金額。(詳範例Ch04.xlsx信用卡問卷樣本數工作表)於風險顯著水準=0.05(Z/2=1.96)的情況下,希望對母體信用卡每月平

15、均簽帳金額的估計誤差不超過50元,其樣本數應為多大?2929估計比率時的樣本大小若研究目的是在估計比率(p,proportion),其樣本數(n)之求算公式為:p為母體的真正比率為風險顯著水準,(1-)即信賴係數e為可容忍誤差p為母體標準差,其運算公式為:22/eZnpnppp)1(3030將其代入上式,即可獲致新的樣本數(n)公式:不過,通常我們是無法得知母體之真正比率p,要計算樣本數時,則以過去之調查結果替代。假定,上個月支持執政黨之比率為38%(p)。這個月,於95%的信賴水準下(=0.05),希望調查結果之支持率的允許誤差(e)為3%,應取樣多少?將相關值代入公式:至少應取得1006個

16、樣本,才有95%的信心,保證其調查結果的支持率之誤差不超過3%。222/)1(eppZn1006)03.0()62.0)(38.0()96.1(22n3131以Excel來安排相關之數字與公式,將為:(詳範例光碟Ch04.xlsx以母體比率求樣本數工作表)3232保守估計母體比率於將前面之抽樣中,若將不同之p值分別代入,其樣本數勢必不同。茲將各種結果彙集成下表來比較:(詳範例光碟Ch04.xlsx以母體比率求樣本數工作表)3333可發現,其樣本數的極大值1067係發生於母體比率為0.5時。母體比率0.5時,隨母體比率逐漸增加,樣本數則逐步減少。故而,若我們無法得知母體真正比率p,要計算樣本數時,可以採取最保守的估計,將母體比率設定為0.5。這樣,由於其樣本數最大,所獲得之結果也將是各種情況下最正確的。3434馬上練習以範例Ch04.xlsx以保守估計求樣本數工作表進行計算,保守估計執政黨的支持度為50%。要以90%之信賴水準(風險顯著水準=0.1),希望調查結果之支持率的誤差為3%,應取樣多少?3535重點整理NORMSDIST(z):由z值求機率NORMSINV(累計機率):由機率求z值母體變異數已知時樣本的大小母體變異數未知時樣本的大小估計比率時樣本的大小22/eZn

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!