數(shù)據(jù)的背后2
題1:為什么“在大的空難發(fā)生的前夜,有些人會夢見發(fā)生一次空難”并不令人奇怪?
答:乍一聽到“在大的空難發(fā)生的前夜,有些人會夢見發(fā)生一次空難”這種消息,總感覺十分神奇,似乎這些人都有特異功能,能夠預(yù)測到即將發(fā)生的事情。但學(xué)了數(shù)據(jù)分析后,這種所謂的“神策”實在是“看似意外,實屬正!薄W鰤暨@種事,每個人身上都會發(fā)生,只不過做夢夢到空難的概率比較小,而第二天就真的發(fā)生空難的概率就更小了。的確,兩個概率相乘,最后得到“在大的空難發(fā)生的前夜,有些人會夢見發(fā)生一次空難”的概率是一個小的離譜的數(shù)字。也許你會由此感到“難以置信”。但是世界上有近70億人口(64.77億,截止2005年6月),即使一件事情在某地某時某刻發(fā)生在某人(比如我做夢夢到明天美航上午紐約飛芝加哥的班機
……(新文秘網(wǎng)http://jey722.cn省略557字,正式會員可完整閱讀)……
p’=240/400=0.6, σ=(0.6*(1-0.6)/400)^0.5=0.0245。則總體比例為95%的置信區(qū)間為(0.6-1.96*0.0245,
0.6+1.96*0.0245),即(0.552,0.648)。
b) 僅僅根據(jù)上面一問的答案,我們有95%的把握認為有55.2%——64.8%的學(xué)生贊成保持兩學(xué)期制不變。因為置信區(qū)間在50%的上方,那么我們有足夠理由相信,大多數(shù)學(xué)生贊成保持兩學(xué)期制不變。
c) 現(xiàn)在變成了50人中有30人贊成不變,那么p’=30/50=0.6,σ=(0.6*(1-0.6)/50)^0.5=0.0693。則同理,還是以95%作為標準,那么總體比例為95%的置信區(qū)間為(0.6-1.96*0.0693,0.6+1.96*0.0693),即(0.464,0.736)。首先這個范圍跨度太大,如果取其下限,也就是差不多46%的話,肯定不能算“大多數(shù)”。再說現(xiàn)在的抽樣數(shù)從400變成了50,單單從相對誤差上說(1/50^0.5)/(1/400^0.5)=2.8,也即誤差大了近3倍,難以讓人信服。
d) 從a) 和c) 所給出的不同區(qū)間,我們發(fā)現(xiàn)其實樣本的大小對于基于樣本做決策是還是相當重要的。我們看,σ的值大小除了于p’有關(guān)之外,決定其變化的就是樣本的大小。在a) 和c)中,p’其實是一樣的,但之所以置信區(qū)間兩者差那么多,關(guān)鍵就在于一個樣本是400人,一個樣本只有50人。其實道理也很簡單,在相同的情況下,樣本越大,抽樣的得到的結(jié)果越有說服力,當然誤差也就越小。所以在做相關(guān)調(diào)查時,樣本還是越大越好 (當然前提還是可操作性較強的情形下)。
題3:已知兩個總體均值差值的95%置信區(qū)間,在下列兩種情況中,關(guān)于總體均值的差值可以有怎樣的結(jié)論?
a) 置信區(qū)間不包含0;
b) 置信區(qū)間包含0.
答:a) 如果置信區(qū)間不包含0,那么我們有95%的把握(不是100%!)可以確認,對于這個均值差值的95%置信區(qū)間,全體位于0的上方或下方,則其差值都是同號。也就是說,有95%的可能性其中一種總體均值大于另一個總體均值。
b) 因為包含了0,無論是區(qū)間大于0的部分遠遠超過小于0的部分,抑或是小于0的部分遠遠超過大于0的部分,嚴格上來說,我們就無法確認實驗樣本中的差值反映了總體中存在的真正差別,不能排除實際上在總體上的情形與樣本中完全相反的情況。那么我們對總體均值的差值不能做出任何判斷。
題4:某乳制品廠的一種盒裝鮮奶產(chǎn)品的標準重量是495克,但是在生產(chǎn)過程中不可避免地出現(xiàn)超重或重量不足地現(xiàn)象。為了控制產(chǎn)品合格率,隨機抽取100盒鮮奶進行檢查,測得產(chǎn)品的平均重量為494克,標準差為6克。
試 1)鮮奶產(chǎn)品的標準重量的95%的置信區(qū)間;
2)以5%的顯著性水平判斷這批產(chǎn)品的質(zhì)量是否合格;
3)給 ……(未完,全文共3095字,當前僅顯示1563字,請閱讀下面提示信息。
收藏《數(shù)據(jù)的背后2》)