生物醫(yī)學(xué)試驗中合理的樣本量是決定整個試驗成敗的重要因素之一。
樣本量需要多大?答案當(dāng)然是“視情況而定”。
GraphPad Prism官方統(tǒng)計教程中解釋了樣本量會受哪些因素影響。請注意,Prism不會進(jìn)行任何樣本量計算,但是會從幾個不同的角度告訴大家如何決定合適的樣本量、如何計算樣本量等。
之前跟大家一起探討了GraphPad如何輔助判斷“樣本量”(點擊回顧)。本篇繼續(xù)圍繞“樣本量”這個話題,我們來聊聊“為何要預(yù)先選擇樣本量?”。
靈魂拷問:“為什么要提前選擇樣本量?”
01“一邊研究一邊確定樣本量的吸引力?”
對于許多人而言,在研究開始前計算樣本量是件令人討厭的事情。
大家可能會提出疑問:為什么不在收集數(shù)據(jù)的時候進(jìn)行分析呢?如果結(jié)果不具有統(tǒng)計學(xué)顯著性,表示需要收集更多數(shù)據(jù),重新分析。如果結(jié)果具有統(tǒng)計學(xué)顯著性,就可以停止研究,不要把時間和金錢浪費在更多的數(shù)據(jù)收集上。
但這個方法會有一個問題:如果你不喜歡這個結(jié)果,你會想要繼續(xù)做;但如果你喜歡這個結(jié)果,你會停下來。結(jié)果變成,如果虛假設(shè)(null hypothesis)為真,獲得“顯著”結(jié)果的機率遠(yuǎn)高于5%。
02“模擬展示沒有預(yù)先選擇樣本量的危險!”
下圖我們通過模擬數(shù)據(jù)說明這一點。
我們通過繪制高斯分布的值,模擬數(shù)據(jù)(平均值 = 40,SD = 15,*這些值是任意的數(shù)值)。兩組均使用完全相同的分布進(jìn)行模擬。我們在每組中選擇N = 5,計算非配對t檢驗并記錄P值。然后我們給每組增加一名受試者(此時,N = 6),并重新計算t檢驗和P值。我們重復(fù)該過程,直至每組中的N = 100。然后我們重復(fù)三次整個模擬的過程。這些模擬是通過比較具有相同總體平均值的兩組進(jìn)行的。因此,我們獲得的任何具有“統(tǒng)計學(xué)顯著性”的結(jié)果都必須是巧合-I型錯誤。
該圖在Y軸上繪制P值,在X軸上繪制樣本量(每組)。 圖底部的綠色陰影區(qū)域顯示P值小于0.05,因此被視為“具有統(tǒng)計意義”。
綠色曲線顯示了第一組模擬實驗的結(jié)果。N = 7時,P值小于0.05,但對于所有其他樣本量,P值高于0.05。紅色曲線顯示了第二個模擬實驗。當(dāng)N = 61以及N = 88或89時,P值均小于0.05。藍(lán)色曲線顯示了第三個模擬實驗。當(dāng)N = 92至N = 100時,其P值小于0.05。
如果采用順序方法,我們會宣布所有三個實驗的結(jié)果均“具有統(tǒng)計學(xué)顯著性”。當(dāng)綠色實驗中的N = 7時,我們會停止,那么永遠(yuǎn)不會看到其曲線的虛線部分。當(dāng)N = 61時,我們會停止紅色實驗,而當(dāng)N = 92時,我們會停止藍(lán)色實驗。在這三種情況下,我們都將稱結(jié)果具有“統(tǒng)計學(xué)顯著性”。
由于這些模擬是為兩個總體的真實平均值相同的值創(chuàng)建,因此任何具有“統(tǒng)計學(xué)顯著性”的聲明均為I型錯誤。如果虛假設(shè)為真(兩個總體的平均值相同),我們期望在5%的實驗中看到這種I型錯誤(如果我們使用傳統(tǒng)的alpha = 0.05的定義,那么P值小于0.05的聲明為重大)。
但采用這種順序方法,我們所有三個實驗都會導(dǎo)致I型錯誤。 如果將實驗延長足夠長的時間(無限長N),所有實驗最終都將達(dá)到具有“統(tǒng)計學(xué)顯著性”。當(dāng)然,在某些情況下,即使不具有“統(tǒng)計學(xué)顯著性”,最終也會放棄。這種順序方法也將在超過5%實驗中產(chǎn)生“顯著”結(jié)果。所以即使零假設(shè)為真,該方法也是無效的。
03最后,很重要的一點...
選擇一個樣本量且堅持下去是很重要的。
看到想要的結(jié)果就停下來,或者看到不想要的結(jié)果就繼續(xù)進(jìn)行,是一種自欺欺人的表現(xiàn)。換句話說,實驗在結(jié)果不具有統(tǒng)計學(xué)顯著性的時候繼續(xù),但在具有統(tǒng)計學(xué)顯著性的時候停止,則錯誤地認(rèn)為結(jié)果具有統(tǒng)計顯著性的機會遠(yuǎn)大于5%。
有一些特殊的統(tǒng)計學(xué)技術(shù)用于順序分析數(shù)據(jù)。如果結(jié)果不明確,可以增加更多受試者,如果結(jié)果清晰,就停止實驗。
感興趣的話,大家可以在一些高級統(tǒng)計學(xué)書籍中查找“順序醫(yī)學(xué)試驗(sequential medical trials)”,了解更多信息。
GraphPad Prism 9 已經(jīng)上線了,大家可以升級啦!有不少新增功能。