Power功效分析是一種實驗研究時,基于某顯著性水平前提下所需樣本量和統(tǒng)計功效的方法。Power功效分析通常應(yīng)用于醫(yī)學(xué)、心理和相關(guān)生物學(xué)研究,其目的是計算適合的樣本量和統(tǒng)計功效。Power分析涉及較多專業(yè)名詞,如下述:
名詞 | 說明 |
統(tǒng)計學(xué)假設(shè) | H0也稱原假設(shè),H1稱備選假設(shè)。比如‘H0是不生病’,‘H1是生病’。 |
顯著性水平 | 也稱alpha值,一般取0.05,比如為0.05,其是指至少有95%(1-alpha)的把握認為H0是錯誤的,即拒絕原假設(shè)H0的把握度情況如何。 |
p 值 | 統(tǒng)計上具體計算出來的概率值,其需要與顯著性水平alpha值進行對比,比如p 值=0.03<0.05,那么就拒絕H0接受H1,此處0.03意味著有97%(1-0.03)的把握認為H0是錯誤的。 |
I型錯誤 | 也稱作α錯誤,其意義為‘對的說成錯的’即‘H0為真但說其是假’的概率,比如‘H0是不生病且事實上不生病 但說成生病’,I型錯誤由顯著性水平來控制,一般顯著性水平取0.05,那么I型錯誤最大就是5%。 |
II型錯誤 | 也稱作β錯誤,其意義為‘錯的說成對的’即‘H0為假但說其是真’的概率,比如‘H0是不生病且事實上生病 但統(tǒng)計判斷為不生病’,II型錯誤由β來控制,一般β取0.2,那么II型錯誤最大就是20%。 |
Power值 | Power值即功效值,其等于1-β值,其意義為‘錯的說成錯的’即‘H0為假且說其是假’的概率,比如‘H0是不生病且事實上生病 統(tǒng)計判斷為不生病’,一般β取0.2,那么Power=1-β=0.8,即通常需要保證‘錯的說成錯的’的最低把握度是80%。 |
Power功效分析的核心是研究Power,但其需要基于確定性的alpha值(I型錯誤)前提下,因為I型錯誤和II型錯誤有著聯(lián)系,二者是‘此消彼長’的關(guān)系,I型錯誤大那么II型錯誤小,I型錯誤小那么II型錯誤大。多數(shù)情況下alpha值默認為0.05(也取0.01、0.001或0.1等),除此之外,在研究Power值時,還有兩個影響因素,分別是:樣本量和‘差異幅度’,比如同樣的研究,分別1萬個樣本和100個樣本時,明顯的前者得到的Power值更高(‘錯的說成錯的’這種把握度更強更有信心)。與此同時,‘差異幅度’上,同樣的前提下,差異幅度分別是100和1,明顯的前者能得到更大的Power,這是很明顯的事情。Power功效分析通常用于分析Power和樣本量,因為alpha值通常是默認為0.05等,以及‘差異幅度’等是實驗預(yù)期或歷史實驗決定好的。
分析Power,即基于alpha值、差異幅度和樣本量前提時,得到的某某結(jié)論,它‘錯的說成錯的’這種情況的概率有多高。
分析樣本量,即基于alpha值、差異幅度和Power前提時,想達到‘錯的說成錯的’這種把握度,那么我們需要多少樣本量才能做到。
關(guān)于分析Power值
接下來以圖形形式展示Power功效的原理情況,Power功效分析中涉及4項,分別是Power值、alpha值、樣本量和差值。比如理解Power的原理時,首先基于某alpha值、樣本量和差值前提下,如下圖:
圖中基于alpha值為0.05,樣本量是189和研究差值為0.26這一前提時計算Power值,如何計算得到Power呢,正如圖示,H0=0但事實上是0.26,虛線正態(tài)圖表示預(yù)期的數(shù)據(jù)分布,帶顏色的正態(tài)圖為實際數(shù)據(jù)分布。圖中使用雙側(cè)因此兩個紅色區(qū)域相加為alpha值即0.05,那么對應(yīng)計算出來的統(tǒng)計臨界值Zcrit,如果小于該值則是‘拒絕H0’,但在‘實際數(shù)據(jù)分布’對應(yīng)時,小于該Zcrit值部分為拒絕H1即接受H0,即‘錯的說成對的’,所以‘錯的說成對的’的概率就是beta值,即圖中黑色部分, 那么1-beta就是power值 。
關(guān)于分析樣本量
接下來以圖形形式展示Power功效的計算樣本量應(yīng)用,Power功效分析中涉及4項,首先基于某alpha值、差值和Power值前提下,如下圖:
圖中基于alpha值為0.05,Power值為0.8(一般默認是取0.8即有80%的把握‘錯的說成是錯的’),差值為0.2前提時。正如圖示,H0=0但事實上是0.2,虛線正態(tài)圖表示預(yù)期的數(shù)據(jù)分布,帶顏色的正態(tài)圖為實際數(shù)據(jù)分布。圖中使用雙側(cè)因此兩個紅色區(qū)域相加為alpha值即0.05,那么對應(yīng)計算出來的統(tǒng)計臨界值Zcrit,如果小于該值則是‘拒絕H0’,‘回到實際數(shù)據(jù)分布‘時小于該Zcrit值為拒絕H1即接受H0,所以‘錯的說成對的’的概率就是beta值,即圖中黑色部分。那么想讓此整個事情具有科學(xué)性,則需要多少樣本量呢? 答案是192.22(此處是小數(shù),一般向上取整為193即)。即說明想達到‘對的說成錯的’這種錯誤率最多5%,并且差值為0.2,并且‘錯的說成錯的’把握度為80%這個事情,有193個樣本就可以讓其具有科學(xué)性。
- 1、剖析
- 涉及以下幾個關(guān)鍵點,分別如下:
SPSSAU中,Power原理提供可視化方式直觀理解Power原理,其僅作展示使用,具體實際計算見Power功效分析的其它分析方法功能點。
- 2、疑難解惑
- 如何理解alpha值和power值?
I型錯誤研究‘對的說成錯的’的概率,一般最大取0.05,那么此0.05即為alpha值即顯著性水平值。II型錯誤研究‘錯的說成對的’的概率,一般最大取0.2,那么此0.2即為beta值,那么Power值=1-beta值即0.8,其則表示為‘錯的說成錯的’的概率。