- 計算每個值與樣本平均值之間差值的平方;
- 將這些值相加;
- 將總和除以N - 1。將其稱為方差;
- 開平方根,獲得標(biāo)準(zhǔn)偏差;
上面這個是一套基本的計算方式,接下來我們逐一看看你可能會有的一些疑惑。
Q1 “為什么是 n - 1?”
為什么在上述第三步中除以n - 1(而非N)?在第1步中,計算每個值和這些值的平均值之差。你不知道群體的實際平均值,只知道樣本的平均值。除樣本平均值恰好等于群體平均值的罕見情況外,數(shù)據(jù)將更接近樣本平均值,而非實際群體平均值。因此,你在第2步中計算的值可能會比在第1步中使用實際群體平均值時的值小一點(且無法更大)。為彌補(bǔ)這一不足,我們除以n - 1而非n。
但是,為什么使用n - 1?如果你知道樣本平均值,以及除了一個值之外的所有值,則可以計算最后一個值必須是什么。統(tǒng)計學(xué)家們稱存在n - 1 自由度。
Q2 “但我看到方程的分母中是n,而非n - 1?”
n - 1方程用于分析數(shù)據(jù)樣本,并希望得到更接近一般結(jié)論的常見情況。以此方式計算的SD(分母中為n - 1)是你對總?cè)后wSD值的最佳猜測。
如果你只是想要量化一組特定數(shù)據(jù)的變化,而不打算外推以得到更廣泛的結(jié)論,則在分母中使用N計算SD。由此產(chǎn)生的SD是這些特定值的SD,但很可能低估這些數(shù)值點提取群體的SD。
科學(xué)的目標(biāo)始終是普遍化,因此在分析科學(xué)數(shù)據(jù)時,不應(yīng)在方程的分母中使用n。我能想到的唯一一個在分母中使用n(而非n - 1)可能有意義的示例是量化檢測評分之間的差異。但更好的方法是顯示每個評分的散點圖,或者頻率分布直方圖。
Prism始終使用n - 1計算SD。
Q3 "計算SD需要多少個值?"
SD量化的是離散度,所以只有一個值是不行的。那么兩個值夠不夠呢?很多人認(rèn)為只有兩個值也是無法計算SD的。其實不然,當(dāng)你只有重復(fù)(n = 2)的數(shù)據(jù)時,也是可以正常計算SD方程的。
大家所關(guān)心的是,這樣的結(jié)果是否真的有效?
我們可以用模擬計算來回答這個問題。我們模擬一萬個n = 2的數(shù)據(jù)集,并且每個數(shù)據(jù)點均從高斯分布中隨機(jī)選取。由于所有統(tǒng)計檢驗實際上均以方差(SD的平方)為基礎(chǔ),因此我比較了根據(jù)重復(fù)數(shù)據(jù)計算的方差和真正方差。模擬數(shù)據(jù)的10,000個方差的平均值與模擬數(shù)據(jù)來源真正方差的差異不超過1%。這意味著根據(jù)重復(fù)數(shù)據(jù)計算的SD是對數(shù)據(jù)離散度的有效評估。其同樣可能過高或過低,但也可能距離真SD非常遠(yuǎn)。
Q4 “如何使用Excel計算SD?”
Excel可以使用STDEV()函數(shù),根據(jù)一系列值計算SD。例如,如果你想知道單元格B1 - B10中值的SD,則在Excel中使用以下公式:
= STDEV(B1:B10)
該函數(shù)在分母中使用n - 1,計算SD。如果你想在分母中使用N以計算SD(見上文),則使用Excel的STDEVP()函數(shù)。
Q5 “SE和SEM是一回事兒嗎?”
不是一回事兒!
標(biāo)準(zhǔn)偏差(SD)與平均值標(biāo)準(zhǔn)誤差(SEM)之間的差值很容易混淆。主要差異在于:
- SD量化了分散 - 值之間的差值有多大;
- SEM量化了你對總體實際平均值的了解程度。其考慮了SD的值和樣本量;
- SD和SEM均在相同單位內(nèi)--數(shù)據(jù)的單位;
- 根據(jù)定義,SEM始終小于SD;
- 隨著你的樣本變大,SEM變小。這有意義,因為大樣本的平均值可能比小樣本的平均值更接近真實的總體平均值。在一個巨大樣本的情況下,即使數(shù)據(jù)非常分散,但你也能非常精確地知道平均值的值;
- 隨著你獲得更多的數(shù)據(jù),SD不會發(fā)生可預(yù)測的變化。你從樣本中計算出的SD是對總體SD的最佳估計。隨著你收集更多的數(shù)據(jù),你將更精確地評估總體的SD。但你不能預(yù)測來自大樣本的SD是否會大于或小于來自小樣本的SD。(嚴(yán)格來說,這并不正確。其為方差--SD平方--不會發(fā)生可預(yù)測的變化,但SD的變化微不足道,且比SEM中的變化小得多)
注意:對于你幾乎可根據(jù)數(shù)據(jù)計算出任何參數(shù),你可計算標(biāo)準(zhǔn)誤差,而不僅僅是平均值!皹(biāo)準(zhǔn)誤差”一詞有些許模棱兩可。上述各點僅指平均值的標(biāo)準(zhǔn)誤差。