什么是SD?
標(biāo)準(zhǔn)差(SD)量化了變異性或分散性,并以與數(shù)據(jù)相同的單位表示。
如果數(shù)據(jù)從高斯分布群體中抽樣得到,則你預(yù)計68%的值處于平均值的SD內(nèi),95%的值處于平均值的兩個SD內(nèi)。該圖示出了從高斯分布群體抽樣得到的250個值。陰影面積覆蓋平均值的一個正負(fù)SD,包括數(shù)值的約三分之二。虛線基于平均值加減兩個標(biāo)準(zhǔn)偏差繪出,約95%的值處于這些范圍內(nèi)。
以下圖表示出了標(biāo)準(zhǔn)偏差與高斯分布之間的關(guān)系。概率分布下面積代表整個群體,因此部分概率分布下面積代表群體的一部分。在左側(cè)圖表中,綠色(陰影)部分低于平均值的一個SD延伸到高于平均值的一個SD。綠色面積約占總面積的68%,因此略多于三分之二的值處于平均值加減一個SD的區(qū)間內(nèi)。右側(cè)圖表示出了約95%的值位于平均值的兩個標(biāo)準(zhǔn)偏差內(nèi)。
Q2 如果數(shù)據(jù)不服從高斯分布,如何解釋SD?
下圖示出了三組數(shù)據(jù),所有三組數(shù)據(jù)均具有完全相同的平均值和SD。左側(cè)樣本近似為高斯分布。另外兩個樣本遠(yuǎn)離高斯分布,但具有完全相同的平均值(100)和標(biāo)準(zhǔn)偏差(35)。
該圖表指出,如果假設(shè)數(shù)據(jù)服從高斯分布,但該假設(shè)不正確,則采用常規(guī)方式解釋平均值和SD時可能會產(chǎn)生誤導(dǎo)。SD仍然可以在不假設(shè)服從高斯分布的情況下進(jìn)行解釋。. 切比雪夫定理 提到,即使數(shù)據(jù)并非從高斯分布群體中抽樣得到:
- 至少75%的值必須位于平均值的兩個標(biāo)準(zhǔn)偏差內(nèi)
- 至少89%的值必須位于三個標(biāo)準(zhǔn)偏差內(nèi)
Q3 如何報告標(biāo)準(zhǔn)偏差?
許多人報告的平均值和標(biāo)準(zhǔn)偏差如下:“115±10 mmHg”,“方法”部分具有一條腳注或聲明,其將第二個值定義為標(biāo)準(zhǔn)偏差。
有人(1*,2*)稱,由于標(biāo)準(zhǔn)偏差是一個量化分散的單一值,因此它不應(yīng)跟在加號/減號之后,而應(yīng)采用下述方式:”115mHg (SD 10)”。
參考資料:
1* Curran - Everett D和Benos D。美國生理學(xué)會出版的期刊統(tǒng)計報告指南!禔JP - 胃腸和肝臟生理學(xué)》。2004年8月1日;287(2):G307。
2* Ludbrook J。臨床和實(shí)驗(yàn)藥理學(xué)和生理學(xué)的統(tǒng)計學(xué)介紹!杜R床實(shí)驗(yàn)藥物生理學(xué)》。2008年10月1日;35(10):1271 - 4;authorreply1274。