什么是SD?
標準差(SD)量化了變異性或分散性,并以與數(shù)據(jù)相同的單位表示。
如果數(shù)據(jù)從高斯分布群體中抽樣得到,則你預計68%的值處于平均值的SD內(nèi),95%的值處于平均值的兩個SD內(nèi)。該圖示出了從高斯分布群體抽樣得到的250個值。陰影面積覆蓋平均值的一個正負SD,包括數(shù)值的約三分之二。虛線基于平均值加減兩個標準偏差繪出,約95%的值處于這些范圍內(nèi)。
以下圖表示出了標準偏差與高斯分布之間的關系。概率分布下面積代表整個群體,因此部分概率分布下面積代表群體的一部分。在左側(cè)圖表中,綠色(陰影)部分低于平均值的一個SD延伸到高于平均值的一個SD。綠色面積約占總面積的68%,因此略多于三分之二的值處于平均值加減一個SD的區(qū)間內(nèi)。右側(cè)圖表示出了約95%的值位于平均值的兩個標準偏差內(nèi)。
Q2 如果數(shù)據(jù)不服從高斯分布,如何解釋SD?
下圖示出了三組數(shù)據(jù),所有三組數(shù)據(jù)均具有完全相同的平均值和SD。左側(cè)樣本近似為高斯分布。另外兩個樣本遠離高斯分布,但具有完全相同的平均值(100)和標準偏差(35)。
該圖表指出,如果假設數(shù)據(jù)服從高斯分布,但該假設不正確,則采用常規(guī)方式解釋平均值和SD時可能會產(chǎn)生誤導。SD仍然可以在不假設服從高斯分布的情況下進行解釋。. 切比雪夫定理 提到,即使數(shù)據(jù)并非從高斯分布群體中抽樣得到:
- 至少75%的值必須位于平均值的兩個標準偏差內(nèi)
- 至少89%的值必須位于三個標準偏差內(nèi)
Q3 如何報告標準偏差?
許多人報告的平均值和標準偏差如下:“115±10 mmHg”,“方法”部分具有一條腳注或聲明,其將第二個值定義為標準偏差。
有人(1*,2*)稱,由于標準偏差是一個量化分散的單一值,因此它不應跟在加號/減號之后,而應采用下述方式:”115mHg (SD 10)”。
參考資料:
1* Curran - Everett D和Benos D。美國生理學會出版的期刊統(tǒng)計報告指南!禔JP - 胃腸和肝臟生理學》。2004年8月1日;287(2):G307。
2* Ludbrook J。臨床和實驗藥理學和生理學的統(tǒng)計學介紹。《臨床實驗藥物生理學》。2008年10月1日;35(10):1271 - 4;authorreply1274。