Prism 9 新功能概覽:
- 新增主成分分析(PCA)
- 新增主成分回歸分析(PCR)
- 多元變量數(shù)據(jù)繪制氣泡圖(Bubble plot)
- t檢驗(yàn)生成評(píng)估圖(Estimation plot)
- 多元t檢驗(yàn)選項(xiàng)(配對(duì),非參數(shù)等)
- 從多元線性回歸和多元邏輯回歸中做插值
- 提升數(shù)據(jù)表列數(shù)上限
- 對(duì)多變量數(shù)據(jù)表的大量改進(jìn)
- 自動(dòng)向圖形中增加多重比較結(jié)果(自動(dòng)星標(biāo))
- 對(duì)所有分析做了改進(jìn)
Prism 9 核心功能介紹:
01 更高維度的數(shù)據(jù)
Prism 9對(duì)多變量數(shù)據(jù)表進(jìn)行了許多重大改進(jìn)。使用標(biāo)準(zhǔn)結(jié)構(gòu)可以分析更大的數(shù)據(jù)集,并執(zhí)行新的和改進(jìn)的分析,主要改進(jìn)如下:
- 提高了數(shù)據(jù)列的上限 - 在每個(gè)數(shù)據(jù)表中最多輸入1024列數(shù)據(jù)。
- 自動(dòng)識(shí)別變量類型 - 將多變量數(shù)據(jù)表中的變量識(shí)別為連續(xù)值,分類值或標(biāo)簽值。
- 數(shù)據(jù)表可輸入文本信息 - 直接以文本形式輸入數(shù)據(jù)。無(wú)需將變量編碼“0”和“1”,只需直接在數(shù)據(jù)表中輸入例如“Male”和“Female”。
- 自動(dòng)變量編碼 - 輸入你的數(shù)據(jù),讓Prism負(fù)責(zé)其余的工作。Prism會(huì)自動(dòng)將分類文本變量編碼為數(shù)值型啞變量。
通常,在研究中,我們會(huì)發(fā)現(xiàn)自己擁有實(shí)驗(yàn)中不同變量的大量信息。舉一個(gè)簡(jiǎn)單的例子,想象一下在給個(gè)體服用旨在降低血壓的實(shí)驗(yàn)藥物或安慰劑后,我們測(cè)量他們的血壓。除了記錄的血壓測(cè)量值之外,您還可能記錄了有關(guān)每個(gè)受試者的年齡、身高、體重、性別、種族以及許多其他可作為潛在變量的大量信息。
許多統(tǒng)計(jì)方法可以來(lái)分析這類“多變量”數(shù)據(jù),例如多元線性回歸和多元邏輯回歸。使用這些“多變量”分析,意味著您可以探索感興趣的結(jié)果而不會(huì)浪費(fèi)任何可能有用的信息。為了便于處理這種增加的數(shù)據(jù)信息密度,Prism提供了多變量數(shù)據(jù)表以將數(shù)據(jù)容納在標(biāo)準(zhǔn)數(shù)據(jù)結(jié)構(gòu)中,該數(shù)據(jù)結(jié)構(gòu)幾乎已在其他統(tǒng)計(jì)軟件或代碼包中普遍使用(例如R,SPSS和MATLAB)。在這種數(shù)據(jù)結(jié)構(gòu)格式中,每一列代表一個(gè)不同的變量,而每一行代表一個(gè)不同的受試者(每個(gè)受試者的每個(gè)變量的測(cè)量值將放入該受試者所在行的相應(yīng)列中)。
02 主成分分析(PCA)
有時(shí),收集的變量數(shù)量遠(yuǎn)遠(yuǎn)超過(guò)可供研究的受試者數(shù)量?匆幌禄虮磉_(dá)的研究,將受試者分為兩組:治療組和對(duì)照組,然后測(cè)量成百上千種不同基因的表達(dá)水平?赡苤皇亲兞刻喽鵁o(wú)法使模型適配數(shù)據(jù)。但是,簡(jiǎn)單的去掉一些變量不去分析,可能會(huì)導(dǎo)致丟失有價(jià)值的信息。選擇一些要從分析中排除的變量只會(huì)丟掉可能有用的信息!PCA就是這樣一種“降低維度”的技術(shù),可以用它來(lái)減少所需變量的數(shù)量,但同時(shí)從數(shù)據(jù)中消除盡可能少的信息。
其它PCA功能:
- 通過(guò)平行分析(以及Kaiser方法,總方差閾值方法等)來(lái)選擇成分。
- 生成碎石圖(Scree Plots)、分?jǐn)?shù)圖(Score Plots)和雙標(biāo)圖(Biplots)。
- 自動(dòng)準(zhǔn)備PCA的結(jié)果,以進(jìn)一步用于多元線性回歸(PCR - 主成分回歸)。
03 向圖表添加新的維度
可以從原始數(shù)據(jù) – 對(duì)符號(hào)位置(X和Y坐標(biāo))、大小及填充顏色等編碼的變量,直接創(chuàng)建氣泡圖。請(qǐng)注意,可以使用分類(分組)變量或連續(xù)變量來(lái)定義符號(hào)顏色和大小。
在此圖上,有100多個(gè)國(guó)家/地區(qū)顯示為單個(gè)圓圈。每個(gè)圓圈的X坐標(biāo)代表該國(guó)的GDP(PPP),而Y坐標(biāo)代表出生時(shí)的平均預(yù)期壽命。每個(gè)符號(hào)的大小與其所代表的國(guó)家的人口成比例(兩個(gè)最大的符號(hào)分別代表中國(guó)和印度)。最后,每個(gè)符號(hào)的顏色代表該國(guó)家所在的大洲。在這個(gè)例子里的變量(顏色)是分類變量,但氣泡圖中的顏色也可以像下面這樣由連續(xù)變量定義:
此圖中,符號(hào)的X坐標(biāo)、Y坐標(biāo)和大小的定義與上例相同。但是,現(xiàn)在該符號(hào)的顏色是連續(xù)的,其代表該國(guó)家每1000個(gè)人的出生率。Prism現(xiàn)在還具有內(nèi)置的半透明配色方案,以便可以更清晰地看到重疊的符號(hào)。
04 自動(dòng)將多個(gè)比較結(jié)果添加到圖形中
對(duì)多個(gè)成對(duì)比較執(zhí)行相應(yīng)的分析后,點(diǎn)擊一個(gè)按鈕就可以將這些結(jié)果自動(dòng)添加到圖形中。要自定義這些線和星號(hào),只需再次點(diǎn)擊工具欄的按鈕即可。如果對(duì)數(shù)據(jù)或分析進(jìn)行了調(diào)整,圖形上顯示的結(jié)果將自動(dòng)更新。但是請(qǐng)記住,P值只是你研究成果的一方面。別忘了還要報(bào)告效應(yīng)估計(jì)值(effect estimation,例如, 95%置信區(qū)間的均值差異)。
05 使用估計(jì)圖更好地可視化T檢驗(yàn)結(jié)果
添加P值以證明均值差異的95%CI與P值之間的關(guān)系。如果95%CI包括零,則P值 將 小于0.05。觀察95%CI比單獨(dú)使用P值更具參考價(jià)值。
執(zhí)行t檢驗(yàn)時(shí),Prism現(xiàn)在會(huì)自動(dòng)創(chuàng)建分析結(jié)果的估計(jì)圖(Estimation Plots )。在此圖上,兩組的原始數(shù)據(jù)都將繪制在左側(cè)的Y軸上。在右邊的Y軸上,將繪制組均值差異及其95%置信區(qū)間。該圖比只使用P值會(huì)提供更多的信息,因?yàn)樗粌H顯示了95%CI是否包括零,還顯示了95%CI的范圍(如果95%CI包括零,則P值將大于0.05,如果95%CI不包含零,則P值將小于0.05)。