第一章 Stata 概貌
§1.1 Stata 的功能、特點(diǎn)和背景
Stata 是一個(gè)用于分析和管理數(shù)據(jù)的功能強(qiáng)大又小巧玲瓏的實(shí)用統(tǒng)計(jì)分析軟件由美國(guó)計(jì)算機(jī)資源中心
Computer Resource Center研制。從 1985 至 1998 的十四年時(shí)間里已連續(xù)推出 1.11.21.31.4
1.5""及 2.02.13.03.14.05.06.0 等多個(gè)版本通過(guò)不斷更新和擴(kuò)充內(nèi)容日趨完善。
它同時(shí)具有數(shù)據(jù)管理軟件、統(tǒng)計(jì)分析軟件、繪圖軟件、矩陣計(jì)算軟件和程序語(yǔ)言的特點(diǎn)又在許多方面別
具一格。Stata 融匯了上述程序的優(yōu)點(diǎn)克服了各自的缺點(diǎn)使其功能更加強(qiáng)大操作更加靈活、簡(jiǎn)單
易學(xué)易用越來(lái)越受到人們的重視和歡迎。
Stata 的突出特點(diǎn)是只占用很少的磁盤空間輸出結(jié)果簡(jiǎn)潔所選方法先進(jìn)內(nèi)容較齊全制作的圖形十
分精美可直接被圖形處理軟件或字處理軟件如 WORD 等直接調(diào)用。
一、 Stata 的數(shù)據(jù)管理能力
1. Stata 的數(shù)據(jù)管理空間受計(jì)算機(jī)的操作系統(tǒng)和計(jì)算機(jī)擴(kuò)展內(nèi)存的影響。對(duì) 640k 內(nèi)存的微機(jī)3.1
版本的 Stata 可以管理 2400 個(gè)記錄×99 個(gè)變量并隨計(jì)算機(jī)擴(kuò)展內(nèi)存的增加而增加對(duì) 4.0 的
WINDOWS 版本Stata 可以管理 4800 個(gè)記錄×99 個(gè)變量對(duì) WINDOWS 95 下的 5.0 版本可根據(jù)計(jì)
算機(jī)的配置情況設(shè)置變量數(shù)和記錄數(shù)如 32M 擴(kuò)展內(nèi)存的計(jì)算機(jī)可處理 2 千萬(wàn)個(gè)數(shù)據(jù)。變量數(shù)
和記錄數(shù)可以互相交易trade即減少記錄數(shù)可以增加變量數(shù)減少變量數(shù)可以增加記錄數(shù)。
2. 可以將分組變量轉(zhuǎn)換成指示變量(啞變量)將字符串變量映射成數(shù)字代碼。
3. 可以對(duì)數(shù)據(jù)文件進(jìn)行橫向和縱向鏈接可以將行數(shù)據(jù)轉(zhuǎn)為列數(shù)據(jù)或反之。
4. 可以恢復(fù)、修改執(zhí)行過(guò)的命令。
5. 可以利用數(shù)值函數(shù)或字符串函數(shù)產(chǎn)生新變量。
6. 可以從鍵盤或磁盤讀入數(shù)據(jù)。
二、 Stata 的統(tǒng)計(jì)功能
Stata 的統(tǒng)計(jì)功能很強(qiáng)除了傳統(tǒng)的統(tǒng)計(jì)分析方法外還收集了近 20 年發(fā)展起來(lái)的新方法如 Cox 比例風(fēng)
險(xiǎn)回歸指數(shù)與 Weibull 回歸多類結(jié)果與有序結(jié)果的 logistic 回歸Poisson 回歸、負(fù)二項(xiàng)回歸及廣義
負(fù)二項(xiàng)回歸隨機(jī)效應(yīng)模型等。具體說(shuō)Stata 具有如下統(tǒng)計(jì)分析能力
1. 數(shù)值變量資料的一般分析參數(shù)估計(jì)檢驗(yàn)單因素和多因素的方差分析協(xié)方差分析交互
效應(yīng)模型平衡和非平衡設(shè)計(jì)嵌套設(shè)計(jì)隨機(jī)效應(yīng)多個(gè)均數(shù)的兩兩比較缺項(xiàng)數(shù)據(jù)的處理
方差齊性檢驗(yàn)正態(tài)性檢驗(yàn)變量變換等。
2. 分類資料的一般分析參數(shù)估計(jì)列聯(lián)表分析
2 檢驗(yàn)列聯(lián)系數(shù)確切概率)流行病學(xué)表格分
析等。
3. 等級(jí)資料的一般分析秩變換秩和檢驗(yàn)秩相關(guān)等。
4. 相關(guān)與回歸分析簡(jiǎn)單相關(guān)偏相關(guān)典型相關(guān)以及多達(dá)數(shù)十種的回歸分析方法如多元線性
回歸逐步回歸加權(quán)回歸穩(wěn)鍵回歸二階段回歸百分位數(shù)(中位數(shù))回歸殘差分析、強(qiáng)影
響點(diǎn)分析曲線擬合隨機(jī)效應(yīng)的線性回歸模型等。
5. 危險(xiǎn)度分析條件和非條件的 logistic 回歸多類結(jié)果與有序結(jié)果的 logistic 回歸Probit 回
歸及其他廣義線性模型隨機(jī)效應(yīng)的 logistic 回歸隨機(jī)效應(yīng)的 Poisson 回歸等。
6. 生存分析基線生存曲線的估計(jì)、相對(duì)危險(xiǎn)度的估計(jì)Kaplan-Meier 生存曲線、壽命表分析對(duì)
數(shù)秩檢驗(yàn)Mantel-Haenszel 檢驗(yàn)Wilcoxon-Gehan 檢驗(yàn)Cox 比例風(fēng)險(xiǎn)模型正態(tài)截尾及 Tobit
回歸指數(shù)回歸和 Weibull 回歸等。
7. 其它方法質(zhì)量控制整群抽樣的設(shè)計(jì)效率診斷試驗(yàn)評(píng)價(jià)kappa等。
三、 Stata 的作圖功能
Stata 的作圖模塊主要提供如下八種基本圖形的制作: 直方圖(histogram)條形圖(bar), 百分條圖
(oneway)百分圓圖(pie)散點(diǎn)圖(twoway)散點(diǎn)圖矩陣(matrix)星形圖(star)分位數(shù)圖。這些圖