通常情況下,我們研究X對于Y的影響作用關系,可以使用OLS回歸,并且OLS回歸時默認認為數(shù)據之間具有獨立性(即行與行之間具有完整的獨立性并不互相影響),但當前有的數(shù)據并非如此,比如各省GDP之間具有影響作用關系,北京的GDP可以拉動天津的GDP提升,即如果研究的樣本是31個省,那么此31個省(樣本)之間本身就具有相互影響關系,即樣本之間不獨立,而且樣本之間具有‘空間性’,此則空間計量研究的內容,空間計量是在普通計量基礎上加入‘空間性’,此‘空間性’是通過‘空間權重矩陣’進行體現(xiàn),其表示樣本之間的相關關系情況,比如31個省市之間是否具有相鄰關系,也或者31個省市之間的物理距離或者經濟距離情況等。‘空間權重矩陣’類似如下圖:
比如上圖中的空間權重矩陣,其表示中國31個省市之間空間關系,此關系為兩兩省份之間是否具有相鄰性,數(shù)字1表示具有相鄰關系數(shù)字0表示沒有。比如北京和天津相鄰因而為1,也比如上海和浙江相鄰為1。當然里面的數(shù)字也可以為小數(shù),小數(shù)時很可能就是表示兩兩間的比如物理距離或者經濟距離等。但無論如何,空間權重矩陣具有如下特點:
第1:對稱性; 其一定滿足M(i, j)=M(j, i)這一特點,該特點很明顯,北京和天津相鄰,那么天津和北京也相鄰;
第2:主對角線為0;主對角線表示自己與自己的關系,永遠為數(shù)字0;
第3:n*n階矩陣,比如31個省那就是31*31矩陣,只是第1行為省的名稱而已;
第4:標準化處理;試著想象下,數(shù)字如果是物理距離,那么北京挨著天津很近所以數(shù)字很小,但是北京離新疆或者海南就會非常遠數(shù)字很大,因而通常需要對空間權重矩陣進行量綱化處理,正常情況下會使用‘按行標準化’處理這一方式,其表示某行的任意數(shù)字除以該行數(shù)字之和,處理后其數(shù)字的實際意義為相對在空間上的相對距離值。
本文檔的空間OLS回歸,其實質就是OLS回歸,但其會輸出模型LM檢驗等,用于進一步判斷適合的空間模型使用。
在使用空間計量相關的方法時,其均需要‘空間權重矩陣’和‘分析數(shù)據’兩份數(shù)據,并且均需要單獨上傳到SPSSAU中,并且對‘分析數(shù)據’進行分析時,下拉選擇對應的‘空間權重矩陣’,操作上分為以下3個步驟。
第1:上傳‘空間權重矩陣’文檔
此處需要注意:上傳的數(shù)據需要為n*n階格式,而且第1行為空間點的名稱(比如31省市的名稱)。類似下圖格式:
第2:上傳‘分析數(shù)據’文檔
此處需要注意:比如31省市數(shù)據,‘空間權重矩陣’有著該31個空間點的順序比如北京-》天津-》河北-》山西-》…,那么‘分析數(shù)據’的31行數(shù)據也需要按此順序才可以。
第3:針對‘分析數(shù)據’進行分析,并且選擇‘空間權重矩陣’文檔
此處需要注意:進行某空間研究方法時需要下拉選擇‘空間權重矩陣’,選擇后,SPSSAU會自動判斷其是否為‘空間權重矩陣’格式,包括是否為n*n階結構,是否具有對稱性等。如果不是則會進行信息提示,請勿必注意空間權重矩陣數(shù)據格式。
空間OLS回歸案例
- 1、背景
當前有一份空間數(shù)據,其為美國哥倫布市49個社區(qū)的相關數(shù)據,包括犯罪率(crime)、房價(hoval)和家庭收入(income),當前希望研究房價和家庭收入對于犯罪率的影響關系,并且在研究這一影響關系時,考慮空間性。部分數(shù)據如下圖所示:
上面展示的是‘分析數(shù)據’,共有49個社區(qū),該49個社區(qū)對應的‘空間權重矩陣’如下圖所示:
圖中數(shù)字1表示兩個空間點(社區(qū))之間相鄰,數(shù)字0表示兩個社區(qū)不相鄰?臻g權重矩陣數(shù)據可點擊此處下載。
- 2、理論
空間OLS回歸的目的是進行OLS回歸時計算LM檢驗,利用LM檢驗進一步判斷適合的空間計量模型,其會輸出LM檢驗用于判斷選擇最優(yōu)的空間計量模型,其回歸結果實質上就是普通OLS回歸模型結果。
LM檢驗是空間OLS回歸最核心表格,結合LM檢驗結果,可選擇最優(yōu)的空間計量模型,比如是使用空間滯后SLM(也稱SAR模型),還是空間誤差模型,也或者應該不考慮空間性直接使用OLS回歸結果等,針對LM檢驗的判斷流程建議如下圖所示:
進行空間OLS回歸時輸出4個LM檢驗,首先針對LM-error和LM-lag進行分析,如果二者均不顯著,則應該使用OLS回歸即可,如果僅LM-error顯著則使用空間誤差模型,如果僅LM-lag顯著則使用空間滯后模型,如果二者均顯著,則需要進一步查看Robust LM檢驗;
基于LM-error和LM-lag均顯著時,則需要結合Robust LM-error和Robust LM-lag檢驗進一步判斷,如果Robust LM-error和Robust LM-lag檢驗均不顯著,此時退回到上一步即對比LM-error和Lm-lag這兩個檢驗對應的卡方值,哪個更大則使用更大對應的模型,比如LM-error檢驗的卡方值更大則使用空間誤差模型,如果LM-lag檢驗的卡方值更大則使用空間滯后模型;如果僅Robust LM-error顯著則使用空間誤差模型,如果僅Robust LM-lag顯著則使用空間滯后模型,如果Robust LM-error和Robust LM-lag檢驗二者均顯著,此時可使用二者中對應卡方值更大時對應的模型(或者結合信息準則判斷模型優(yōu)劣),比如Robust LM-lag檢驗的卡方值比Robust LM-error檢驗時的卡方值更大,那么可使用空間滯后模型,當然也可考慮使用空間滯后誤差模型(即一般空間模型SAC)。
除此之外,通常情況下,空間OLS回歸(即普通OLS回歸)可作為一個參照模型與最終使用的空間模型進行對比分析。
- 3、操作
本例子操作如下:
下拉選擇‘空間權重矩陣’文檔即spatialweight這份數(shù)據,默認對空間權重矩陣行標準化處理,需要注意的是,空間權重矩陣通常需要進行行標準化處理。
- 4、SPSSAU輸出結果
SPSSAU共輸出7個表格,分別是模型基本參數(shù)等、空間OLS模型分析結果、空間OLS模型LM檢驗匯總、空間OLS模型相關檢驗匯總、信息準則指標結果、空間效應分析和空間OLS回歸分析結果-簡化格式表格,如下所述。
表格
說明
模型基本參數(shù)等
輸出模型的基礎參數(shù)值信息等
空間OLS模型分析結果
輸出空間OLS(實質上就是OLS回歸結果)
空間OLS模型LM檢驗匯總
輸出核心的LM檢驗結果,用于判斷選擇最優(yōu)的空間計量模型
空間OLS模型相關檢驗匯總
輸出比如異方差檢驗結果等
信息準則指標結果
輸出ML極大似然法估計的信息準則指標等
空間效應分析
輸出空間效應分析表格
空間OLS回歸分析結果-簡化格式表格
輸出OLS回歸結果的簡化表格格式
- 5、文字分析
上表格模型的基本參數(shù)信息,包括具體的空間計量模型名稱,是否使用穩(wěn)健標準誤差,空間權重矩陣名稱及是否對其進行標準化處理等,模型估計方法等,表格中僅展示模型的參數(shù)信息等無特別分析意義。
上表格展示OLS模型回歸結果,但空間OLS回歸核心目的在于得到LM檢驗,用于判斷最終應該使用哪個空間模型,結合LM檢驗流程圖最終可進行判斷選擇,當然最終也可能使用OLS回歸結果(此種情況下意味著沒有空間效應),如果是此類情況則直接使用上表格即可。
上表格展示最核心的LM檢驗結果,從上表格可以看到,LM-error和LM-lag這兩個檢驗均呈現(xiàn)出顯著性,因而進一步對Robust LM-error和Robust LM-lag這兩個進行分析,但是這兩項均沒有呈現(xiàn)出顯著性,因而又退回去判斷LM-error和Lm-lag檢驗。LM-error對應的卡方值為4.246 < Lm-lag檢驗對應的卡方值6.595,因而最終使用LM-lag檢驗對應的空間滯后模型(即SLM模型或者SAR模型)結果較優(yōu),那么后面則需要使用SPSSAU對應的空間滯后模型進行分析。
上表格展示OLS回歸對應的異方差White檢驗,BP檢驗和JB檢驗等,由于空間模型更多關注于空間性,因而上表格的關注度通常不高,當然如果有著異方差問題時,此時可使用穩(wěn)健標準誤差法進行估計即可。
上表格展示信息準則結果表格,包括llf值和另外兩個值即AIC值和Schwarz準則值,llf值通常越大越好,但是AIC值和Schwarz準則值均是越小越好,如果希望對比模型優(yōu)劣,可考慮使用上述三個指標,但需要注意的是,極大似然法估計ML法時才會輸出上述指標,如果是比如GMM估計則沒有輸出上述指標。
空間計量研究時,通常會關注于空間效應,其中直接效應ADI反映自變量X對于自身區(qū)域Y的平均影響效應情況,間接(溢出)效應AII反應自變量X對其它區(qū)域Y的平均影響效應情況,總效應ATI=直接效應ADI+間接(溢出)效應AII。但是本文檔中為空間OLS回歸,其就是普通OLS回歸,并沒有任何的空間效應,因而AII值全部均為0。
上表格展示OLS回歸的簡化表格格式,由于本案例數(shù)據最終應該使用空間滯后SLM(或SAR模型),因而本處不單獨進行分析。
- 6、剖析
- 涉及以下幾個關鍵點,分別如下:
空間OLS回歸時需要核心關注LM檢驗,結合LM檢驗流程選擇最優(yōu)的空間計量模型,LM檢驗的解讀上帶有一定的主觀性判斷,建議結合實際數(shù)據情況進行選擇使用。
空間OLS回歸,其實質上就是普通OLS回歸,但其加入空間權重矩陣因而會輸出LM檢驗結果。
疑難解惑
- 空間計量LM檢驗的解讀?
通常情況下,LM檢驗時首先針對LM-error和LM-lag進行判斷,如果二者均顯著則應該進一步使用Robust LM-error和Robust LM-lag進行判斷選擇,如果僅LM-error顯著則使用空間誤差模型,如果僅LM-lag顯著則使用空間滯后模型,如果二者均不顯著則使用空間OLS回歸即此時沒有空間效應
如果LM-error和LM-lag均顯著時,進一步對Robust LM-error和Robust LM-lag進行判斷,如果Robust LM-error和Robust LM-lag均顯著,則通常可選擇二者中更大卡方值的項,比如Robust LM-error對應的卡方值更大則使用空間誤差模型,如果Robust LM-lag對應的卡方值更大則使用空間滯后模型。如果僅Robust LM-error顯著則使用空間誤差模型,如果僅Robust LM-lag顯著則使用空間滯后模型。如果Robust LM-error和Robust LM-lag均不顯著時,那么則退回去判斷LM-error和LM-lag,對比LM-error和LM-lag那個對應的卡方值更大,比如LM-error對應的卡方值更大則使用空間誤差模型(如果LM-lag對應的卡方值更大則使用空間滯后模型)。