前幾天看了個視頻,是2024年諾貝爾經(jīng)濟學獎得主在分享自己的研究,研究問題是“制度如何形成并影響經(jīng)濟繁榮”,在研究這個問題的時候他的PPT中提到研究的統(tǒng)計過程中用到了工具變量,想著再次大家介紹一下這個方法。說不定利用這個方法,哪天我的讀者里面也出個諾貝爾獎得主呢,哈哈哈。
想象一下:你想知道“冰淇淋銷量”和“溺水人數(shù)”之間是否存在關(guān)系。你通過數(shù)據(jù)發(fā)現(xiàn),冰淇淋銷量高的月份,溺水人數(shù)也比較多。你可能會得出“吃冰淇淋導(dǎo)致溺水”的結(jié)論嗎?顯然不合理。
問題出在哪里?
這里存在一個“遺漏變量”——氣溫。
- 氣溫升高,人們更喜歡吃冰淇淋,導(dǎo)致冰淇淋銷量上升。
- 氣溫升高,人們更喜歡去游泳等水上活動,導(dǎo)致溺水人數(shù)上升。
所以,冰淇淋銷量和溺水人數(shù)之間并非直接的因果關(guān)系,而是都被氣溫這個共同的因素所影響。這種因為遺漏變量導(dǎo)致你研究的變量(冰淇淋銷量)和影響結(jié)果的“其他因素”(這些“其他因素”我們統(tǒng)稱為“誤差項”)產(chǎn)生關(guān)聯(lián)的情況,就叫做內(nèi)生性。
內(nèi)生性指的是,在統(tǒng)計模型中,解釋變量(比如“吃冰淇淋”)和誤差項(也就是我們沒有觀測到的其他影響因素)之間存在關(guān)聯(lián)。這會導(dǎo)致模型估計結(jié)果產(chǎn)生偏差,我們無法準確地推斷出因果關(guān)系。
In econometrics, endogeneity refers to the situation where an explanatory variable in a regression model is correlated with the error term
具體來說,內(nèi)生性通常由以下幾種原因引起:
1.遺漏變量(Omitted Variable): 模型中遺漏了一個或多個與解釋變量和因變量都相關(guān)的變量。
例子: 研究教育程度對工資收入的影響時,如果模型中沒有考慮到個人能力,而個人能力同時影響教育程度和工資收入,那么教育程度就與誤差項相關(guān),產(chǎn)生內(nèi)生性。
2.雙向因果關(guān)系(Simultaneity/Reverse Causality): 解釋變量和因變量之間存在互為因果的關(guān)系。
例子: 研究廣告支出對銷售額的影響時,廣告支出可以促進銷售額的增長,而高銷售額也可能反過來導(dǎo)致企業(yè)增加廣告投入,這就形成了雙向因果關(guān)系。
3.測量誤差(Measurement Error): 解釋變量的測量存在誤差,導(dǎo)致其與誤差項相關(guān)。
例子: 調(diào)查人們的收入水平時,受訪者可能由于各種原因(例如,記憶偏差、隱瞞真實收入等)而提供不準確的信息,這就導(dǎo)致收入的測量存在誤差,從而產(chǎn)生內(nèi)生性。
4.樣本選擇偏差(Sample Selection Bias): 研究對象的選擇并非隨機,而是基于某些與因變量相關(guān)的因素進行選擇,導(dǎo)致樣本不具有代表性,從而產(chǎn)生內(nèi)生性。
例子: 研究大學教育對畢業(yè)生收入的影響時,如果只有成功找到高薪工作的畢業(yè)生才愿意參與調(diào)查,那么樣本就存在選擇偏差,因為高收入本身就與接受大學教育的意愿和能力相關(guān)。
工具變量的概念:工具變量就像是一個“替身”,它可以幫助我們解決內(nèi)生性問題。為了解決內(nèi)生性問題,我們需要找到一個只影響“冰淇淋銷量”,而不直接影響“溺水人數(shù)”的變量。這個變量就叫做工具變量。一個好的工具變量需要有兩個重要特征,一個是相關(guān)性,另一個是外生性。
An instrumental variable (IV) is a variable that is correlated with the endogenous explanatory variable but is uncorrelated with the error term in the regression model
我們還是用剛剛“冰淇淋銷量”和“溺水人數(shù)”的例子來說明: 假設(shè)我們找到一個工具變量叫做“太陽鏡銷量”,這個變量它滿足:
- 相關(guān)性(Relevance): 氣溫升高,人們更喜歡買太陽鏡,所以“太陽鏡銷量”和“冰淇淋銷量”是相關(guān)的。工具變量與內(nèi)生解釋變量高度相關(guān)。這意味著工具變量能夠有效地預(yù)測內(nèi)生解釋變量的變動。
- 外生性(Exogeneity): “太陽鏡銷量”本身并不會直接導(dǎo)致溺水人數(shù)增加。它只能通過影響“冰淇淋銷量”來間接影響(或者說和“溺水人數(shù)”產(chǎn)生表面上的關(guān)聯(lián))。工具變量與誤差項不相關(guān)。這意味著工具變量不會通過其他渠道直接影響因變量,只能通過影響內(nèi)生解釋變量來間接影響因變量。
“太陽鏡銷量”就滿足了工具變量的兩個關(guān)鍵條件:
- 與內(nèi)生變量(冰淇淋銷量)相關(guān)。
- 與誤差項(影響溺水人數(shù)的其他因素,例如水域安全措施、游泳技能等)不相關(guān)。
工具變量的目的是將“冰淇淋銷量”這個解釋變量或者叫做自變量分解成兩部分:
- 受“太陽鏡銷量”影響的部分: 這部分和“溺水人數(shù)”的“其他影響因素”無關(guān)。
- 不受“太陽鏡銷量”影響的部分: 這部分可能和“溺水人數(shù)”的“其他影響因素”有關(guān)(也就是內(nèi)生性問題的來源)。
通過工具變量,我們只關(guān)注“冰淇淋銷量”中不受“其他影響因素”干擾的那部分,從而更準確地估計“冰淇淋銷量”和“溺水人數(shù)”之間的關(guān)系(雖然在這個例子中,我們期望得到的關(guān)系是不顯著的,也就是吃冰淇淋和溺水沒關(guān)系)。
再歸納一遍上述思路:就是我們要研究xy的關(guān)系,這個關(guān)系可能是相當復(fù)雜的,復(fù)雜到可能根本就無法直接估計,比如社會制度和繁榮的關(guān)系;那么這個時候我找到了一個和社會制度強相關(guān)的變量Z,并且這個Z和繁榮沒關(guān)系,那么我們就可以用Z和繁榮的關(guān)系去作為xy關(guān)系的估計。
但是變量Z其實是不好找的,根本不會存在Z和X完全相關(guān),所以我們依然是要借住統(tǒng)計方法將Z實際起作用的部分摳出來,變成xy的關(guān)系可以用受Z影響的x的部分和Y的關(guān)系作為估計。
兩階段最小二乘法(2SLS)工具變量最常用的應(yīng)用方法是兩階段最小二乘法:
- 第一階段: 用工具變量(太陽鏡銷量)去預(yù)測內(nèi)生變量(冰淇淋銷量),得到“冰淇淋銷量的預(yù)測值”。這個預(yù)測值只包含了“冰淇淋銷量”中受“太陽鏡銷量”影響的部分,因此和“其他影響因素”無關(guān)。
- 第二階段: 用“冰淇淋銷量的預(yù)測值”去預(yù)測因變量(溺水人數(shù))。這樣得到的估計結(jié)果就消除了內(nèi)生性帶來的偏差。
總體來說就是工具變量的本質(zhì)是尋找一個外生的變動來源,幫助我們分離出內(nèi)生變量中與誤差項無關(guān)的部分,從而更準確地估計變量之間的因果關(guān)系。
實例解析假設(shè)我們研究教育程度(Education)對工資收入(Wage)的影響。但是,教育程度可能存在內(nèi)生性問題,因為:
- 遺漏變量: 例如,個人能力可能同時影響教育程度和工資收入,如果模型中沒有控制個人能力,就會導(dǎo)致教育程度與誤差項相關(guān)。
- 雙向因果關(guān)系: 高工資收入也可能反過來激勵人們繼續(xù)接受教育。
我們可以使用“父母教育程度”(Parent Education)作為教育程度的工具變量來消除內(nèi)生性問題,因為它可能與個人的教育程度相關(guān)(父母教育程度高的子女更有可能接受更高的教育),但不太可能直接影響個人的工資收入(除非通過遺傳等其他途徑,但這種影響相對較弱,可以忽略不計)。
假設(shè)我現(xiàn)在有數(shù)據(jù)如下:
其中wage為因變量工資收入,education為自變量教育程度,parent_edu為工具變量父母教育程度。下面代碼便是這個例子中兩階段最小二乘的實操代碼
iv_model <- ivreg(wage ~ education | parent_edu, data = data) # |左邊是內(nèi)生變量,右邊是工具變量summary(iv_model, diagnostics = TRUE) #診斷信息,包括弱工具變量檢驗代碼中要注意公式的寫法:ivreg(income ~ edu | paredu, data = data:
- income ~ edu: 表示要估計的模型,即收入是教育水平的函數(shù)。
- | paredu: 表示paredu是edu的工具變量。
運行代碼后輸出結(jié)果如下:
可以看到模型估計的自變量的系數(shù)為0.3461,并且是顯著的,意味著受教育程度確實會影響工資收入。
設(shè)置參數(shù)diagnostics = TRUE,會輸出一系列的檢驗結(jié)果:
- Weak instruments(弱工具變量檢驗): 。F 統(tǒng)計量(First-stage F statistic)應(yīng)該足夠大(通常大于10),以避免弱工具變量問題。若F統(tǒng)計量過小,則說明工具變量與內(nèi)生變量的相關(guān)性不夠強,可能導(dǎo)致2SLS估計的偏差仍然很大。可以看到我們結(jié)果P很小,意思是拒絕了弱工具變量的原假設(shè)。
- Hausman test(豪斯曼檢驗): 用于檢驗是否存在內(nèi)生性。原假設(shè)是OLS估計是有效的(即不存在內(nèi)生性)。如果豪斯曼檢驗拒絕原假設(shè)(p 值小于顯著性水平),則表明存在內(nèi)生性,需要使用工具變量回歸。可以看到結(jié)果中該檢驗p值大,說明確實存在內(nèi)生性需要做兩階段最小二乘。
- Sargan test(薩根檢驗或過度識別檢驗): 僅當工具變量個數(shù)多于內(nèi)生變量個數(shù)時進行。檢驗工具變量的外生性是否成立。原假設(shè)是所有工具變量都是外生的。如果薩根檢驗拒絕原假設(shè),則表明至少有一個工具變量不是外生的,模型設(shè)定存在問題。在本例中,只有一個工具變量,因此不會有Sargan檢驗。
總之,工具變量回歸是一種重要的計量經(jīng)濟學方法,用于解決內(nèi)生性問題。正確理解和使用工具變量回歸需要仔細考慮工具變量的選擇、檢驗和解釋。在實際應(yīng)用中,應(yīng)該結(jié)合具體的研究問題和數(shù)據(jù)情況,謹慎使用工具變量回歸。