首先感謝Denver的帖子http://xalimeijing.com/thread-1490167-1-1.html,讓大家有機(jī)會(huì)了解處理內(nèi)生性的常有辦法。
為了方便討論,做一下內(nèi)容限定。本文以中國省級數(shù)據(jù)為出發(fā)點(diǎn),假設(shè)主要數(shù)據(jù)均可以獲得。本來我想找?guī)讉(gè)期刊上的例子,但后來一想,這么做恐怕又要涉及到具體的作者和期刊,引起不必要的爭論。為了把主要精力放在問題本身,我想用虛擬的例子,當(dāng)是沙盤推演的游戲。
省級面板數(shù)據(jù)(經(jīng)濟(jì)增長與人口增長,1978-2008)
首先,假設(shè)我們要研究經(jīng)濟(jì)增長(y_it)與人口增長(x_it)之間的因果關(guān)系。用這個(gè)例子,大家都熟悉,即使不專門做這方面研究應(yīng)該也在日常生活中接觸過一些新聞。
其次,假設(shè)我們使用常規(guī)的省級固定效應(yīng)(a_i)+時(shí)間固定效應(yīng)(b_t),其他控制變量為z_it,擾動(dòng)項(xiàng)為e_it,常數(shù)項(xiàng)為c,則模型為
y_it=c+x_it+z_it+a_i+b_t+e_it
在分析中,我們會(huì)遇到“雙向因果”的難題。即,我們想知道人口增長對經(jīng)濟(jì)增長的貢獻(xiàn),但我們擔(dān)心經(jīng)濟(jì)增長會(huì)反過來影響人口增長。
現(xiàn)在,我們開始正式討論工具變量。假如有人提出使用超生罰款(數(shù)據(jù)可以參見:Scharping, Thomas, 2003, Birth Control in China 1949-2000)作為人口增長的工具變量,這是否合適呢?(注:超生罰款是指違反當(dāng)?shù)赜?jì)生規(guī)定之后需要繳納的罰款,以收入的倍數(shù)作為衡量指標(biāo)。我們暫時(shí)不考慮超生罰款在各個(gè)年份中間變化率較小這個(gè)技術(shù)細(xì)節(jié)問題。)
1、工具變量與內(nèi)生性變量的相關(guān)性。
這一條顯然是滿足的。省級計(jì)生政策會(huì)影響當(dāng)?shù)厝丝谠鏊佟?br />
2、工具變量的排他性。
大部分的研究,都在這個(gè)環(huán)節(jié)出現(xiàn)爭議(未必就是錯(cuò)誤)。在本案例中,計(jì)生政策是否會(huì)與遺漏變量相關(guān)。假設(shè)在z_it中我們控制一部分影響經(jīng)濟(jì)增長的變量,如資本、教育、一些虛擬變量等。
由于使用了時(shí)間和省固定效應(yīng),又控制了重要的經(jīng)濟(jì)增長決定因素,所以,可能會(huì)有讀者認(rèn)為計(jì)生政策在消除了諸多不可觀察因素之后與e_it應(yīng)該無關(guān)了。
但是,即使控制了上述這些變量和固定效應(yīng),超生罰款依然可能存在問題。
計(jì)生政策的松緊與1949-1976年間各省的人口結(jié)構(gòu)和總?cè)丝谟嘘P(guān)系,假如我們把這段時(shí)期的人口結(jié)構(gòu)定義為m,那么工具變量除了通過x_it影響y_it外,還可以通過m影響y_it。這部分因素隨時(shí)間變化而變動(dòng),所以省固定效應(yīng)無法消除。由于通常意義上的教育變量定義的是當(dāng)年擁有中學(xué)文化程度的勞動(dòng)者占比,所以也不能刻畫這個(gè)變量。
為了確認(rèn)工具變量的有效性,應(yīng)該在穩(wěn)健性檢驗(yàn)中加入撫養(yǎng)比。如果模型中z_it只包括少數(shù)影響經(jīng)濟(jì)增長的變量,那么也許會(huì)有問題。
3 工具變量是否應(yīng)包含在主方程中?
此外,盡管超生罰款政策是改革開放之后才有,但中國的人口控制政策卻分為三個(gè)階段在全國推開。第一次是在60年代的北京天津上海;第二輪是在70年代中期,非少數(shù)民族聚居區(qū)的10多個(gè)省份展開;最后一次則是在改革開放之后,在全國剩余省自治區(qū)全面推行。這個(gè)事實(shí)實(shí)際上暗含著一個(gè)非常重要的信息,當(dāng)前的計(jì)生政策松緊程度與一個(gè)地區(qū)的經(jīng)濟(jì)發(fā)展或多或少存在正相關(guān)。極端地說,超生罰款這個(gè)變量看似是人口增長的工具變量,但其實(shí)它包括的信息本質(zhì)上包含了經(jīng)濟(jì)基礎(chǔ)和發(fā)展?jié)撃。所以,從某種角度說它應(yīng)該是控制變量的一部分,因此,并不一定適合在此使用。
4 小結(jié)
這個(gè)例子,只是想說明使用工具變量可能會(huì)存在許多“意外”。在本案例中,我們會(huì)想當(dāng)然認(rèn)定超生罰款與人口增長有關(guān),并且在控制了其他因素的情況下,不會(huì)與遺漏變量相關(guān)。但實(shí)際操作中,問題可能會(huì)非常復(fù)雜,未必如我們所愿。如果使用家庭或者個(gè)人數(shù)據(jù),被解釋變量換成其他的(如:家庭消費(fèi),個(gè)人收入,個(gè)人健康,等等),如果依然使用超生罰款做人口增長(或者性別比例失衡等)的工具變量,那么問題會(huì)更隱蔽。
如有表述錯(cuò)誤,歡迎批評指正。