首先感謝Denver的帖子
http://xalimeijing.com/thread-1490167-1-1.html,讓大家有機(jī)會(huì)了解處理內(nèi)生性的常有辦法。
為了方便討論,做一下內(nèi)容限定。本文以中國(guó)省級(jí)數(shù)據(jù)為出發(fā)點(diǎn),假設(shè)主要數(shù)據(jù)均可以獲得。本來(lái)我想找?guī)讉(gè)期刊上的例子,但后來(lái)一想,這么做恐怕又要涉及到具體的作者和期刊,引起不必要的爭(zhēng)論。為了把主要精力放在問(wèn)題本身,我想用虛擬的例子,當(dāng)是沙盤(pán)推演的游戲。
省級(jí)面板數(shù)據(jù)(經(jīng)濟(jì)增長(zhǎng)與人口增長(zhǎng),1978-2008)
首先,假設(shè)我們要研究經(jīng)濟(jì)增長(zhǎng)(y_it)與人口增長(zhǎng)(x_it)之間的因果關(guān)系。用這個(gè)例子,大家都熟悉,即使不專(zhuān)門(mén)做這方面研究應(yīng)該也在日常生活中接觸過(guò)一些新聞。
其次,假設(shè)我們使用常規(guī)的省級(jí)固定效應(yīng)(a_i)+時(shí)間固定效應(yīng)(b_t),其他控制變量為z_it,擾動(dòng)項(xiàng)為e_it,常數(shù)項(xiàng)為c,則模型為
y_it=c+x_it+z_it+a_i+b_t+e_it
在分析中,我們會(huì)遇到“雙向因果”的難題。即,我們想知道人口增長(zhǎng)對(duì)經(jīng)濟(jì)增長(zhǎng)的貢獻(xiàn),但我們擔(dān)心經(jīng)濟(jì)增長(zhǎng)會(huì)反過(guò)來(lái)影響人口增長(zhǎng)。
現(xiàn)在,我們開(kāi)始正式討論工具變量。假如有人提出使用超生罰款(數(shù)據(jù)可以參見(jiàn):Scharping, Thomas, 2003, Birth Control in China 1949-2000)作為人口增長(zhǎng)的工具變量,這是否合適呢?(注:超生罰款是指違反當(dāng)?shù)赜?jì)生規(guī)定之后需要繳納的罰款,以收入的倍數(shù)作為衡量指標(biāo)。我們暫時(shí)不考慮超生罰款在各個(gè)年份中間變化率較小這個(gè)技術(shù)細(xì)節(jié)問(wèn)題。)
1、工具變量與內(nèi)生性變量的相關(guān)性。
這一條顯然是滿(mǎn)足的。省級(jí)計(jì)生政策會(huì)影響當(dāng)?shù)厝丝谠鏊佟?br />
2、工具變量的排他性。
大部分的研究,都在這個(gè)環(huán)節(jié)出現(xiàn)爭(zhēng)議(未必就是錯(cuò)誤)。在本案例中,計(jì)生政策是否會(huì)與遺漏變量相關(guān)。假設(shè)在z_it中我們控制一部分影響經(jīng)濟(jì)增長(zhǎng)的變量,如資本、教育、一些虛擬變量等。
由于使用了時(shí)間和省固定效應(yīng),又控制了重要的經(jīng)濟(jì)增長(zhǎng)決定因素,所以,可能會(huì)有讀者認(rèn)為計(jì)生政策在消除了諸多不可觀察因素之后與e_it應(yīng)該無(wú)關(guān)了。
但是,即使控制了上述這些變量和固定效應(yīng),超生罰款依然可能存在問(wèn)題。
計(jì)生政策的松緊與1949-1976年間各省的人口結(jié)構(gòu)和總?cè)丝谟嘘P(guān)系,假如我們把這段時(shí)期的人口結(jié)構(gòu)定義為m,那么工具變量除了通過(guò)x_it影響y_it外,還可以通過(guò)m影響y_it。這部分因素隨時(shí)間變化而變動(dòng),所以省固定效應(yīng)無(wú)法消除。由于通常意義上的教育變量定義的是當(dāng)年擁有中學(xué)文化程度的勞動(dòng)者占比,所以也不能刻畫(huà)這個(gè)變量。
為了確認(rèn)工具變量的有效性,應(yīng)該在穩(wěn)健性檢驗(yàn)中加入撫養(yǎng)比。如果模型中z_it只包括少數(shù)影響經(jīng)濟(jì)增長(zhǎng)的變量,那么也許會(huì)有問(wèn)題。
3 工具變量是否應(yīng)包含在主方程中?
此外,盡管超生罰款政策是改革開(kāi)放之后才有,但中國(guó)的人口控制政策卻分為三個(gè)階段在全國(guó)推開(kāi)。第一次是在60年代的北京天津上海;第二輪是在70年代中期,非少數(shù)民族聚居區(qū)的10多個(gè)省份展開(kāi);最后一次則是在改革開(kāi)放之后,在全國(guó)剩余省自治區(qū)全面推行。這個(gè)事實(shí)實(shí)際上暗含著一個(gè)非常重要的信息,當(dāng)前的計(jì)生政策松緊程度與一個(gè)地區(qū)的經(jīng)濟(jì)發(fā)展或多或少存在正相關(guān)。極端地說(shuō),超生罰款這個(gè)變量看似是人口增長(zhǎng)的工具變量,但其實(shí)它包括的信息本質(zhì)上包含了經(jīng)濟(jì)基礎(chǔ)和發(fā)展?jié)撃堋K,從某種角度說(shuō)它應(yīng)該是控制變量的一部分,因此,并不一定適合在此使用。
4 小結(jié)
這個(gè)例子,只是想說(shuō)明使用工具變量可能會(huì)存在許多“意外”。在本案例中,我們會(huì)想當(dāng)然認(rèn)定超生罰款與人口增長(zhǎng)有關(guān),并且在控制了其他因素的情況下,不會(huì)與遺漏變量相關(guān)。但實(shí)際操作中,問(wèn)題可能會(huì)非常復(fù)雜,未必如我們所愿。如果使用家庭或者個(gè)人數(shù)據(jù),被解釋變量換成其他的(如:家庭消費(fèi),個(gè)人收入,個(gè)人健康,等等),如果依然使用超生罰款做人口增長(zhǎng)(或者性別比例失衡等)的工具變量,那么問(wèn)題會(huì)更隱蔽。
如有表述錯(cuò)誤,歡迎批評(píng)指正。