什么是對數(shù)優(yōu)勢以及為什么邏輯回歸使用對數(shù)優(yōu)勢?
簡單邏輯回歸的模型可寫為logit[P(Y=1)]=β0+β1 * X+error。在右手側(cè),這與簡單線性回歸模型相匹配(記住簡單線性回歸模型為Y=intercept+slope *X)。左手側(cè)包括一個“l(fā)ogit”函數(shù)(long o,soft g),其根據(jù)Y是變量(只能取0和1)的事實進(jìn)行調(diào)整。簡言之,logit是優(yōu)勢(Y=1)的對數(shù),“P(Y=1)”是Y等于1的概率。請注意,在此情況下,“P”是概率的縮寫,與P值無關(guān)。
如需理解什么是“對數(shù)優(yōu)勢”,了解對數(shù)的含義是很重要。優(yōu)勢等于Y=1的概率除以Y=0的概率。例如,如果Y=1的概率是0.8(或Y=1的概率是80%),則Y=0的概率是1-0.8或0.2(記住,Y只能是0或1,因此Y=0的概率是1-[Y=1的概率])。使用這些數(shù)據(jù),我可計算這兩個數(shù)據(jù)的優(yōu)勢:優(yōu)勢=P(Y=1)/P(Y=0)=0.8/0.2=4
在此情況下,優(yōu)勢為4。您會經(jīng)常聽到人們把這稱為4:1的優(yōu)勢,可將其讀作“4比1的優(yōu)勢”現(xiàn)在我們知道了優(yōu)勢與概率的關(guān)系,我們就可進(jìn)行最后一步來計算對數(shù)優(yōu)勢了。這只需要使用計算出的優(yōu)勢值,然后對該值取自然對數(shù)(Ln):對數(shù)優(yōu)勢=Ln(Odds)=Ln(P(Y=1)/P(Y=0))=Ln(P(Y=1)/[1-P(Y=1)])
以上列出的所有對數(shù)優(yōu)勢形式均是等價的,盡管這種數(shù)學(xué)方法聽起來很混亂,但我們完成所有這些工作的原因是,我們想建立Y=1(或Y=0)的概率模型。
更重要的是,我們想用線性模型(簡單邏輯回歸方程的右手側(cè))來模擬這種概率;叵胍幌,概率介于0和1之間。簡單邏輯回歸模型的右手側(cè),與簡單線性回歸模型一樣,可生成(理論上)從負(fù)無窮大到正無窮大的任何值。logit函數(shù)可用于這兩個范圍的連接。
從概率開始:這些值只能從0到1:
首先,我們?nèi)?yōu)勢,將該從0到1的標(biāo)度轉(zhuǎn)換成從0到+無窮大的標(biāo)度(計算0到1之間任何概率的優(yōu)勢,自己看吧。
接下來,我們?nèi)?yōu)勢的自然對數(shù),得到對數(shù)優(yōu)勢,它將標(biāo)度再次轉(zhuǎn)換為從負(fù)無窮大到正無窮大的標(biāo)度:
因此,可將logit函數(shù)視為使用數(shù)學(xué)運(yùn)算將模型右手側(cè)生成的值(可以是任何值)連接至概率的界限值(必須在0和1之間)。