- 線(xiàn)性回歸的目標(biāo)
- 線(xiàn)性回歸的計(jì)算原理
- 比較線(xiàn)性回歸和相關(guān)性
- 比較線(xiàn)性回歸和非線(xiàn)性回歸
- 通過(guò)線(xiàn)性回歸分析變換數(shù)據(jù)來(lái)分析非線(xiàn)性數(shù)據(jù)的方法存在哪些問(wèn)題
上一篇【簡(jiǎn)單線(xiàn)性回歸原理(一)】回顧:http://xalimeijing.com/thread-10410928-1-1.html
【比較線(xiàn)性回歸與相關(guān)性】
線(xiàn)性回歸不同于相關(guān)性。
01 二者的目的是什么?
線(xiàn)性回歸能夠找出根據(jù)X預(yù)測(cè)Y的最佳直線(xiàn)。相關(guān)性量化兩個(gè)變量的關(guān)聯(lián)程度。相關(guān)性不能擬合通過(guò)數(shù)據(jù)點(diǎn)的直線(xiàn)。你只是在計(jì)算相關(guān)系數(shù)(r),該系數(shù)可以告訴你一個(gè)變量隨另一個(gè)變量的變化。r為0.0時(shí),無(wú)相關(guān)性。r為正值時(shí),一個(gè)變量隨另一個(gè)變量升高而升高。r為負(fù)值時(shí),一個(gè)變量隨另一個(gè)變量下降而升高。
02 二者適用于哪種數(shù)據(jù)?
X為操縱的變量(時(shí)間、濃度等)時(shí),通常使用線(xiàn)性回歸。測(cè)量?jī)蓚(gè)變量時(shí),幾乎總會(huì)用到相關(guān)性。如果一個(gè)變量是可以通過(guò)試驗(yàn)操縱的變量,那么就不太適用。
03 哪個(gè)變量為X?哪個(gè)為Y?是否存在差異?
在回歸中決定將哪個(gè)變量稱(chēng)為“X”,哪個(gè)變量稱(chēng)為“Y”很重要,因?yàn)槿绻@兩個(gè)變量互換,將得到一條不同的最佳擬合線(xiàn)。根據(jù)X預(yù)測(cè)Y的最佳擬合線(xiàn)與根據(jù)Y預(yù)測(cè)X的最佳擬合線(xiàn)不同(然而,這兩條線(xiàn)具有相同的R2值)。通過(guò)相關(guān)性,你無(wú)需考慮因果關(guān)系。這兩個(gè)變量中的哪一個(gè)為“X”,哪一稱(chēng)為“Y”并不重要。如果將兩者互換,得到的相關(guān)系數(shù)相同。
04 假設(shè)
通過(guò)線(xiàn)性回歸,X值可測(cè)量或X值可以為試驗(yàn)者控制的變量。不假設(shè)X值是從高斯分布中抽樣。假設(shè)點(diǎn)到最佳擬合線(xiàn)的距離服從高斯分布,散點(diǎn)的SD與X或Y值無(wú)關(guān)。相關(guān)系數(shù)本身只是描述兩個(gè)變量如何一起變化的一種方式,因此可針對(duì)任何兩個(gè)變量進(jìn)行計(jì)算和解讀。但進(jìn)一步推理需另外假設(shè)X和Y均已測(cè)量(為區(qū)間或比率變量),兩者均從高斯分布中抽樣獲得。這稱(chēng)為“二元高斯分布”。如果這些假設(shè)為真,則可解讀r和P值的置信區(qū)間,r和P值能夠檢驗(yàn)零假設(shè) - 兩個(gè)變量之間實(shí)際上并無(wú)相關(guān)性(且你所觀(guān)察到的任何相關(guān)性均為隨機(jī)抽樣的結(jié)果)。
05 各結(jié)果之間的關(guān)系
線(xiàn)性回歸使用r2量化擬合優(yōu)度,有時(shí)用大寫(xiě)字母R2表示。如果將相同數(shù)據(jù)放入相關(guān)性(這很不合適;見(jiàn)上文),則基于相關(guān)性的r2等于基于 回歸的r2。
相關(guān)性計(jì)算皮爾森相關(guān)系數(shù)-r的值,范圍為-1到+1。
【比較線(xiàn)性回歸與非線(xiàn)性回歸】
01 線(xiàn)性和非線(xiàn)性回歸的目的
直線(xiàn)由一個(gè)簡(jiǎn)單的方程描述,可根據(jù)X、斜率和截距計(jì)算Y。線(xiàn)性回歸的目的在于找到定義最接近數(shù)據(jù)的直線(xiàn)的斜率和截距值。非線(xiàn)性回歸比線(xiàn)性回歸更通用,可使任何模型(方程)擬合你的數(shù)據(jù),其將查找一系列參數(shù)值,即生成曲線(xiàn)(與數(shù)據(jù)最接近)的那些參數(shù)。
02 線(xiàn)性和非線(xiàn)性回歸的工作原理
線(xiàn)性和非線(xiàn)性回歸均可找到使直線(xiàn)或曲線(xiàn)盡可能接近數(shù)據(jù)的參數(shù)值(線(xiàn)性回歸的斜率和截距)。更準(zhǔn)確地說(shuō),旨在盡量減少點(diǎn)到直線(xiàn)或曲線(xiàn)的垂直距離的平方和。線(xiàn)性回歸 使用可用初等代數(shù)完全解釋的數(shù)學(xué)運(yùn)算來(lái)實(shí)現(xiàn)該目的(許多統(tǒng)計(jì)學(xué)書(shū)籍中的顯示)。輸入數(shù)據(jù),答案就出來(lái)了,不會(huì)出現(xiàn)模棱兩可。如果你愿意,甚至可手動(dòng)計(jì)算。非線(xiàn)性回歸使用計(jì)算量比較大的,迭代方法這只能用微積分和矩陣代數(shù)進(jìn)行解釋?zhuān)摲椒ㄐ枰宽?xiàng)參數(shù)的初始估計(jì)值。
03 線(xiàn)性回歸是非線(xiàn)性回歸的特例
非線(xiàn)性回歸程序可擬合任何模型(包括線(xiàn)性模型)。線(xiàn)性回歸只是非線(xiàn)性回歸的特例。即使你的目的是使用數(shù)據(jù)中擬合一條直線(xiàn),也有許多情況選擇非線(xiàn)性回歸而非線(xiàn)性回歸的選擇。
使用非線(xiàn)性回歸分析數(shù)據(jù)只比使用線(xiàn)性回歸稍微難一點(diǎn)。對(duì)線(xiàn)性或非線(xiàn)性回歸的選擇應(yīng)基于你所擬合的模型。不得僅僅為避免使用非線(xiàn)性回歸而使用線(xiàn)性回歸。 避免過(guò)多轉(zhuǎn)換,例如Scatchard或Lineweaver-Burke轉(zhuǎn)換,其唯一目的是線(xiàn)性化你的數(shù)據(jù)。
----------------END----------------