天
應(yīng)用直線回歸的五點(diǎn)注意事項:
1、作回歸分析要有實(shí)際意義,不能把毫無關(guān)聯(lián)的兩種現(xiàn)象,隨意進(jìn)行回歸分析,忽視事物現(xiàn)象間的內(nèi)在聯(lián)系和規(guī)律;如對兒童身高與小樹的生長數(shù)據(jù)進(jìn)行回歸分析既無道理也無用途。另外,即使兩個變量間存在回歸關(guān)系時,也不一定是因果關(guān)系,必須結(jié)合專業(yè)知識作出合理解釋和結(jié)論。
2、直線回歸分析的資料,一般要求應(yīng)變量Y是來自正態(tài)總體的隨機(jī)變量,自變量X可以是正態(tài)隨機(jī)變量,也可以是精確測量和嚴(yán)密控制的值。若稍偏離要求時,一般對回歸方程中參數(shù)的估計影響不大,但可能影響到標(biāo)準(zhǔn)差的估計,也會影響假設(shè)檢驗時P值的真實(shí)性。
3、進(jìn)行回歸分析時,應(yīng)先繪制散點(diǎn)圖(scatterplot)。若提示有直線趨勢存在時,可作直線回歸分析;若提示無明顯線性趨勢,則應(yīng)根據(jù)散點(diǎn)分布類型,選擇合適的曲線模型,經(jīng)數(shù)據(jù)變換后,化為線性回歸來解決。一般說,不滿足線性條件的情形下去計算回歸方程會毫無意義,最好采用非線性回歸方程的方法進(jìn)行分析。
4、繪制散點(diǎn)圖后,若出現(xiàn)一些特大特小的離群值(異常點(diǎn)),則應(yīng)及時復(fù)核檢查,對由于測定、記錄或計算機(jī)錄入的錯誤數(shù)據(jù),應(yīng)予以修正和剔除。否則,異常點(diǎn)的存在會對回歸方程中的系數(shù)a、b的估計產(chǎn)生較大影響。
5、回歸直線不要外延。直線回歸的適用范圍一般以自變量取值范圍為限,在此范圍內(nèi)求出的估計值稱為內(nèi)插(interpolation);超過自變量取值范圍所計算的稱為外延(extrapolation)。若無充足理由證明,超出自變量取值范圍后直線回歸關(guān)系仍成立時,應(yīng)該避免隨意外延。