第3章 統(tǒng)計(jì)案例
3.1 回歸分析的基本思想及其初步應(yīng)用
|
學(xué) 習(xí) 目 標(biāo)
|
核 心 素 養(yǎng)
|
|
1.了解隨機(jī)誤差、殘差、殘差圖的概念.(重點(diǎn))
2.會(huì)通過(guò)分析殘差判斷線性回歸模型的擬合效果.(重點(diǎn))
3.了解常見(jiàn)的非線性回歸模型轉(zhuǎn)化為線性回歸模型的方法.(難點(diǎn))
|
1.通過(guò)回歸分析的學(xué)習(xí),培養(yǎng)了學(xué)生數(shù)據(jù)分析的素養(yǎng).
2.借助回歸模型的建立,培養(yǎng)學(xué)生數(shù)學(xué)建模、數(shù)據(jù)分析及數(shù)學(xué)運(yùn)算的素養(yǎng).
|


1.回歸分析的相關(guān)概念
(1)回歸分析
回歸分析是對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法.
(2)回歸直線方程
方程=x+是兩個(gè)具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)的回歸方程,其中,是待定參數(shù),其最小二乘估計(jì)分別為:

其中=i,=i,(,)稱為樣本點(diǎn)的中心.
(3)線性回歸模型
線性回歸模型為y=bx+a+e,其中a和b為模型的未知參數(shù),e稱為隨機(jī)誤差,自變量x稱為解釋變量,因變量y稱為預(yù)報(bào)變量.
思考:在線性回歸模型y=bx+a+e中,e產(chǎn)生的原因主要有哪幾種?
[提示]隨機(jī)誤差產(chǎn)生的原因主要有以下幾種:
(1)所用的確定性函數(shù)不恰當(dāng)引起的誤差;
(2)忽略了某些因素的影響;
(3)存在觀測(cè)誤差.
2.殘差的概念
對(duì)于樣本點(diǎn)(x1,y1),(x2,y2),…,(xn,yn)而言,它們的隨機(jī)誤差為ei=yi-bxi-a,i=1,2,…,n,其估計(jì)值為i=yi-i=yi-xi-,i=1,2,…,n,i稱為相應(yīng)于點(diǎn)(xi,yi)的殘差.
3.刻畫(huà)回歸效果的方式
|
殘差圖
|
作圖時(shí)縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本編號(hào),或身高數(shù)據(jù),或體重的估計(jì)值等,這樣作出的圖形稱為殘差圖
|
|
殘差
圖法
|
殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說(shuō)明選用的模型比較合適,這樣的帶狀區(qū)域的寬度越窄,說(shuō)明模型擬合精度越高,回歸方程的預(yù)報(bào)精度越高
|
|
殘差
平方和
|
殘差平方和為(yi-i)2,殘差平方和越小,模型的擬合效果越好
|
|
相關(guān)
指數(shù)R2
|
R2=1-,R2表示解釋變量對(duì)于預(yù)報(bào)變量變化的貢獻(xiàn)率,R2越接近于1,表示模型的擬合效果越好
|

1.在如圖所示的四個(gè)散點(diǎn)圖中,適合用線性回歸模型擬合其中兩個(gè)變量的是( )

A.①② B.①③
C.②③ D.③④
B [結(jié)合散點(diǎn)圖可知①③中的散點(diǎn)大體分布在一條直線的左右兩側(cè),故選B.]
2.在兩個(gè)變量y與x的回歸模型中,分別選擇了4個(gè)不同模型,它們的相關(guān)指數(shù)R2如下,其中擬合效果最好的模型是( )
A.模型1的相關(guān)指數(shù)R2為0.98
B.模型2的相關(guān)指數(shù)R2為0.80
C.模型3的相關(guān)指數(shù)R2為0.50
D.模型4的相關(guān)指數(shù)R2為0.25
A [R2越大擬合效果越好,故選A.]