侯有岐(正高級教師 特級教師)
(陜西省漢中市四〇五學校)
成對數(shù)據(jù)的統(tǒng)計分析是高考概率與統(tǒng)計考查的重點內容之一.這部分知識要求學生從過去的單變量觀察階段轉變到多變量的數(shù)據(jù)理性分析推斷階段,往往聚焦數(shù)學核心素養(yǎng),以解決生產(chǎn)生活中的實際問題為背景,考查學生的必備品格與關鍵能力,深受命題者的青睞.本文對成對數(shù)據(jù)的統(tǒng)計分析考查的常見題型及解題策略進行總結.
例1(1)(多選題)下列各圖中,兩個變量x,y具有相關關系的是( ).
(2)已知變量x和y滿足關系式y(tǒng)=-0.2x+3,變量y與z正相關,則下列結論中正確的是( ).
A.x與y正相 關,x與z負相關
B.x與y正相關,x與z正相關
C.x與y負相關,x與z負相關
D.x與y負相關,x與z正相關
(3)兩個變量y與x的回歸模型中,分別選擇了4個不同模型,它們的決定系數(shù)R2如下,其中擬合效果最好的模型是( ).
A.模型1的決定系數(shù)R2為0.98
B.模型2的決定系數(shù)R2為0.80
C.模型3的決定系數(shù)R2為0.50
D.模型4的決定系數(shù)R2為0.25
(2)因為y=-0.2x+3的斜率小于0,故x與y負相關.因為y與z正相關,可設z=by+a,b>0,則z=by+a=-0.2bx+3b+a,所以x與z負相關,故選C.
(3)在兩個變量y與x的回歸模型中,它們的決定系數(shù)R2越接近1,模型擬合效果越好,在四個選項中A 的決定系數(shù)最大,所以擬合效果最好的是模型1.故選A.
1)散點圖法:如果所有的樣本點都落在某一函數(shù)的圖像附近,那么變量之間有相關關系;如果所有的樣本點都落在某一直線附近,那么變量之間有線性相關關系.
2)相關系數(shù)法:利用相關系數(shù)判定,|r|越趨近于1,相關性越強.
3)決定系數(shù)法:利用決定系數(shù)判定,R2越接近1,模型的擬合效果越好,相關性越強.
例2某種機械設備隨著使用年限的增加,它的使用功能逐漸減退,使用價值逐年減少,通常把它使用價值逐年減少的“量”換算成費用,稱之為“失效費”.該種機械設備的使用年限x(單位:年)與失效費y(單位:萬元)的統(tǒng)計數(shù)據(jù)如表1所示.
表1
由表1數(shù)據(jù)可知,可用線性回歸模型擬合y與x的關系,請用相關系數(shù)加以說明(精確到0.01).
參考公式:相關系數(shù)
因為y與x的相關系數(shù)近似為0.99,所以y與x的線性相關程度相當大,因此可用線性回歸模型擬合y與x的關系.
2)確定R2:
例3某高中生參加社會實踐活動,對某公司1月份至6月份某種配件的銷售量及銷售單價進行了調查,銷售單價x(單位:元)和銷售量y(單位:千件)之間的一組數(shù)據(jù)如表2所示.
表2
(1)根據(jù)1月份至5月份的數(shù)據(jù),求y關于x的回歸直線方程;
(2)若由回歸直線方程得到的預報值與實際數(shù)據(jù)的誤差不超過0.5,則認為此回歸直線方程是理想的,試問(1)中的回歸直線方程是否理想?
(2)由(1)知,當x=8 時,14.4,此時有14.4-14.2=0.2<0.5,故可認為(1)中所得到的回歸直線方程是理想的.
例4某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費x(單位:千元)對年銷售量y(單位:t)和年利潤z(單位:千元)的影響.對近8年的年宣傳費xi和年銷售量yi(i=1,2,…,8)數(shù)據(jù)作了初步處理,得到下面的散點圖(如圖1)及一些統(tǒng)計量的值.
圖1
參考數(shù)據(jù):
(2)根據(jù)(1)的判斷結果及參考數(shù)據(jù),建立y關于x的回歸方程;
(3)已知這種產(chǎn)品的年利潤z與x,y的關系式為z=0.2y-x.根據(jù)(2)的結果回答下列問題:
(ⅰ)年宣傳費x=49時,年銷售量及年利潤的預測值是多少?
(ⅱ)年宣傳費x為何值時,年利潤的預測值最大?
附:對于一組數(shù)據(jù)(u1,v1),(u2,v2),…,(un,vn),其經(jīng)驗回歸直線的斜率和截距的最小二乘估計分別為
(1)由散點圖可以判斷,適宜作為年銷售量y關于年宣傳費x的回歸方程類型.
所以y關于w的經(jīng)驗回歸方程為因此y關于x的回歸方程為
(3)(ⅰ)由(2)知,當x=49時,年銷售量y的預測值,年利潤z的預測值
2)利用經(jīng)驗回歸方程進行預測,把經(jīng)驗回歸方程看作一次函數(shù),求函數(shù)值.
3)經(jīng)驗回歸方程的擬合效果可以利用相關系數(shù)判斷,當|r|越趨近于1時,兩變量的線性相關性越強.
例5(2022年全國甲卷文17)甲、乙兩城之間的長途客車均由A和B兩家公司運營.為了解這兩家公司長途客車的運行情況,隨機調查了甲、乙兩城之間的500個班次,得到列聯(lián)表如表3所示.
表3
(1)根據(jù)表3,分別估計這兩家公司甲、乙兩城之間的長途客車準點的概率;
(2)能否有90%的把握認為甲、乙兩城之間的長途客車是否準點與客車所屬公司有關?
表4
(2)列聯(lián)表如表5所示.根據(jù)臨界值表可知,有90%的把握認為甲、乙兩城之間的長途客車是否準點與客車所屬公司有關.
表5
1)2個明確:明確兩類主體;明確研究的兩個問題.
2)2 個關鍵:準確畫出2×2 列聯(lián)表;準確求解K2.
縱觀近幾年高考的概率與統(tǒng)計試題,成對數(shù)據(jù)的統(tǒng)計分析占有相當高的比重,而且命題形式也逐步趨于平穩(wěn),注重落實?中國高考評價體系?中四層四翼的考核要求.試題命制背景多與生產(chǎn)生活實際緊密聯(lián)系,文字量大,信息多,對學生的閱讀理解能力、信息獲取能力和批判性思維能力有較高的要求.因此,筆者希望學生在復習中注重提高用數(shù)學概念、原理解讀具體問題和提煉有用信息的能力,強化運算求解能力和統(tǒng)計推斷思維.
(完)