陳侃 陳梅
獨立性檢驗在實際生活中有著廣泛的應用,與它有關的試題比較新穎,貼近生活,對考查大家“獲取信息、分析信息、應用信息的能力”以及“運用數(shù)學的思想和意識”起到了非常重要的作用. 本文通過幾個例題對這一類問題進行分析,加以總結,找出解決這類問題的方法.
對分類變量概念的理解
例1 對兩個分類變量A,B的下列說法中正確的個數(shù)為( )
(1)A與B無關,即A與B互不影響
(2)A與B關系越密切,則K2的值就越大
(3)K2的大小是判定A與B是否相關的唯一依據(jù)
A. 1 B. 2
C. 3 D. 0
解析 (1)正確,A與B無關,即A與B相互獨立;(2)錯誤,[K2]的值的大小只用來檢驗A與B是否相互獨立;(3)錯誤,還可以借助三維柱形圖、二維條形圖等.
答案 A
點評 涉及獨立性檢驗的概念問題,對基本概念的理解是求解的關鍵. 基本概念有分類變量、定量變量、列聯(lián)表等.
分類變量的強弱關系
例2 分類變量X和Y的列表如下,則下列說法判斷正確的是________. (填序號)
(1)ad-bc越小,說明X與Y的關系越弱
(2)ad-bc越大,說明X與Y的關系越強
(3)(ad-bc)2越大,說明X與Y的關系越強
(4)(ad-bc)2越接近于0,說明X與Y的關系越強
解析 判斷兩個變量是否有關系,可以考查[ad-bc]的值的大小. [ad-bc]的值越大,說明兩個變量之間的關系越強;[ad-bc]的值越小,說明兩個變量的關系越弱. 故此題填(3).
答案 (3)
點評 在列聯(lián)表中,如果兩個分類變量沒有關系,則[ad≈bc],即[ad-bc≈0]. 所以在判斷兩個分類變量的強弱關系時,應判斷[ad-bc]的大小.
考查[K2]的意義
例3 在對吸煙與患肺病這兩個分類變量的計算中,下列說法正確的是( )
A. 若隨機變量K2的觀測值k>6.635,我們有99%的把握說明吸煙與患肺病有關,則若某人吸煙,那么他有99%的可能患有肺病
B. 若由隨機變量求出有99%的把握說吸煙與患肺病有關,則在100個吸煙者中必有99個人患有肺病
C. 若由隨機變量求出有95%的把握說吸煙與患肺病有關,那么有5%的可能性使得推斷錯誤
D. 以上說法均不正確
解析 K2是確定多大程度上可以認為“兩個分類變量有關系”;并不是說有99%的可能患有肺病,也不能說在100個吸煙者中必有99個人患有肺病.
答案 C
點評 本題考查對獨立性檢驗的結果與實際問題的差異的理解,獨立性檢驗的結論是一種相關關系,它與實際問題中的確定性是存在差異的,是反映有關和無關的概率.
對兩種表示方法的理解
例4 通過隨機詢問110名性別不同的大學生是否愛好某項運動,得到如下列聯(lián)表.
參照附表,得到的正確結論是________.
(1)在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別有關”
(2)在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別無關”
(3)有99%以上的把握認為“愛好該項運動與性別有關”
(4)有99%以上的把握認為“愛好該項運動與性別無關”
解析 由K2≈7.8可知,[P(K2≥6.635)≈0.010],在犯錯誤的概率不超過1%的前提下或有99%以上的把握,認為“愛好該項運動與性別有關”.
答案 C
點評 本題考查隨機變量的觀測值[K2]與臨界值[k]的關系,使得在假設成立的情況下,觀測值[K2]要大于該臨界值[k],然后得出結論.
獨立性檢驗的綜合問題
例5 某企業(yè)有兩個分廠生產某種零件,按規(guī)定內徑尺寸(單位:mm)的值落在[29.94,30.06)的零件為優(yōu)質品. 從兩個分廠生產的零件中各抽出了500件,測量其內徑尺寸,得結果如下表.
(1)分別估計兩個分廠生產的零件的優(yōu)質品率;
(2)由以上統(tǒng)計數(shù)據(jù)填寫2×2列聯(lián)表,并回答是否有99%的把握認為“兩個分廠生產的零件的質量有差異”.
分析 獨立性檢驗問題的一般步驟:①用相關數(shù)據(jù)作出列聯(lián)表;②計算統(tǒng)計量[K2]的值;③與臨界值比較,判斷是否相關,若相關,得出相關結論.
解 (1)甲廠抽查的產品中有360件優(yōu)質品,從而甲廠生產的零件的優(yōu)質品率估計為[360500]×100%=72%;乙廠抽查的產品中有320件優(yōu)質品,從而乙廠生產的零件的優(yōu)質品率估計為[320500]×100%=64%.
(2)由題意得列聯(lián)表如下.
點評 獨立性檢驗的基本思想類似于反證法. 要確認“兩個分類變量有關系”成立的可信程度,首先假設該結論不成立,即假設結論“兩個分類變量沒有關系”成立,在該假設下構造的隨機變量[K2]應該很小. 如果由觀測數(shù)據(jù)計算得到的[K2]的觀測值很大,則在一定可信程度上說明假設不成立.