摘 要 Q矩陣的完備性是認(rèn)知診斷模型具有可識(shí)別性的關(guān)鍵。多級(jí)評(píng)分含有比0-1評(píng)分更豐富的診斷信息, 卻鮮見(jiàn)多級(jí)評(píng)分完備Q矩陣的設(shè)計(jì)研究。用最少的題量獲得最高判準(zhǔn)率是測(cè)驗(yàn)設(shè)計(jì)者追求的目標(biāo), 借鑒0-1評(píng)分完備Q矩陣的設(shè)計(jì)方法, 本文提出從可達(dá)陣中獲取多級(jí)評(píng)分結(jié)構(gòu)化/非結(jié)構(gòu)化最簡(jiǎn)完備Q矩陣(SSCQM/USCQM)的方法和算法。模擬實(shí)驗(yàn)得出以下結(jié)論:(1)測(cè)驗(yàn)含SSCQM/USCQM越多, 判準(zhǔn)率越高; (2)當(dāng)列數(shù)相同時(shí), 含多個(gè)SSCQM或多個(gè)USCQM測(cè)驗(yàn)的判準(zhǔn)率與含可達(dá)陣測(cè)驗(yàn)的判準(zhǔn)率非常接近; (3)對(duì)于一些結(jié)構(gòu), 縱使多個(gè)SSCQM/USCQM的列數(shù)少于可達(dá)陣列數(shù), 其判準(zhǔn)率仍不低于可達(dá)陣??傊?短測(cè)驗(yàn)設(shè)計(jì)優(yōu)先選擇SSCQM; 長(zhǎng)測(cè)驗(yàn)設(shè)計(jì)優(yōu)先選擇USCQM。
關(guān)鍵詞 多級(jí)評(píng)分, 測(cè)驗(yàn)設(shè)計(jì), 結(jié)構(gòu)化最簡(jiǎn)完備Q矩陣, 非結(jié)構(gòu)化最簡(jiǎn)完備Q矩陣, 算法
分類號(hào) B841
1 引言
認(rèn)知診斷評(píng)估提供被試潛在認(rèn)知能力(也即知識(shí)狀態(tài), Knowledge State, KS)的診斷信息, 有利于因材施教, 提升學(xué)生的能力(Leighton & Gierl, 2007; Tatsuoka, 2009)。在“雙減”背景下, 如何靈活地通過(guò)最少的題量實(shí)現(xiàn)對(duì)學(xué)生認(rèn)知能力的精準(zhǔn)診斷, 是測(cè)驗(yàn)設(shè)計(jì)者面臨的實(shí)際問(wèn)題。在認(rèn)知診斷測(cè)驗(yàn)中, 刻畫(huà)項(xiàng)目與屬性關(guān)系的Q矩陣對(duì)被試分類的精度有著非常重要的影響(Chiu, 2013; De Carlo, 2011, 2012; Gro? & George, 2014; Liu et al., 2012, 2013; Madison & Bradshaw, 2015)。通過(guò)Q矩陣, 誘導(dǎo)出被試的差異性作答, 差異性越大越有利于用認(rèn)知診斷模型精準(zhǔn)地識(shí)別被試, 故基于Q矩陣的認(rèn)知診斷模型可識(shí)別問(wèn)題受到廣泛關(guān)注(Chiu et al., 2009; Chiu & K?hn 2015; Fang et al., 2019; Gu & Xu, 2019, 2021; K?hn & Chiu, 2017; Lin & Xu, 2023; Ouyang & Xu, 2022)。
Q矩陣完備性是Q矩陣可識(shí)別問(wèn)題的主要研究?jī)?nèi)容之一。能夠識(shí)別所有被試的Q矩陣稱為完備Q矩陣(Complete Q Matrix); 否則, 稱為非完備Q矩陣(Uncomplete Q Matrix) (Chiu et al., 2009; Chiu & K?hn 2015; K?hn & Chiu, 2017)。已有研究表明, 非完備Q矩陣會(huì)將一些被試劃分到錯(cuò)誤的類別中去(Chiu et al., 2009), 因此Q矩陣的完備性是可識(shí)別的充分或(和)必要條件之一, 是認(rèn)知診斷模型具有可識(shí)別性的關(guān)鍵條件(Gu & Xu, 2019, 2021a; Lin & Xu, 2023; Ouyang & Xu, 2022)。根據(jù)完備Q矩陣中項(xiàng)目表達(dá)是否與屬性層級(jí)結(jié)構(gòu)一致, 完備Q矩陣可細(xì)分為結(jié)構(gòu)化完備Q矩陣(Structured complete Q Matrix)和非結(jié)構(gòu)化完備Q矩陣(Unstructured complete Q Matrix ) (丁樹(shù)良 等, 2022; K?hn & Chiu, 2021)。在現(xiàn)有研究中, 結(jié)構(gòu)化完備Q矩陣以測(cè)驗(yàn)包含可達(dá)陣為主, 非結(jié)構(gòu)化完備Q矩陣(除獨(dú)立結(jié)構(gòu)外)主要有兩種, 一種為測(cè)驗(yàn)包含單位陣(Chiu et al., 2009; Fang et al., 2019; Lin & Xu, 2023; Ouyang & Xu, 2022; Xu & Zhang, 2016; Gu & Xu, 2021b), 另一種為K?hn和Chiu (2021)提出的新方法, 他們認(rèn)為, 對(duì)于0-1評(píng)分, Q矩陣中所有項(xiàng)目遵循某種屬性層級(jí)結(jié)構(gòu)不是提高認(rèn)知診斷分類精度的必要條件, 故提出并證明滿足的非結(jié)構(gòu)化矩陣是非結(jié)構(gòu)化完備Q矩陣(R與E分別表示給定的屬性及其層級(jí)關(guān)系對(duì)應(yīng)的可達(dá)陣和單位陣)。
KS、理想反應(yīng)模式(Ideal Response Pattern, IRP)和觀察反應(yīng)模式(Observe Response Pattern, ORP)等三者的關(guān)系是認(rèn)知診斷的核心(丁樹(shù)良 等, 2012), IRP不僅是KS和ORP聯(lián)系的紐帶, 更是KS和ORP存在聯(lián)系的核心基礎(chǔ)。在沒(méi)有項(xiàng)目性質(zhì)、動(dòng)機(jī)或一些隨機(jī)因素等影響下, 完備Q矩陣均能建構(gòu)IRP與KS的一一對(duì)應(yīng)關(guān)系, 如果在這種情況下KS不能被識(shí)別, 那么受到上述因素影響的ORP更難識(shí)別KS。前述研究較多地考慮了干擾因素, 而忽視了作為核心基礎(chǔ)的IRP和KS間的一一對(duì)應(yīng)關(guān)系。故本文關(guān)于完備Q矩陣的討論, 著重考察該矩陣是否能夠建立IRP與KS一一對(duì)應(yīng)關(guān)系。
較0~1評(píng)分, 多級(jí)評(píng)分可更細(xì)致、更深入地探測(cè)被試具體的解題步驟或加工過(guò)程, 因此能夠提供更多的診斷信息(Ma & de la Torre, 2016)。在多級(jí)評(píng)分測(cè)驗(yàn)中, 雖然可達(dá)陣能大幅提高分類精度(丁樹(shù)良 等, 2010; 丁樹(shù)良 等, 2011), 但可達(dá)陣不是項(xiàng)目最少的完備Q矩陣, 比如丁樹(shù)良、汪文義等人(2014)提出K個(gè)屬性的線型結(jié)構(gòu), 僅需全1列便可使得IRP與KS一一對(duì)應(yīng), 也即全1列為含項(xiàng)目最少的完備Q矩陣。本文將含項(xiàng)目最少的結(jié)構(gòu)化和非結(jié)構(gòu)化完備Q矩陣分別稱為結(jié)構(gòu)化最簡(jiǎn)完備Q矩陣(Structured Simplest Complete Q Matrix, SSCQM)和非結(jié)構(gòu)化最簡(jiǎn)完備Q矩陣(Unstructured Simplest Complete Q Matrix, USCQM)。最簡(jiǎn)完備Q矩陣(Simplest Complete Q Matrix, SCQM)可用于短測(cè)驗(yàn)(如課堂測(cè)驗(yàn)), 且以SCQM作為子矩陣的長(zhǎng)測(cè)驗(yàn)必為完備Q矩陣, 故多級(jí)評(píng)分SCQM在Q矩陣設(shè)計(jì)中有廣泛的應(yīng)用前景。
多級(jí)評(píng)分SCQM的設(shè)計(jì)往往比0-1評(píng)分完備Q矩陣的設(shè)計(jì)難度更大, 囿于我們的視野, 我們僅發(fā)現(xiàn)丁樹(shù)良、羅芬等人(2014)和丁樹(shù)良、汪文義等人(2014)的多級(jí)評(píng)分完備Q矩陣設(shè)計(jì)及其理論證明。針對(duì)不同的屬性層級(jí)結(jié)構(gòu), 他們分別給出幾種基本屬性層級(jí)結(jié)構(gòu)(線型、收斂型、分支型、無(wú)結(jié)構(gòu)和獨(dú)立結(jié)構(gòu))的多級(jí)評(píng)分完備Q矩陣設(shè)計(jì)方法和證明, 為提高多級(jí)評(píng)分認(rèn)知診斷測(cè)驗(yàn)精度和測(cè)驗(yàn)效率提供新的思路和方法。但這兩個(gè)研究存在以下問(wèn)題:(1)針對(duì)不同屬性層級(jí)結(jié)構(gòu)設(shè)計(jì)完備Q矩陣的方法不具兼容性, 無(wú)法整合, 且在實(shí)際應(yīng)用中, 屬性層級(jí)結(jié)構(gòu)更為復(fù)雜, 通常由這些基本屬性層級(jí)結(jié)構(gòu)復(fù)合而成, 如何得到這些復(fù)雜結(jié)構(gòu)的完備Q矩陣, 還缺乏相關(guān)研究; (2)運(yùn)用效果未得到模擬驗(yàn)證。比如線型結(jié)構(gòu)的全1列, 由于該完備Q矩陣測(cè)驗(yàn)較短, 其測(cè)量誤差較大, 考慮到重復(fù)測(cè)量可減少測(cè)量誤差, 那么最少要多少個(gè)全1列才能和K階可達(dá)陣的測(cè)量精度相當(dāng)?這是一個(gè)必須回答的問(wèn)題; (3)未涉及多級(jí)評(píng)分非結(jié)構(gòu)化完備Q矩陣研究。K?hn和Chiu (2021)試圖將結(jié)構(gòu)化完備Q陣研究拓展到非結(jié)構(gòu)化Q矩陣中, 并發(fā)現(xiàn)非結(jié)構(gòu)化完備Q矩陣選擇范圍較廣, 但研究止步于0-1評(píng)分, 未能涉及多級(jí)評(píng)分情況。已有文獻(xiàn)(Fang et al., 2019; Lin & Xu, 2023; Ouyang & Xu, 2022)提出多級(jí)評(píng)分的完備Q矩陣包含單位陣, 只含單位陣的測(cè)驗(yàn)設(shè)計(jì)過(guò)于單一, 是否存在其他的非結(jié)構(gòu)化完備Q矩陣使得測(cè)驗(yàn)具有多樣性?這些問(wèn)題均需進(jìn)一步討論。
本文在前人研究的基礎(chǔ)上, 擬基于IRP解決如下兩個(gè)問(wèn)題:第一, 提出多級(jí)評(píng)分SSCQM和USCQM通用的設(shè)計(jì)方法和算法; 第二, 考察屬性層級(jí)結(jié)構(gòu)、屬性個(gè)數(shù)和項(xiàng)目參數(shù)等因素對(duì)多級(jí)評(píng)分SSCQM和USCQM分類精度的影響。以下研究的Q矩陣均為題目水平, 即一個(gè)題目對(duì)應(yīng)一個(gè)向量。
2 多級(jí)評(píng)分SSCQM的設(shè)計(jì)及其算法
考慮到丁樹(shù)良、羅芬等人(2014)和丁樹(shù)良、汪文義等人(2014)設(shè)計(jì)和證明的復(fù)雜性, 且未能給出統(tǒng)一的、適用于各種屬性層級(jí)結(jié)構(gòu)的設(shè)計(jì)方法, 本研究另辟蹊徑, 首先以完備Q矩陣可建立IRP與KS一一對(duì)應(yīng)關(guān)系為導(dǎo)向, 構(gòu)造SSCQM并加以驗(yàn)證; 然后提出操作性強(qiáng)、便于使用和推廣、適用于各種屬性層級(jí)結(jié)構(gòu)的SSCQM算法。
2.1 多級(jí)評(píng)分SSCQM的設(shè)計(jì)
對(duì)于0-1評(píng)分, 采用DINA理想評(píng)分規(guī)則(該規(guī)則要求屬性之間不可補(bǔ)償), 將可達(dá)陣作為測(cè)驗(yàn)子矩陣可建立被試IRP與KS的一一對(duì)應(yīng)關(guān)系(丁樹(shù)良 等, 2010; 丁樹(shù)良 等, 2011; 丁樹(shù)良 等, 2012; K?hn & Chiu, 2021), 即可達(dá)陣為完備Q矩陣。
對(duì)于多級(jí)評(píng)分, 采用被試掌握項(xiàng)目中一個(gè)屬性, 理想評(píng)分便多一分的評(píng)分規(guī)則(Tatsuoka, 1995):
可達(dá)陣仍為完備Q矩陣(丁樹(shù)良, 汪文義 等, 2014; Sun et al., 2013)。然而, 除獨(dú)立結(jié)構(gòu)外, 其他屬性層級(jí)結(jié)構(gòu)的可達(dá)陣不是最簡(jiǎn)完備Q矩陣, 因此, 以可達(dá)陣為研究對(duì)象, 對(duì)比所有KS在可達(dá)陣上的理想反應(yīng)模式, 刪減可達(dá)陣中所有不必要的列, 得到可達(dá)陣的子矩陣為最簡(jiǎn)完備Q矩陣。下面以6個(gè)屬性線型結(jié)構(gòu)為例(見(jiàn)圖1), 基于公式(1)和(2), 構(gòu)造SSCQM并加以驗(yàn)證。限于篇幅, 直接給出其他4種屬性層級(jí)結(jié)構(gòu)(收斂型、分支型、無(wú)結(jié)構(gòu)和獨(dú)立結(jié)構(gòu))的SSCQM。
ehlgX8lsXZR50IeHKwK4X/yLMHnp1IOc6ozzouXy+ZA=(1)線型結(jié)構(gòu)
KS類型有7個(gè), 可達(dá)陣R為6列, 基于R的理想反應(yīng)模式如表1。
從表1中最后一列可知, 可達(dá)陣中的使得 IRP與KS一一對(duì)應(yīng), 即為SSCQM。
(2)收斂結(jié)構(gòu)
收斂結(jié)構(gòu)(a)的SSCQM為
收斂結(jié)構(gòu)(b)的SSCQM為
收斂結(jié)構(gòu)(c)的SSCQM為
雖然收斂結(jié)構(gòu)有多個(gè)SSCQM, 但每一個(gè)矩陣所選取的列為收斂結(jié)構(gòu)某一個(gè)或幾個(gè)不同的分支, 從結(jié)構(gòu)上來(lái)說(shuō), 這些分支是并列關(guān)系。在測(cè)驗(yàn)設(shè)計(jì)時(shí), 這幾種SSCQM可以任選, 或者如果測(cè)驗(yàn)需要多個(gè)SSCQM, 為了盡可能地降低曝光率, 這些矩陣可以混合使用。
(3)分支結(jié)構(gòu)
(4)無(wú)結(jié)構(gòu)
(5)獨(dú)立結(jié)構(gòu)
SSCQM為可達(dá)矩陣。
由5種屬性層級(jí)結(jié)構(gòu)的SSCQM可知, 屬性層級(jí)結(jié)構(gòu)圖中有幾個(gè)分支, 則SSCQM中就有幾列, 且每列的向量對(duì)應(yīng)一個(gè)分支。線型結(jié)構(gòu)和收斂型結(jié)構(gòu)的SSCQM含有可達(dá)陣的最大列(即全1列), 而其他3種結(jié)構(gòu)的SSCQM的各個(gè)列之間不可比較。
2.2 多級(jí)評(píng)分SSCQM的算法
定義 設(shè)兩個(gè)K維向量x和y, 稱當(dāng)且僅當(dāng), 其中 為偏序關(guān)系; 若x和y不滿足上述關(guān)系, 稱x和y不可比較。
基于可達(dá)陣各列之間是否可比較及可比較的大小關(guān)系給出算法。將比較所得最大列稱為支柱列。
多級(jí)評(píng)分SSCQM算法如下:
第一步 輸入可達(dá)陣R, 計(jì)算可達(dá)陣R每列考察屬性的個(gè)數(shù)和(稱之為列和), 按照列和從小到大對(duì)列進(jìn)行排序, 如果列和一樣, 則由這些列的全排列所得多個(gè)矩陣均需考察, 設(shè)W=, 同時(shí)生成兩個(gè)空矩陣Q1, Q2;
第二步 按列循環(huán)求W中的支柱列
for i=1 to [col(W)?1]
{首先, 從W最后1列開(kāi)始, 若該列大于其他所有列, 設(shè)其為支柱列, 則將該列放入Q1中, 若在剩余的列中還存在此類型的列, 則繼續(xù)放入Q1中(在此過(guò)程中, W的列數(shù)不能少于等于2, 否則直接比較列的大?。?
接著, 若, 則從W中刪除與后面的列繼續(xù)比較, 刪除小的, 直到找到最大列, 設(shè)其為支柱列, 放入Q2中;
若與不可比, 則跳過(guò)該列與下一列比較, 若與后面列都不可比, 則將放入Q2中;
若W只剩1列, 該列直接放入Q2中;
最后, 重新計(jì)算W的列數(shù)col(W), 直至W中沒(méi)有列};
第三步 求Q1的支柱列, 不是支柱列刪除;
第四步 計(jì)算屬性層級(jí)結(jié)構(gòu)圖中的分支數(shù)(設(shè)為n), 若Q1有m列, 則隨機(jī)取Q2中的n–m列與Q1合并為一個(gè)Q矩陣; 若Q1中沒(méi)有列, 則隨機(jī)取Q2中的n列構(gòu)成矩陣Q;
第五步 驗(yàn)證所得Q矩陣的完備性, 若Q矩陣為完備矩陣, 則輸出Q, 否則, 舍棄。
以收斂結(jié)構(gòu)(c)為例闡述算法的使用步驟(其他結(jié)構(gòu)的算法步驟見(jiàn)網(wǎng)絡(luò)版附錄)。第一步, 先將R的列進(jìn)行排序, 即
因?yàn)榈?, 3, 4列都考察了2個(gè)屬性, 則將這3列全排列, 共6種情況, 對(duì)應(yīng)6個(gè)矩陣, 下面就要從這6個(gè)矩陣分別提取結(jié)構(gòu)化完備Q矩陣。首先從開(kāi)始, 生成兩個(gè)空矩陣Q1, Q2; 第二步, 首先W中最大列為第6列, 則將該列放入Q1中, 從W中刪除第6列, 此時(shí)在W剩下的列中沒(méi)有最大列; 接著求W剩下列的支柱列, 第1列比第2列小, 則第1列刪除, 將第2列繼續(xù)與后面的列進(jìn)行比較, 由于不可比較, 則第2列為支柱列, 放入Q2中, 從W中刪除第2列, 這時(shí)W只剩3列, 最后重置W的列數(shù), 原來(lái)的第3,4,5列重置為第1,2,3列; 首先W的剩余列中沒(méi)有最大列, 再求支柱列, 此時(shí)W中的第1列與第2列不可比較, 跳過(guò)第2列, 由于第1列比第3列小, 將第3列放入Q2中, 刪除W中的第1,3列, 最后W只剩第2列, 也放入Q2中, 故最終Q2有3列, 分別為原W中的第2,4,5列; 第三步, Q1只有1列, 則該列即為支柱列; 第四步, 因?yàn)槭鞘諗拷Y(jié)構(gòu), 由屬性層級(jí)結(jié)構(gòu)圖可知該結(jié)構(gòu)有3個(gè)分支, 故隨機(jī)取Q2中的2列與Q1中的1列分別合并為3個(gè)矩陣, 則這三個(gè)矩陣分別為 和; 第五步, 經(jīng)驗(yàn)證和均為SSCQM。其他5種情況的矩陣所得SSCQM與相同。此算法所得多級(jí)評(píng)分SSCQM與已有研究結(jié)果(丁樹(shù)良, 羅芬 等, 2014; 丁樹(shù)良, 汪文義 等, 2014)一致。
值得一提的是:(1)第一步的全排列問(wèn)題。必須將那些列和相等的列進(jìn)行全排列, 否則只能得到部分SSCQM, 如Sun等(2013)中收斂結(jié)構(gòu)(見(jiàn)網(wǎng)絡(luò)版附錄), 若不全排列, 只能得到2個(gè)SSCQM, 但實(shí)際上不止2個(gè)。(2)有關(guān)線型結(jié)構(gòu)的問(wèn)題。除第1,2列, 線型結(jié)構(gòu)可達(dá)陣中其他列全部放入放入Q1中, 第2列放入Q2中, 因?yàn)镼1中支柱列為全1列, 屬性層級(jí)結(jié)構(gòu)圖中只有1個(gè)分支, Q2中項(xiàng)目不計(jì), 故該支柱列即為所求。(3)第四步的計(jì)算屬性層級(jí)結(jié)構(gòu)分支數(shù)問(wèn)題。一般地, 若屬性層級(jí)結(jié)構(gòu)圖分支較清楚(例如5種基本屬性層級(jí)結(jié)構(gòu)或者其簡(jiǎn)單的組合), 可直接計(jì)算其分支數(shù); 若屬性層級(jí)結(jié)構(gòu)圖的分支較復(fù)雜, 則可不用計(jì)算其分支數(shù), 直接從Q2中分別取1列, 2列, ……與Q1合并為一個(gè)Q矩陣, 再驗(yàn)證所得Q矩陣的完備性。比如K?hn和Chiu (2021)給出11個(gè)屬性的屬性層級(jí)結(jié)構(gòu), 分支較復(fù)雜, 由算法可得Q1有2列, 即可達(dá)陣(已按列和排序)第10, 11列, Q2有2列, 分別為第3 (考察了第3個(gè)屬性), 6列, 先從Q2中取1列與Q1合并成列數(shù)為3列的矩陣, 經(jīng)驗(yàn)證這兩個(gè)矩陣均不是完備Q矩陣, 接著將Q2與Q1合并為一個(gè)4列的矩陣, 經(jīng)驗(yàn)證該矩陣為SSCQM。
3 多級(jí)評(píng)分USCQM的設(shè)計(jì)及其算法
在SSCQM設(shè)計(jì)的基礎(chǔ)上, 本研究進(jìn)一步探討USCQM的設(shè)計(jì)方法和算法。
3.1 多級(jí)評(píng)分USCQM的設(shè)計(jì)
0-1評(píng)分非結(jié)構(gòu)化完備Q矩陣介于單位陣和可達(dá)陣之間(K?hn & Chiu, 2021), 其中可達(dá)陣為結(jié)構(gòu)化完備Q矩陣, 單位陣為非結(jié)構(gòu)化完備Q矩陣(除獨(dú)立結(jié)構(gòu)外)。借鑒0-1評(píng)分的思路, 在多級(jí)評(píng)分中將SSCQM作為上限, 單位陣子矩陣作為下限。設(shè)可達(dá)陣R(各列依次按照考察屬性的順序排列), 若上限SSCQM的列對(duì)應(yīng)于R的列號(hào)為, 則下限將單位陣E中相同列號(hào)的列構(gòu)成單位陣的子矩陣。以收斂結(jié)構(gòu)(a)為例, 設(shè)可達(dá)陣R, SSCQM的列對(duì)應(yīng)于R的列號(hào)為, 即
取同階單位陣的第5, 6列構(gòu)成單位陣子矩陣
找出介于和之間所有矩陣, 即 , 且每行至少有1個(gè)“1”(目的是保證每個(gè)屬性都要被考察), 例如
同樣, 對(duì)應(yīng)可達(dá)陣的第4,6列, 單位陣子矩陣的第4,6列為
且每行至少有1個(gè)“1”, 例如
相較于2個(gè)SSCQM, 符合條件的USCQM 和均有53個(gè)。
3.2 多級(jí)評(píng)分USCQM的算法
根據(jù)上述設(shè)計(jì)原理, 多級(jí)評(píng)分USCQM算法如下:
第一步 輸入結(jié)構(gòu)化最簡(jiǎn)完備Q矩陣和其對(duì)應(yīng)的單位陣子矩陣
, 用得到矩陣Q0=(qij);
第二步 隨機(jī)將Q0中一個(gè)或多個(gè)qij=1替換為qij=0;
第三步 將(2)產(chǎn)生的矩陣與單位陣子矩陣相加得到矩陣;
第四步 驗(yàn)證矩陣列的布爾并是否為全1列且該矩陣是否完備, 若是, 則輸出矩陣, 否則舍棄。
4 基于多級(jí)評(píng)分認(rèn)知診斷模型的SCQM
4.1 多級(jí)評(píng)分認(rèn)知診斷模型
大部分多級(jí)評(píng)分認(rèn)知診斷模型是從0-1評(píng)分認(rèn)知診斷模型拓展而來(lái)。高旭亮等人(2021)詳細(xì)地介紹了三種類型的多級(jí)評(píng)分認(rèn)知診斷模型:(1)鄰接類別模型(adjacent category models); (2)連續(xù)比率模型(continuation ratio models); (3)累積概率模型(cumulative probability models)。因完備性的驗(yàn)證涉及認(rèn)知診斷模型, 下面只介紹與本研究有關(guān)的GPDINA模型(Chen & de la Torre, 2018)和RP-DINA模型(蔡艷 等, 2017)。
GPDINA模型是GDINA模型(the generalized DINA model) (de la Torre, 2011)與GPDM模型(the general polytomous diagnosis model) (Chen & de la Torre, 2018)的融合。
PDINA模型:
也即
因?yàn)镻DINA構(gòu)建的理想評(píng)分只有0和1, 影響分類的精度, 蔡艷等人(2017)修改了PDINA模型的評(píng)分方式, 提出了RP-DINA模型。RPDINA模型:
RPDINA模型中其他符號(hào)定義與PDINA模型一致。研究表明由于RPDINA模型中評(píng)分的修正, 使得其判準(zhǔn)率比PDINA模型的高。
4.2 結(jié)合多級(jí)評(píng)分認(rèn)知診斷模型的SCQM的驗(yàn)證
進(jìn)一步, 基于理想反應(yīng)模式與知識(shí)狀態(tài)一一對(duì)應(yīng)關(guān)系建構(gòu)的SCQM, 結(jié)合認(rèn)知診斷模型, 驗(yàn)證其是否仍具完備性。
(1)給出評(píng)分方式。在多級(jí)評(píng)分中, 完備Q矩陣與評(píng)分方式和滿分值有關(guān), 會(huì)影響Q矩陣診斷信息的質(zhì)量(丁樹(shù)良, 汪文義 等, 2014)。如若采用蔡艷等人(2017)提出的評(píng)分方式和滿分值, 則可達(dá)陣不是完備Q矩陣(見(jiàn)討論部分)。因完備Q矩陣可以提高診斷判準(zhǔn)率, 故在下面驗(yàn)證中, 認(rèn)知診斷模型采用公式(1)的評(píng)分方式和公式(2)滿分方式。
(2)驗(yàn)證Q陣完備性。K?hn和Chiu (2021)提出的完備性驗(yàn)證方法為當(dāng)觀察反應(yīng)模式的期望相等時(shí), 對(duì)應(yīng)的KS相同。
被試在上期望為
結(jié)合認(rèn)知診斷模型, 驗(yàn)證本文提出的SCQM的完備性, 其中, SSCQM選取2.1中線型的, USCQM選取3.1中收斂型的I1。
對(duì)于PDINA模型, 因?yàn)槔硐朐u(píng)分還是按照0-1評(píng)分方式, 只有被試掌握項(xiàng)目中所有屬性, 交互才存在, 若在項(xiàng)目中至少一個(gè)屬性是被試未掌握的, 則該類被試均不能被識(shí)別, 故與不是完備Q矩陣。PDINA的SSCQM為可達(dá)陣, USCQM陣有多個(gè), 其中一個(gè)為單位陣。
對(duì)于RPDINA模型, 結(jié)果如表2。
由表2可知, 不同則所對(duì)應(yīng)的也不相同, 故按照本文提供的評(píng)分方式, 對(duì)于RPDINA模型, 為結(jié)構(gòu)化完備Q矩陣, 因?yàn)橹挥?列, 即是SSCQM。
根據(jù)表3的計(jì)算結(jié)果, 因各個(gè)在I1上的不等, 且刪減任一個(gè)項(xiàng)目使得至少有兩個(gè)的相等, 故是USCQM。同理, 可以證明也是USCQM。
對(duì)于PACDM模型, 與仍為完備矩陣, 對(duì)于PDINO模型, 與不是完備矩陣。
從例題似乎可以看出, 只要認(rèn)知診斷模型的主效應(yīng)存在, SCQM的完備性不變。
5 模擬實(shí)驗(yàn)研究
從IRP的角度, 與可達(dá)陣一樣, 1個(gè)SCQM能將KS完全區(qū)分, 然而, 在實(shí)際應(yīng)用中, 由于1個(gè)SCQM列數(shù)較少, 則存在測(cè)量誤差, 使得其判準(zhǔn)率(PMR或者M(jìn)MR)不一定高于(甚至抵不上)可達(dá)陣。為研究多級(jí)評(píng)分SSCQM和USCQM的分類效果, 模擬實(shí)驗(yàn)主要考察當(dāng)SCQM的列數(shù)不超過(guò)可達(dá)陣的列數(shù)時(shí), 到底需要多少個(gè)SSCQM/USCQM才能達(dá)到或相當(dāng)于可達(dá)陣的分類精度。為避免概念混淆, 下文中的結(jié)構(gòu)化完備Q矩陣均不包含可達(dá)陣。為更好地與實(shí)踐中的終結(jié)性評(píng)估和過(guò)程性評(píng)估相對(duì)應(yīng), 本研究擬構(gòu)造長(zhǎng)測(cè)驗(yàn)和短測(cè)驗(yàn), 并從屬性層級(jí)結(jié)構(gòu)(如圖1和網(wǎng)絡(luò)版附錄)、項(xiàng)目參數(shù)和屬性個(gè)數(shù)等方面, 分別考察(含)SSCQM、USCQM和可達(dá)陣三種矩陣的認(rèn)知診斷測(cè)驗(yàn)分類效果, 研究均采用python自編程序模擬和分析數(shù)據(jù)。
5.1 研究1:考察在不同屬性層級(jí)結(jié)構(gòu)下項(xiàng)目參數(shù)對(duì)三種測(cè)驗(yàn)的影響
5.1.1 實(shí)驗(yàn)設(shè)計(jì)
屬性個(gè)數(shù)K = 6, 被試數(shù)N = 2000。由于獨(dú)立結(jié)構(gòu)的SSCQM即為可達(dá)陣, 不存在非結(jié)構(gòu)化Q矩陣, 故本研究只涉及線型、收斂型(a)(b)(c)、分支型和無(wú)結(jié)構(gòu)等屬性層級(jí)結(jié)構(gòu)。研究從如下兩個(gè)方面展開(kāi):第一, 比較一個(gè)和多個(gè)SSCQM/USCQM(總列數(shù)不超過(guò)可達(dá)陣的列數(shù))與可達(dá)陣分類能力的高低; 第二, 在多個(gè)SSCQM/USCQM的基礎(chǔ)上, 相應(yīng)地添加SSCQM/USCQM中的列(添加的列數(shù)小于SCQM的列數(shù)), 使得總列數(shù)與可達(dá)陣列數(shù)一樣, 比較它們的診斷分類效果。
5.1.2 Monte Carlo模擬
(1)被試屬性掌握模式真值模擬
被試平均分配給各個(gè)屬性層級(jí)結(jié)構(gòu)的KS, 不能均分的, 則隨機(jī)指派。
(2)測(cè)驗(yàn)Q矩陣及其項(xiàng)目參數(shù)模擬
長(zhǎng)測(cè)驗(yàn)題目總數(shù)為40題。測(cè)驗(yàn)分別包含1個(gè)可達(dá)陣、1個(gè)或多個(gè)不同屬性層級(jí)結(jié)構(gòu)的SSCQM和USCQM(總列數(shù)不超過(guò)可達(dá)陣列數(shù)), 剩下的題目從結(jié)構(gòu)化/非結(jié)構(gòu)化的非完備Q矩陣中選取。
短測(cè)驗(yàn)題目總數(shù)為6題(即可達(dá)陣的列數(shù)), 測(cè)驗(yàn)分別為1個(gè)可達(dá)陣、含最多個(gè)數(shù)的SSCQM和USCQM(剩下的題目從SSCQM/USCQM中選取, 使得總列數(shù)等于可達(dá)陣的列數(shù))。
(3)被試作答反應(yīng)的模擬
由被試真值和測(cè)驗(yàn)Q矩陣, 按照公式(1)和(2)得到理想得分矩陣, 然后根據(jù)RPDINA模型模擬被試得分。
(4)被試KS估計(jì)方法
采用RP-DINA模型和最大后驗(yàn)估計(jì)方法(Maximum A Posteriori, MAP)估計(jì)被試的KS。
(5)評(píng)價(jià)指標(biāo)
采用模式判準(zhǔn)率(Pattern Match Ratio, PMR)和屬性邊際判準(zhǔn)率(Marginal Match Ratio,MMR)作為分類能力的評(píng)價(jià)指標(biāo)。
其中, N為被試總數(shù), 表示被試i的屬性掌握模式是否判對(duì), 判對(duì)為1, 否則為0; K為屬性個(gè)數(shù), 表示被試i的屬性k是否判對(duì), 判對(duì)為1, 否則為0。
模擬實(shí)驗(yàn)重復(fù)100次(由于可供選擇的USCQM較多, 故從中隨機(jī)選?。?, 取PMR和MMR的平均值。
5.1.3 研究結(jié)果
(1)長(zhǎng)測(cè)驗(yàn)研究結(jié)果
基于三種不同的項(xiàng)目參數(shù)設(shè)置, 表4~表6按照線型結(jié)構(gòu)、收斂結(jié)構(gòu)、分支結(jié)構(gòu)和無(wú)結(jié)構(gòu)等屬性層級(jí)結(jié)構(gòu)順序給出了包含1個(gè)或多個(gè)SSCQM、USCQM和可達(dá)陣等三種測(cè)驗(yàn)的PMR和MMR均值。
表4給出了屬性個(gè)數(shù)為6、被試數(shù)為2000、s, g服從U(0,0.15)的長(zhǎng)測(cè)驗(yàn)的模擬結(jié)果: (a)按照屬性層級(jí)結(jié)構(gòu)順序, 三種測(cè)驗(yàn)的判準(zhǔn)率依次降低, 其中PMR降幅低于3%, MMR降幅不超過(guò)0.5%。(b)對(duì)于各個(gè)屬性層級(jí)結(jié)構(gòu), 含SSCQM/USCQM越多, 則判準(zhǔn)率越高, MMR均在0.99以上, PMR均在0.95以上。(c)當(dāng)多個(gè)SSCQM/USCQM的列數(shù)少于可達(dá)陣的列數(shù)時(shí), 比如線型結(jié)構(gòu)3列、收斂結(jié)構(gòu)(a)(b)4列、收斂結(jié)構(gòu)(c) 3列、分支結(jié)構(gòu)3列和無(wú)結(jié)構(gòu)5列, 其測(cè)驗(yàn)的判準(zhǔn)率均大于含可達(dá)陣(6列)測(cè)驗(yàn)的判準(zhǔn)率。(d)當(dāng)列數(shù)等于可達(dá)陣列數(shù)時(shí), 按照屬性層級(jí)結(jié)構(gòu)順序, 含SSCQM測(cè)驗(yàn)的判準(zhǔn)率逐漸小于含USCQM測(cè)驗(yàn)的判準(zhǔn)率, 含可達(dá)陣的測(cè)驗(yàn)判準(zhǔn)率最低, 但三種測(cè)驗(yàn)的判準(zhǔn)率相差不大, PMR的差值不超過(guò)0.05, MMR相差更小。表5、表6表明, 在不同的項(xiàng)目參數(shù)s, g水平條件下, 結(jié)論類似。
表4~表6也表明, 對(duì)于同種屬性層級(jí)結(jié)構(gòu), 隨著s, g參數(shù)水平的提升, 各種測(cè)驗(yàn)的PMR均降低2%~6%, MMR降低0.3%~1%; 對(duì)于相同參數(shù), 按照屬性層級(jí)結(jié)構(gòu)的順序, 三種測(cè)驗(yàn)的判準(zhǔn)率降幅依次增大, PMR均降低1%~5%, MMR降低0.2%~1%。綜合表4~表6的結(jié)果可見(jiàn):屬性層級(jí)結(jié)構(gòu)與項(xiàng)目參數(shù)對(duì)多級(jí)評(píng)分SSCQM和USCQM判準(zhǔn)率的影響類同。
(2)短測(cè)驗(yàn)研究結(jié)果
基于三種不同的項(xiàng)目參數(shù)設(shè)置, 按照線型結(jié)構(gòu)、收斂結(jié)構(gòu)、分支結(jié)構(gòu)和無(wú)結(jié)構(gòu)等屬性層級(jí)結(jié)構(gòu)順序, 圖2分別給出了多個(gè)SSCQM、多個(gè)USCQM(其總列數(shù)均等于可達(dá)陣列數(shù))和可達(dá)陣等三種測(cè)驗(yàn)的PMR均值。因?yàn)槭諗拷Y(jié)構(gòu)(a)判準(zhǔn)率的變化與收斂結(jié)構(gòu)(b)的一致, 故圖2只呈現(xiàn)收斂結(jié)構(gòu)(b)(c)的結(jié)果。
由圖2可知:(a)隨著屬性層級(jí)結(jié)構(gòu)的變化和參數(shù)的增加, 三種測(cè)驗(yàn)的判準(zhǔn)率均下降, 且差值逐漸增大, 特別是當(dāng)屬性層級(jí)結(jié)構(gòu)為無(wú)結(jié)構(gòu)且參數(shù)值為0.25時(shí), 可達(dá)陣的判準(zhǔn)率與其他測(cè)驗(yàn)的判準(zhǔn)率相差最大; (b)除無(wú)結(jié)構(gòu)外, 當(dāng)s和g相同且屬性層級(jí)結(jié)構(gòu)相同時(shí), 三種測(cè)驗(yàn)的判準(zhǔn)率相差不超過(guò)0.1; (c)在大多數(shù)情況下, 多個(gè)SSCQM的判準(zhǔn)率比可達(dá)陣的判準(zhǔn)率高, 但當(dāng)參數(shù)較大時(shí), 收斂結(jié)構(gòu)(c)和無(wú)結(jié)構(gòu)的情況相反; (d)多個(gè)USCQM的判準(zhǔn)率幾乎是最低的。事實(shí)上, 多個(gè)SSCQM和可達(dá)陣均是結(jié)構(gòu)化完備Q矩陣, 多個(gè)USCQM是非結(jié)構(gòu)化完備Q矩陣, 總而言之, 對(duì)于短測(cè)驗(yàn), 當(dāng)列數(shù)相同時(shí), 結(jié)構(gòu)化完備Q矩陣的判準(zhǔn)率高于非結(jié)構(gòu)化完備Q矩陣的判準(zhǔn)率。
5.2 研究2: 考察在不同屬性層級(jí)結(jié)構(gòu)下屬性個(gè)數(shù)對(duì)三種測(cè)驗(yàn)的影響
一般地, 隨著屬性個(gè)數(shù)的增加, 測(cè)驗(yàn)的判準(zhǔn)率會(huì)降低。屬性個(gè)數(shù)對(duì)SCQM的影響程度是研究2繼續(xù)探索的問(wèn)題。
5.2.1 Monte Carlo模擬
(1)在研究1模擬條件的基礎(chǔ)上, 考察5~8個(gè)屬性的4種屬性層級(jí)結(jié)構(gòu)(如網(wǎng)絡(luò)版附錄, 6個(gè)情況如研究1)。
(2)項(xiàng)目選取如研究1, 固定測(cè)驗(yàn)參數(shù), 長(zhǎng)測(cè)驗(yàn)
參數(shù)和服從, 短測(cè)驗(yàn)參數(shù)和
服從。
(3)被試真值、評(píng)分和評(píng)價(jià)指標(biāo)均如研究1。
5.2.2 研究結(jié)果
(1)長(zhǎng)測(cè)驗(yàn)研究結(jié)果
表7~表9給出了被試數(shù)為2000, 服從U(0, 0.35), 5~8個(gè)屬性的模擬結(jié)果:(a)總體上, 隨著屬性個(gè)數(shù)的增加和屬性層級(jí)結(jié)構(gòu)的變化, 三種測(cè)驗(yàn)
的判準(zhǔn)率皆呈下降趨勢(shì), 但PMR仍在0.88以上, MMR在0.97以上。(b)當(dāng)屬性個(gè)數(shù)一定時(shí), 按照屬性層級(jí)結(jié)構(gòu)的順序, 三種測(cè)驗(yàn)PMR降幅為2%~8%, MMR降幅為0.5%~2%; 當(dāng)屬性層級(jí)結(jié)構(gòu)一定時(shí), 按照屬性個(gè)數(shù)增加的順序, 三種測(cè)驗(yàn)PMR降幅為0.1%~5%, MMR降幅為0.1%~1%。(c)當(dāng)列數(shù)相同時(shí), 三種測(cè)驗(yàn)的判準(zhǔn)率相當(dāng), 差值很?。≒MR差值介于0.001~0.05之間, MMR差值更?。?, 其中含可達(dá)陣的測(cè)驗(yàn)最差; 當(dāng)屬性個(gè)數(shù)為5~7時(shí), 含SSCQM的測(cè)驗(yàn)較優(yōu); 當(dāng)屬性個(gè)數(shù)為8時(shí), 含USCQM的測(cè)驗(yàn)較優(yōu)。(d)對(duì)于一些含多個(gè)SSCQM的測(cè)驗(yàn), 當(dāng)列數(shù)達(dá)到一定數(shù)量時(shí), 即便少于可達(dá)陣的列數(shù), 其判準(zhǔn)率依然高于可達(dá)陣, 比如線型結(jié)構(gòu), 5或6個(gè)屬性達(dá)到3列, 7個(gè)屬性達(dá)到4列; 5個(gè)屬性分支結(jié)構(gòu)達(dá)到4列; 7個(gè)屬性收斂結(jié)構(gòu)達(dá)到4列, 無(wú)結(jié)構(gòu)達(dá)到6列等。含多個(gè)USCQM的測(cè)驗(yàn)也有類似情況。
由表7~表9的實(shí)驗(yàn)數(shù)據(jù)可知, 屬性個(gè)數(shù)的增加對(duì)判準(zhǔn)率的影響與屬性層級(jí)結(jié)構(gòu)所帶來(lái)的影響相差不大。
(2)短測(cè)驗(yàn)研究結(jié)果
基于不同的屬性個(gè)數(shù)和不同的屬性層級(jí)結(jié)構(gòu), 圖3分別給出了列數(shù)等于可達(dá)陣的多個(gè)SSCQM、多個(gè)USCQM和可達(dá)陣等三種測(cè)驗(yàn)的PMR均值。由圖3可知, 題目質(zhì)量較好時(shí), 隨著屬性個(gè)數(shù)的增加, 多個(gè)SSCQM的判準(zhǔn)率最高, 其他兩種矩陣判準(zhǔn)率各有高低, 但三者判準(zhǔn)率的差值均不超過(guò)0.05(除收斂結(jié)構(gòu)8個(gè)屬性外)。
根據(jù)以上長(zhǎng)、短測(cè)驗(yàn)的模擬結(jié)果可知:三種測(cè)驗(yàn)的判準(zhǔn)率相差不大, 差值為0.05左右; 對(duì)于長(zhǎng)測(cè)驗(yàn), 按照屬性層級(jí)結(jié)構(gòu)順序(從線型結(jié)構(gòu)到無(wú)結(jié)構(gòu)),
當(dāng)屬性個(gè)數(shù)為5~7或項(xiàng)目參數(shù)較小時(shí), (含)多個(gè)SSCQM測(cè)驗(yàn)優(yōu)于(含)多個(gè)USCQM測(cè)驗(yàn); 當(dāng)屬性個(gè)數(shù)為8或隨著項(xiàng)目參數(shù)增加, 情況相反; 對(duì)于短測(cè)驗(yàn), 多個(gè)SSCQM測(cè)驗(yàn)優(yōu)于多個(gè)USCQM測(cè)驗(yàn)。
6 實(shí)證數(shù)據(jù)分析
為了進(jìn)一步驗(yàn)證SCQM的性能, 下面采用康春花等(2013)的實(shí)證數(shù)據(jù)進(jìn)行分析。數(shù)據(jù)收于浙江金華和溫州兩地8所小學(xué), 共1300名被試, 有效被試1240人, 測(cè)試內(nèi)容為五年級(jí)小學(xué)行程應(yīng)用題, 共17個(gè)題(包含可達(dá)陣), 涉及8個(gè)屬性(見(jiàn)表10), 包括基本算數(shù)運(yùn)算、一般行程問(wèn)題關(guān)系式、等級(jí)復(fù)雜性、復(fù)雜行程問(wèn)題關(guān)系式、識(shí)別隱含條件、關(guān)系表征、圖式表征和正規(guī)代數(shù)策略, 屬性層級(jí)關(guān)系如圖4。該結(jié)構(gòu)由線型、收斂型和無(wú)結(jié)構(gòu)復(fù)合而成。
本研究考察4種測(cè)驗(yàn):包含可達(dá)陣的原測(cè)驗(yàn)(設(shè)為)和包含1個(gè)SSCQM且題量不同的三個(gè)測(cè)驗(yàn)(分別設(shè)為測(cè)驗(yàn)Q1、Q2、Q3, 均不包含可達(dá)陣), 其題量依次為14題、15題和16題。根據(jù)屬性層級(jí)結(jié)構(gòu), 由擴(kuò)張算法, 得到39種知識(shí)狀態(tài)。從數(shù)據(jù)分析結(jié)果可知, 測(cè)驗(yàn)Q1、Q2、Q3和測(cè)驗(yàn)可識(shí)別的知識(shí)狀態(tài)類型分別為24種、25種、21種和22種; 測(cè)驗(yàn)Q1、Q2、Q3分別與測(cè)驗(yàn)可識(shí)別的相同知識(shí)狀態(tài)個(gè)數(shù)分別為1150個(gè)、1124個(gè)和1175個(gè), 分別占總?cè)藬?shù)比的93%、90%和95%, 也即含SSCQM估計(jì)的被試與含可達(dá)陣估計(jì)的被試重復(fù)率達(dá)90%以上, 且用題量均少于可達(dá)陣; 測(cè)驗(yàn)Q1、Q2估計(jì)的知識(shí)狀態(tài)類型比測(cè)驗(yàn)R的多, 分類更細(xì)。三種測(cè)驗(yàn)估計(jì)的被試在各個(gè)屬性的掌握比例與測(cè)驗(yàn)R的相差不超過(guò)7% (見(jiàn)表11)。
7 討論
7.1 關(guān)于多級(jí)評(píng)分方法與完備Q矩陣的關(guān)系
一般地, 對(duì)于多級(jí)評(píng)分來(lái)說(shuō), 若評(píng)分方式和滿分值不一樣則完備Q陣不一樣。本研究是基于評(píng)分方式(1)式和滿分值(2)式, 提出了多級(jí)評(píng)分SCQM的設(shè)計(jì)方法。對(duì)于這種評(píng)分方式和滿分值, 可達(dá)陣為完備Q矩陣; 若評(píng)分方式和滿分值發(fā)生改變, 則可達(dá)陣可能不是完備Q矩陣, 如蔡艷等人(2017)提出減少滿分值, 評(píng)分采用取整的方法, 使得一些本該在(1)式和(2)式條件下不同的作答結(jié)果變得相同, 故可達(dá)矩陣的完備性發(fā)生了改變。以4個(gè)屬性線型結(jié)構(gòu)為例, 其中可達(dá)陣項(xiàng)目 和, 四個(gè)項(xiàng)目的分值分別設(shè)為0.5分, 1分, 2分和3分, 根據(jù)文中算法, 被試和在可達(dá)陣上理想反應(yīng)模式均為(0000), 也即無(wú)法區(qū)分, 若采用(1)式和(2)式, 則可達(dá)陣仍為完備Q矩陣。事實(shí)上, 若每個(gè)屬性的評(píng)分權(quán)重一樣, 則當(dāng)每題的滿分值大于等于考察屬性總數(shù)時(shí), 可達(dá)陣仍為完備Q矩陣, 基于可達(dá)陣提煉的SCQM的完備性不發(fā)生改變。這一良好的性質(zhì)拓展了SCQM的適用范圍。若每個(gè)屬性評(píng)分權(quán)重不一樣, 則上述結(jié)論不一定成立。
7.2 測(cè)驗(yàn)的投入產(chǎn)出比
測(cè)驗(yàn)是需要時(shí)間成本和經(jīng)濟(jì)成本的, 因此, 提高測(cè)驗(yàn)效率, 用最少的題量實(shí)現(xiàn)對(duì)被試最大限度地區(qū)分, 是測(cè)驗(yàn)設(shè)計(jì)孜孜以求的目標(biāo)。投入產(chǎn)出比被定義為判準(zhǔn)率(MMR和PMR)除以投入的項(xiàng)目數(shù)以及估算時(shí)間, 數(shù)值越大表示單位時(shí)間以及每個(gè)題目上所得判準(zhǔn)率越高, 即投入產(chǎn)出比越高。這個(gè)指標(biāo)充分體現(xiàn)在短測(cè)驗(yàn)中, 在四種屬性層級(jí)結(jié)構(gòu)下, SSCQM/USCQM的投入產(chǎn)出比均大于可達(dá)陣, 其中, 線型結(jié)構(gòu)的最簡(jiǎn)完備Q矩陣題量最少, 因此不論從出題量還是估計(jì)被試來(lái)說(shuō), 其時(shí)間花費(fèi)少, 投入產(chǎn)出比最大。如在短測(cè)驗(yàn)中6個(gè)屬性線型結(jié)構(gòu)的SSCQM(只有1列), 其投入產(chǎn)出比為0.9611/0.3318× 1=2.90, 而可達(dá)陣的分別為0.9845/1.0389×6=0.16。收斂結(jié)構(gòu)的SSCQM/USCQM的投入產(chǎn)出比為0.93和1.08, 而可達(dá)陣的約為0.17。SSCQM/USCQM是投入產(chǎn)出比較高的測(cè)驗(yàn)。但SSCQM數(shù)量非常有限, 在考慮曝光率等因素時(shí), 還需考慮USCQM。
7.3 關(guān)于USCQM
由測(cè)驗(yàn)的判準(zhǔn)率來(lái)看, 不論是長(zhǎng)測(cè)驗(yàn)還是短測(cè)驗(yàn), 在考慮屬性層級(jí)結(jié)構(gòu)的情況下, 結(jié)構(gòu)化(最簡(jiǎn))完備Q矩陣可以替代可達(dá)陣, 且用題更少, 種類更多; 若不考慮屬性層級(jí)結(jié)構(gòu), 非結(jié)構(gòu)化(最簡(jiǎn))完備Q矩陣也可替代可達(dá)陣或單位陣。相對(duì)于SSCQM而言, USCQM具有較大應(yīng)用潛力, 原因有三:第一, 模擬研究發(fā)現(xiàn), 在長(zhǎng)測(cè)驗(yàn)中, 含USCQM的判準(zhǔn)率大于含可達(dá)陣的, 在短測(cè)驗(yàn)中, 雖然USCQM的判準(zhǔn)率略低于可達(dá)陣, 但相差較小, 約0.03左右(收斂結(jié)構(gòu)差值不超過(guò)0.1), 且其投入產(chǎn)出比均大于可達(dá)陣。第二, SSCQM和可達(dá)陣是基于屬性層級(jí)結(jié)構(gòu)的, 但由于認(rèn)知過(guò)程存在個(gè)體差異, 屬性層級(jí)結(jié)構(gòu)不一定適合所有作答者。比如, 命題者(熟手)與被試(生手)對(duì)相同問(wèn)題的認(rèn)知過(guò)程不一定相同, 因此專家在設(shè)計(jì)Q矩陣時(shí)是否需要考慮屬性層級(jí)結(jié)構(gòu)也持有不同意見(jiàn), 如K?hn和Chiu (2021)認(rèn)為遵循某種屬性層級(jí)結(jié)構(gòu)不是必要的。第三, USCQM設(shè)計(jì)更豐富靈活。以收斂結(jié)構(gòu)(a)為例, 介于之間的USCQM 達(dá)53個(gè), 而SSCQM僅有2個(gè), 可達(dá)陣只有1個(gè)。USCQM設(shè)計(jì)的這一特點(diǎn), 有助于豐富出題的多樣性, 不僅在紙筆測(cè)驗(yàn)中極具優(yōu)勢(shì), 而且可以解決CD-CAT中因項(xiàng)目過(guò)度曝光帶來(lái)的題庫(kù)安全等問(wèn)題。
7.4 關(guān)于基于可達(dá)陣提取的完備Q矩陣
基于可達(dá)陣R提取的多級(jí)評(píng)分SSCQM有如下優(yōu)勢(shì):
(2)構(gòu)造USCQM的關(guān)鍵。從R中提取的SSCQM有助于找到對(duì)應(yīng)單位陣中的列, 而在R之外很難找到對(duì)應(yīng)于單位陣中的列, 故而不利于USCQM的構(gòu)造。
8 結(jié)論
針對(duì)0-1屬性多級(jí)評(píng)分Q矩陣設(shè)計(jì), 本研究提出了SSCQM和USCQM概念, 并給出了基于可達(dá)陣的SSCQM和USCQM設(shè)計(jì)及其算法。通過(guò)模擬研究, 考察屬性層級(jí)結(jié)構(gòu)、屬性個(gè)數(shù)和項(xiàng)目參數(shù)等因素對(duì)(含)SSCQM、USCQM和可達(dá)陣等三種測(cè)驗(yàn)判準(zhǔn)率的影響。研究結(jié)果均表明:第一, 測(cè)驗(yàn)(含)SSCQM、USCQM和可達(dá)陣越多, 則判準(zhǔn)率越高。第二, 在長(zhǎng)測(cè)驗(yàn)中, 當(dāng)列數(shù)相同時(shí), 隨著項(xiàng)目參數(shù)的增加或?qū)傩詡€(gè)數(shù)的增加或?qū)傩詫蛹?jí)結(jié)構(gòu)的變化(從線型結(jié)構(gòu)到無(wú)結(jié)構(gòu)), 含USCQM測(cè)驗(yàn)的判準(zhǔn)率逐漸高于含SSCQM測(cè)驗(yàn)的判準(zhǔn)率, 含可達(dá)陣測(cè)驗(yàn)的判準(zhǔn)率最低。第三, 對(duì)于一定條件的長(zhǎng)測(cè)驗(yàn), 當(dāng)SSCQM/USCQM的列數(shù)與可達(dá)陣的列數(shù)相同或者略少時(shí), 其判準(zhǔn)率高于可達(dá)陣, 但無(wú)論各個(gè)因素如何變化, 三種測(cè)驗(yàn)的判準(zhǔn)率非常接近。第四, 在項(xiàng)目質(zhì)量好的短測(cè)驗(yàn)中, 多個(gè)SSCQM是最優(yōu)測(cè)驗(yàn), 因此要特別注意測(cè)驗(yàn)項(xiàng)目的打磨。第五, 實(shí)測(cè)數(shù)據(jù)研究表明, 含SSCQM的測(cè)驗(yàn)和含可達(dá)陣的測(cè)驗(yàn)對(duì)被試的識(shí)別重復(fù)率達(dá)90%以上, 屬性掌握比例相差不超過(guò)7%??傊?基于理想反應(yīng)模式, 本文提出的SSCQM和USCQM不僅可以替代可達(dá)陣, 而且可增加測(cè)驗(yàn)的多樣性, 降低測(cè)驗(yàn)的曝光率。
9 展望
本研究?jī)H針對(duì)0-1屬性多級(jí)評(píng)分的一種評(píng)分方式和滿分值進(jìn)行了SCQM設(shè)計(jì)的探討, 為多級(jí)評(píng)分Q矩陣的設(shè)計(jì)提供了思路, 而對(duì)于其他評(píng)分方式和滿分值, SSCQM和USCQM如何構(gòu)造, 值得研究。相較于0-1水平屬性, 多分屬性因?qū)Ρ辉囌J(rèn)知能力刻畫(huà)更為細(xì)致而獲得廣泛關(guān)注, 關(guān)于多分屬性0-1評(píng)分的測(cè)驗(yàn)設(shè)計(jì)問(wèn)題(蔡艷, 涂冬波, 2015), 目前有研究表明擬可達(dá)陣使得被試IRP與KS一一對(duì)應(yīng)(丁樹(shù)良 等, 2015), 故擬可達(dá)陣為SSCQM, 然而USCQM的構(gòu)造問(wèn)題仍未涉及。進(jìn)一步地, 如何構(gòu)造多分屬性多級(jí)評(píng)分的SSCQM和USCQM?從0-1屬性到多分屬性, 從0-1評(píng)分到多級(jí)評(píng)分, 這些因素兩兩結(jié)合的Q矩陣設(shè)計(jì)是否存在某種內(nèi)在邏輯聯(lián)系, 0-1屬性0-1評(píng)分的測(cè)驗(yàn)設(shè)計(jì)是否是多分屬性多級(jí)評(píng)分測(cè)驗(yàn)設(shè)計(jì)的特例, 是否可以拓展至多分屬性多級(jí)評(píng)分?SCQM題量少, 是否適用于類似PISA測(cè)試(分配給學(xué)生不同且少量的題目測(cè)試)的情景中, 未來(lái)可進(jìn)一步驗(yàn)證與應(yīng)用。
參 考 文 獻(xiàn)
Cai, Y., & Tu, D. B. (2015). Extension of cognitive diagnosis models based on the polytomous attributes framework and their Q-matrices designs. Acta Psychologica Sinica, 47(10), 1300?1308.
[蔡艷, 涂冬波. (2015). 屬性多級(jí)化的認(rèn)知診斷模型拓展及其Q矩陣設(shè)計(jì). 心理學(xué)報(bào), 47(10), 1300?1308.]
Cai, Y., Zhao, Y., Liu, S. C., Zhang, S. F., & Tu, D. B. (2017). An extended polytomous cognitive diagnostic model. Journal of Psychological Science, 40(6), 1491?1497.
[蔡艷, 趙洋, 劉舒暢, 張淑芳, 涂冬波. (2017). 一種優(yōu)化的多級(jí)評(píng)分認(rèn)知診斷模型. 心理科學(xué), 40(6), 1491?1497.]
Chen, J., & de la Torre, J. (2018). Introducing the general polytomous diagnosis modeling framework. Frontiers in Psychology, 9. https://doi.org/10.3389/fpsyg.2018.01474
Chiu, C. Y. (2013). Statistical refinement of the Q-matrix in cognitive diagnosis. Applied Psychological Measurement, 37(8), 598?618.
Chiu, C. Y., Douglas, J., & Li, X. (2009). Cluster analysis for cognitive diagnosis: Theory and applications. Psychometrika, 74, 633?665.
Chiu, C. Y., & K?hn, H. F. (2015). Consistency of cluster analysis for cognitive diagnosis: The DINO model and the DINA model revisited. Applied Psychological Measurement, 39(6), 465?479.
De Carlo, L. T. (2011). On the analysis of fraction subtraction data: The DINA model, classification, latent class sizes, and the q-matrix. Applied Psychological Measurement, 35(1), 8?26.
De Carlo, L. T. (2012). Recognizing uncertainty in the Q-matrix via a Bayesian extension of the DINA model. Applied Psychological Measurement, 36(6), 447?468.
de la Torre, J. (2011). The Generalized DINA Model Framework. Psychometrika, 76(2), 179?199.
Ding, S. L., Luo, F., & Wang, W. Y. (2014). Design of polytomous cognitively diagnostic test blueprint——For the independent and the rhombus attribute hierarchies. Journal of Jiangxi Normal University (Natural Sciences Edition), 38(3), 265?269.
[丁樹(shù)良, 羅芬, 汪文義. (2014). 多級(jí)評(píng)分認(rèn)知診斷測(cè)驗(yàn)藍(lán)圖的設(shè)計(jì)——獨(dú)立型和收斂型結(jié)構(gòu). 江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 38(3), 265?269.]
Ding, S. L., Luo, F., Wang, W. Y., LI, J., & Xiong, J. H. (2022). The structure of unstructured complete Q matrices and their identification. Journal of Jiangxi Normal University (Natural Sciences Edition), 46(5), 441?446.
[丁樹(shù)良, 羅芬, 汪文義, 李佳, 熊建華. (2022). 非結(jié)構(gòu)化完備Q陣的構(gòu)造與判定. 江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 46(5), 441?446.]
Ding, S. L., Luo, F., Wang, W. Y., & Xiong, J. H. (2015). The properties of 0-1 and polytomous Reach ability matrices and their applications. Journal of Jiangxi Normal University (Natural Sciences Edition), 39(1), 64?68.
[丁樹(shù)良, 羅芬, 汪文義, 熊建華. (2015). 0-1和多值可達(dá)矩陣的性質(zhì)及應(yīng)用. 江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 39(1), 64?68.]
Ding, S. L., Mao, M. M., Wang, W. Y., Luo, F., & Cui, Y. (2012). Evaluating the consistency of test items relative to the cognitive model for educational cognitive diagnosis. Acta Psychologica Sinica, 44(11), 1535?1546.
[丁樹(shù)良, 毛萌萌, 汪文義, 羅芬, Cui, Y. (2012). 教育認(rèn)知診斷測(cè)驗(yàn)與認(rèn)知模型一致性的評(píng)估. 心理學(xué)報(bào), 44(11), 1535?1546.]
Ding, S. L., Wang, W. Y., & Luo, F. (2014). Design of polytomous cognitively diagnostic test blueprint——For the rooted tree type. Journal of Jiangxi Normal University (Natural Sciences Edition), 38(2), 111?118.
[丁樹(shù)良, 汪文義, 羅芬. (2014). 多級(jí)評(píng)分認(rèn)知診斷測(cè)驗(yàn)藍(lán)圖的設(shè)計(jì)——根樹(shù)型結(jié)構(gòu). 江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 38(2), 111?118.]
Ding, S. L., Wang, W. Y., & Yang, S. Q. (2011). The design of cognitive diagnostic test blueprints. Journal of Psychological Science, 34(2), 258?265.
[丁樹(shù)良, 汪文義, 楊淑群. (2011). 認(rèn)知診斷測(cè)驗(yàn)藍(lán)圖的設(shè)計(jì). 心理科學(xué), 34(2), 258?265.]
Ding, S. L., Yang, S. Q., & Wang, W. Y. (2010). The importance of reachability matrix in constructing cognitively diagnostic testing. Journal of Jiangxi Normal University (Natural Sciences Edition), 34(5), 490?494.
[丁樹(shù)良, 楊淑群, 汪文義. (2010). 可達(dá)矩陣在認(rèn)知診斷測(cè)驗(yàn)編制中的重要作用. 江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 34(5), 490?494.]
Fang, G., Liu, J., & Ying, Z. (2019). On the identifiability of diagnostic classification models. Psychometrika, 84(1), 19? 40.
Gao, X. L., Gong, Y., & Wang, F. (2021). Research progress in polytomous cognitive diagnosis model. Journal of Psychological Science, 44(2), 457?464.
[高旭亮, 龔毅, 王芳. (2021). 多級(jí)評(píng)分認(rèn)知診斷模型述評(píng). 心理科學(xué), 44(2), 457?464.]
Gro?, J., & George, A. C. (2014). On permissible attribute classes in noncompensatory cognitive diagnosis models. Methodology: European Journal of Research Methods for the Behavioral and Social Sciences, 10(3), 100?107.
Gu, Y., & Xu, G. (2019). The sufficient and necessary condition for the identifiability and estimability of the DINA model. Psychometrika, 84(2), 468?483.
Gu, Y., & Xu, G. (2021a). Sufficient and necessary conditions for the identifiability of the Q-matrix. Statistica Sinica, 31(1), 449?472.
Gu, Y., & Xu, G. (2021b). Identifiability of hierarchical latent attribute models. preprint arXiv: 1906.07869v4.
Kang, C. H., Xin, T., & Tian, W. (2013). Development and validation of diagnostic test for primary school arithmetic word problems. Examinations Research, 41(6), 24?43.
[康春花, 辛濤, 田偉. (2013). 小學(xué)數(shù)學(xué)應(yīng)用題認(rèn)知診斷測(cè)驗(yàn)編制及效度驗(yàn)證. 考試研究, 41(6), 24?43.]
K?hn, H. F., & Chiu, C. Y. (2017). A procedure for assessing the completeness of the Q-matrices of cognitively diagnostic tests. Psychometrika, 82, 112?132.
K?hn, H. F., & Chiu, C. Y. (2021). A unified theory of the completeness of Q-Matrices for the DINA model. Journal of Classification, 38(3), 500?518.
Leighton, J. P., & Gierl, M. J. (2007). Cognitive diagnostic assessment for education: Theory and applications. Cambridge University Press.
Lin, M., & Xu, G. (2023). Sufficient and Necessary Conditions for the Identifiability of DINA Models with Polytomous Responses. preprint arXiv: 2304.01363.
Liu, J., Xu, G., & Ying, Z. (2012). Data-driven learning of Q-matrix. Applied Psychological Measurement, 36(7), 548? 564.
Liu, J., Xu, G., & Ying, Z. (2013). Theory of the self-learning Q-matrix. Bernoulli, 19, 1790?1817.
Ma, W. C., & de la Torre, J. (2016). A sequential cognitive diagnosis model for polytomous responses. British Journal of Mathematical and Statistical Psychology, 69(3), 253?275.
Madison, M. J., & Bradshaw, L. P. (2015). The effects of Q-matrix design on classification accuracy in the log-linear cognitive diagnosis model. Educational and Psychological Measurement, 75(3), 491?511.
Ouyang, J., & Xu, G. (2022). Identifiability of latent class models with covariates. Psychometrika, 87(4), 1343?1360.
Sun, J. N., Xin, T., Zhang, S. M., & de la Torre, J. (2013). A polytomous extension of the generalized distance discriminating method. Applied Psychological Measurement, 37(7), 503?521.
Tatsuoka, K. K. (1995). Architecture of knowledge structures and cognitive diagnosis: A statistical pattern recognition and classification approach. Erlbaum: Hillsdale, 327?359.
Tatsuoka, K. K. (2009). Cognitive assessment: An introduction to the rule space method. Routledge/Taylor & Francis Group.
Xu, G., & Zhang, S. (2016). Identifiability of diagnostic classification models. Psychometrika, 81(3), 625?649.
Design of the polytomous simplest complete Q matrix based on the reachability matrix
Abstract
The identifiability of cognitive diagnosis models relies heavily on the completeness of the Q matrix. However, existing test designs primarily focus on dichotomously-scored items, neglecting the importance of polytomous cognitive diagnostic test design. Moreover, this limitation poses a significant obstacle to the advancement of cognitive diagnosis. To bridge this gap, this paper aimed to introduce novel designs for the construction of polytomous structured and unstructured simplest complete Q matrices (SSCQM/USCQM). Our proposed approach considered all ideal response patterns (IRPs) of knowledge states (KSs) on the reachability matrix as research objects, with the objective of minimizing the number of columns selected from the reachability matrix. This ensured one-to-one correspondence between the set of KSs and the set of IRPs, thereby enhancing the completeness of the SSCQM. Additionally, we derived a polytomous USCQM by considering the relationship between the SSCQM and the sub-matrix of the corresponding identity matrix while ensuring that each row contains at least one “1”. Interestingly, the construction process revealed that there were more USCQMs than SSCQMs. This innovative approach expanded the possibilities for polytomous cognitive diagnostic test design.
This study focused on the design and evaluation of cognitive diagnostic tests using polytomous structured and unstructured Q matrices (SSCQM/USCQM). We conducted two studies to comprehensively examine the influence of factors such as the number of attributes, attribute hierarchies, and item parameters on the precision of the SSCQM, USCQM, and reachability matrix. In the first study, variations in attribute structures and item parameter values were investigated to understand their impact on Q matrix accuracy. On the other hand, the second study explored the effects of attribute hierarchies and the number of attributes on the precision of the SSCQM, USCQM, and reachability matrix.
Both simulation studies and actual measurement data were utilized to assess the robustness and efficacy of the two methods. Firstly, the simulation results revealed several key findings. Notably, increasing the number of SSCQMs or USCQMs positively influenced the accuracy of the results. In the context of long tests, the USCQM demonstrated higher Pattern Match Ratio (PMR) and Marginal Match Ratio (MMR) compared to the SSCQM and the reachability matrix. This trend was particularly evident when there was an increase in item parameters, attribute numbers, or a change in attribute hierarchy. However, it is noteworthy that, regardless of these various factors, the PMR and MMR of the three tests exhibited minimal differences. On the other hand, in short tests with good item quality, the SSCQM achieved the best performance compared to other methods. This highlights the importance of considering specific test characteristics and item quality when selecting the appropriate Q matrix type. These findings provide valuable insights into the factors that influence the precision of Q matrices. They emphasize the benefits of increasing the number of matrices, understanding the impact of item parameters, and recognizing the performance disparities among different matrix types. Obtaining a comprehensive understanding of these relationships is vital for optimizing the design and implementation of cognitive diagnostic testing, ultimately guaranteeing accurate assessments of individual knowledge states. Secondly, analysis of the actual measurement data showed high identification repetition rates for the SSCQM and the reachability matrix, with a minimal difference in attribute mastery ratio.
In summary, both the SSCQM and the USCQM demonstrate adequate performance when compared to other Q matrices under similar conditions. These findings emphasize the significance of prioritizing completeness in cognitive diagnostic testing. This research seeks to contribute to the advancement of cognitive diagnosis by addressing the limitations of existing test designs and introducing new techniques for constructing polytomous Q matrices. In addition, the findings presented in this paper offer valuable insights for researchers and practitioners seeking to design high-quality cognitive diagnostic tests that accurately assess individual knowledge states.
Keywords polytomous, test design, SSCQM, USCQM, algorithm
附錄
基本屬性層級(jí)結(jié)構(gòu)及其他結(jié)構(gòu)的結(jié)構(gòu)化最簡(jiǎn)完備Q矩陣算法步驟
第二步首先從最后1列開(kāi)始, 第6列大于前面的列, 將第6列放入Q1中, 并在W中刪除此列; 再考慮第5列, 情況如同第6列, 把該列放入Q1中, 并在W中刪除此列, 如此下去, 直至把第3列放入Q1中, 此時(shí)剩余列數(shù)等于2, 直接計(jì)算W 剩余列的支柱列; 接著由于此時(shí)W中第2列大于第1列, 刪除第1列, 將第2列放入Q2中;
第三步計(jì)算Q1支柱列, 最大列為全1列;
第四步由屬性層級(jí)結(jié)構(gòu)的分支數(shù)為1, 則只取Q1中全1列為結(jié)構(gòu)化的Q矩陣;
第五步驗(yàn)證全1列為結(jié)構(gòu)化最簡(jiǎn)完備Q矩陣。
收斂型(a):第一步將可達(dá)陣中項(xiàng)目依據(jù)列和從小到大進(jìn)行排序, 由第4列和第5列的列和相同, 則有
第二步首先兩矩陣的第6列均大于前面的列, 則將第6列放入Q1中, 并在和中刪除此列; 接著計(jì)算和剩余列的支柱列, 和的第1列小于第2列, 第2列小于第3列, 第3列小于第4列, 將第1,2,3列刪除, 第4列放入Q2中, 最后重置和, 原第5列為新第1列, 因只剩1列, 直接放入Q2中;
第三步 Q1只有1列, 故該列為支柱列;
第四步該屬性層級(jí)結(jié)構(gòu)圖中有2個(gè)分支, 故從Q2中隨機(jī)取1列, 與Q1合并為一個(gè)矩陣, 故總共2個(gè)矩陣, 為
第二步首先兩矩陣的第6列均大于前面的列, 則將第6列放入Q1中, 并在和中刪除此列; 接著計(jì)算和剩余列的支柱列, 的第1列小于第2列, 第2列與第3列不能比較, 第2列小于第4列, 第4列小于第5列, 將第1,2,4列刪除, 第5列放入Q2中, 最后重置, 原第3列為新第1列, 因只剩1列, 直接放入Q2中, 此時(shí)Q1有1列, 為(1,1,1,1,1,1)T, Q2有2列, 為(1,1,0,0,0,0)T和(1,0,1,1,1,0)T; 的第1列小于第2列, 第2列與后面的列均不可比較, 將第1列刪除, 第2列放入Q2中, 重置的列, 原來(lái)的第3,4,5列即為新的第1,2,3列, 第3列大于第1,2列, 則將第3列放入Q1中, 因此的列數(shù)為2列, 第2列大于第1列, 刪除第1列, 將第2列放入Q2中, 此時(shí)Q1有2列, 為(1,1,1,1,1,1)T和(1,0,1,1,1,0)T, Q2有2列, 為(1,1,0,0,0,0)T和(1,0,1,1,0,0)T;
第三步 的Q1只有2列, 取最大列 (1,1,1,1,1,1)T為支柱列;
第四步該屬性層級(jí)結(jié)構(gòu)圖中有2個(gè)分支, 故從和Q2中隨機(jī)取1列, 與和的Q1支柱列合并為一個(gè)矩陣, 故總共4個(gè)矩陣, 為
分支型:第一步將可達(dá)陣中項(xiàng)目依據(jù)列和從小到大進(jìn)行排序, 由第2列和第3列, 第4列、第5列和第六列的列和相同, 則有;
第二步首先中沒(méi)有最大列, 故Q1為空; 接著計(jì)算的支柱列, 的第1列小于第2列, 第2列小于第4列, 將第1,2列刪除, 第4列放入Q2中, 重置, 原第3,5,6列為新第1,2,3列, 第1列小于第2列, 第2列與第3列不能比較, 將第1列刪除, 第2列放入Q2中, 重置, 剩余1列, 也放入Q2中;
第三步 Q1為空;
第四步該屬性層級(jí)結(jié)構(gòu)圖中有3個(gè)分支, 故Q2正好3列, 矩陣即為所求;
第五步驗(yàn)證所得矩陣為結(jié)構(gòu)化最簡(jiǎn)完備Q矩陣。的結(jié)論一致。
無(wú)結(jié)構(gòu):第一步將可達(dá)陣中項(xiàng)目依據(jù)列和從小到大進(jìn)行排序, 由第2列至第6列的列和相同, 則將這些列進(jìn)行全排列, 以其中為例;
第二步首先中沒(méi)有最大列, 故Q1為空; 接著計(jì)算的支柱列, 的第1列小于第2列, 第2列與后面列均不可比較, 將第1列刪除, 第2列放入Q2中, 重置, 新的列均不能比較, 全部放入Q2中(無(wú)論列和為2的列如何排列, 這些列均互相不可比較, 故結(jié)果一致);
第三步 Q1為空;
第五步驗(yàn)證所得矩陣為結(jié)構(gòu)化最簡(jiǎn)完備Q矩陣。
第二步首先Q1為空; 接著計(jì)算的支柱列, 的列均不能比較, 全部放入Q2中(無(wú)論列和為1的列如何排列, 這些列均互相不可比較, 故結(jié)果一致);
第三步 Q1為空;
第五步驗(yàn)證所得矩陣為結(jié)構(gòu)化最簡(jiǎn)完備Q矩陣。
其他結(jié)構(gòu):
Sun等人(2013)文章中的結(jié)構(gòu)
第一步將可達(dá)陣中項(xiàng)目依據(jù)列和從小到大進(jìn)行排序, 由第1列至第4列, 第5, 6列的列和相同, 則將這些列分別全排列, 以其中為例;
第二步首先的第7列均大于前面的列, 則將第7列放入Q1中, 并在中刪除此列; 接著計(jì)算的支柱列, 的第1列與第2,3,4列不能比較, 小于第5列, 將第1列刪除, 第5列放入Q2中, 重置, 原第2,3,4,6列為新第1,2,3,4列, 此時(shí)沒(méi)有最大列, 第1列無(wú)法比較, 放入Q2中, 并在中刪除, 重置, 第2,3,4列為第1,2,3列, 也即原第3,4,6列, 這時(shí)的第3列最大, 放入Q1中, 第1,2列不能比較, 均放入Q2中, 此時(shí)Q1有2列, 為(1,1,1,1,1,1,1)T和(0,0,0,1,1,1,0)T, Q2有4列, 為(1,1,1,0,0,0,0)T 、(0,1,0,0,0,0,0)T、(0,0,0,1,0,0,0)T和(0,0,0,0,1,0,0)T;
第三步 Q1有2列, 取大為(1,1,1,1,1,1,1)T;
第五步驗(yàn)證所得矩陣為結(jié)構(gòu)化最簡(jiǎn)完備Q矩陣。其他矩陣可得到其他6種結(jié)構(gòu)化最簡(jiǎn)完備Q矩陣。
K?hn和Chiu (2021) 文章中的結(jié)構(gòu)
第一步將可達(dá)陣中項(xiàng)目依據(jù)列和從小到大進(jìn)行排序, 由兩對(duì)列和相同, 則全排列, 以為例;
第二步首先中沒(méi)有最大列, 故Q1為空; 接著計(jì)算的支柱列, 的第1列小于第4列, 第4列小于第7列, 第7,8,9,10列依次增大, 將第1,4,7,8,9列刪除, 第10列放入Q2中, 重置, 沒(méi)有最大列, 原第2列小于第3列, 第3列與其他列不能比較, 將第2列刪除, 第3列放入Q2中, 重置, 原第11列最大, 放入Q1中, 剩余原5,6列, 由第5列小于第6列, 刪除第5列, 第6列放入Q2中, 故Q1中只有原第11列, Q2中有原第3,6,10列;
第三步 Q1中只有原第11列;
第四步該屬性層級(jí)結(jié)構(gòu)圖中的分支無(wú)法計(jì)算, 隨機(jī)從 Q2中分別取1列、2列、3列與Q1中的列組合成矩陣Q;
第五步驗(yàn)證矩陣Q只有包含第3,6,10,11列即為結(jié)構(gòu)最簡(jiǎn)化完備Q矩陣。
2.5個(gè)屬性四種屬性層級(jí)結(jié)構(gòu)
7個(gè)屬性四種屬性層級(jí)結(jié)構(gòu)
8個(gè)屬性四種屬性層級(jí)結(jié)構(gòu)