舒服華
武漢理工大學(xué)職業(yè)技術(shù)學(xué)院 武漢 430070
小麥?zhǔn)俏覈?guó)北方農(nóng)民種植的主要糧食作物,其價(jià)格直接關(guān)系到麥農(nóng)種糧的積極性,進(jìn)而影響我國(guó)的糧食安全。面制食品是我國(guó)居民喜愛的傳統(tǒng)主食,面粉是影響面制食品質(zhì)量的最主要因素,小麥的質(zhì)量直接影響到面粉的質(zhì)量。
為了保護(hù)農(nóng)民種糧的積極性和促進(jìn)糧食生產(chǎn)的發(fā)展,國(guó)家采取了保護(hù)價(jià)敞開收購(gòu)農(nóng)民小麥等糧食政策,消除了種糧農(nóng)民賣糧難、賣糧苦的后顧之憂。然而,隨著我國(guó)市場(chǎng)經(jīng)濟(jì)體制的逐步建立和完善,糧食購(gòu)銷市場(chǎng)已全面放開,糧食不僅是一種戰(zhàn)略物質(zhì),也是一種重要的商品,必須遵循市場(chǎng)規(guī)律:自由競(jìng)爭(zhēng),優(yōu)勝劣汰。
糧食作為一種特殊商品,有其自身的特點(diǎn)。從大局看,國(guó)家應(yīng)該穩(wěn)定糧食收購(gòu)價(jià)格,保護(hù)農(nóng)民的利益,統(tǒng)籌城鄉(xiāng)一體發(fā)展,從市場(chǎng)角度看,種糧農(nóng)戶應(yīng)提高產(chǎn)品質(zhì)量,滿足市場(chǎng)的需求。在當(dāng)前市場(chǎng)經(jīng)濟(jì)條件下,小麥生產(chǎn)應(yīng)當(dāng)遵循一定的市場(chǎng)規(guī)律,那就是:優(yōu)質(zhì)優(yōu)價(jià),按質(zhì)論價(jià);品質(zhì)差、不受市場(chǎng)歡迎的小麥品種將逐步退出保護(hù)價(jià)收購(gòu)范圍。
在小麥?zhǔn)召?gòu)問題上,國(guó)家對(duì)其質(zhì)量劃分了嚴(yán)格的等級(jí)標(biāo)準(zhǔn),不同等級(jí)的小麥,收購(gòu)價(jià)格不同,這不僅體現(xiàn)了公平公正的原則,又能促進(jìn)麥農(nóng)提高種麥技術(shù)水平,生產(chǎn)高質(zhì)量的產(chǎn)品更好滿足市場(chǎng)需求,緩解購(gòu)銷矛盾。
國(guó)家制定的小麥質(zhì)量等級(jí)評(píng)價(jià)指標(biāo)雖然有6項(xiàng),但在標(biāo)準(zhǔn)等級(jí)劃分中,只對(duì)容重和不完善率作出了具體的定量要求,其它4個(gè)指標(biāo)只作了同一的最低控制標(biāo)準(zhǔn),其中色澤氣味僅作了定性要求。這樣的標(biāo)準(zhǔn)等級(jí)劃分難以細(xì)致、準(zhǔn)確、客觀地反映小麥的質(zhì)量狀況,也給具體的操作帶來(lái)了不便。而且,即使同一等級(jí)的小麥,質(zhì)量也有優(yōu)劣之分。因此,只有對(duì)小麥質(zhì)量進(jìn)一步細(xì)化,才能更好地發(fā)揮其商品的價(jià)值,使面粉企業(yè)選擇到名副其實(shí)的優(yōu)良產(chǎn)品,同時(shí)可以防止小麥?zhǔn)袌?chǎng)出現(xiàn)以次充好、名不副實(shí)的欺詐行為。
k-均值聚類是解決聚類問題的一種經(jīng)典算法,它簡(jiǎn)單、快速,適合于處理大數(shù)據(jù)集,該算法具有較好的可伸縮性和高效性,當(dāng)簇接近高斯分布時(shí),其聚類效果更佳,運(yùn)用k-均值聚類法對(duì)小麥的質(zhì)量進(jìn)行綜合評(píng)判是一種嘗試。
按照國(guó)家相關(guān)標(biāo)準(zhǔn),小麥質(zhì)量等級(jí)評(píng)價(jià)指標(biāo)共有6個(gè):容重、不完善率、雜質(zhì)含量、雜質(zhì)中礦物質(zhì)含量、水分、色澤氣味,小麥品質(zhì)共分為5個(gè)等級(jí)。文中選取容重(B1)、不完善率(B2)、雜質(zhì)含量(B3)、雜質(zhì)中礦物質(zhì)含量(B4)、水分(B5)、色澤氣味(B6)6 個(gè)指標(biāo)作為小麥質(zhì)量等級(jí)綜合評(píng)定指標(biāo),小麥質(zhì)量等級(jí)評(píng)價(jià)指標(biāo)體系如圖1所示。
圖1 小麥質(zhì)量?jī)r(jià)指標(biāo)體系
k-均值聚類算法是科學(xué)和工程領(lǐng)域諸多聚類算法中極其有影響和價(jià)值的一種聚類技術(shù)。它是各類聚類方法中最基本、最適應(yīng)的劃分方法,通常采用誤差平方和準(zhǔn)則函數(shù)作為聚類準(zhǔn)則函數(shù)。
k-均值聚類的基本思想是:以樣本空問中k個(gè)點(diǎn)為中心進(jìn)行聚類,對(duì)最靠近它們的對(duì)象歸類。通過迭代的方法,逐次更新各聚類中心的值,直至得到最好的聚類結(jié)果。算法具體步驟如下:
①?gòu)膎個(gè)數(shù)據(jù)對(duì)象中任意選擇k個(gè)對(duì)象作為初始聚類中心;
②根據(jù)每個(gè)聚類對(duì)象的中心,計(jì)算每個(gè)對(duì)象與這些中心對(duì)象的距離,并根據(jù)最小距離重新對(duì)相應(yīng)對(duì)象進(jìn)行劃分,將每個(gè)對(duì)象重新賦給最相近的類;
③重新計(jì)算每個(gè)聚類的中心;
④重復(fù)步驟②、③,直到每個(gè)聚類不再發(fā)生變化為止。
k-均值聚類算法嘗試找出使平方誤差函數(shù)值最小的k個(gè)聚類,即:
式中:E是數(shù)據(jù)庫(kù)中所有對(duì)象的平方誤差總和;
x表示給定的數(shù)據(jù)對(duì)象;
zi是簇si的中心。
這個(gè)準(zhǔn)則使生成的結(jié)果簇盡可能地緊湊和獨(dú)立。
由于每個(gè)指標(biāo)的量綱和數(shù)量級(jí)不同,為了便于決策,需要對(duì)原始數(shù)據(jù)進(jìn)行規(guī)范化處理。屬性指標(biāo)一般分為效益型(越大越好)和成本型兩類(越小越好),不同類型的指標(biāo),規(guī)范化方法不同。
對(duì)于效益型指標(biāo),規(guī)范化采用如下方式:
對(duì)于成本型指標(biāo),規(guī)范化采用如下方式:
式中:xij為原始數(shù)據(jù)序列;
yij為規(guī)范化數(shù)據(jù)序列。
由于k-均值聚類法指標(biāo)的權(quán)重對(duì)分類結(jié)果影響較小,故文中采用較為簡(jiǎn)單的環(huán)比評(píng)分法確定評(píng)價(jià)指標(biāo)的權(quán)重。具體方法為,首先根據(jù)評(píng)價(jià)指標(biāo)對(duì)評(píng)價(jià)結(jié)果的影響大小,對(duì)每個(gè)評(píng)價(jià)對(duì)象的重要性程度進(jìn)行評(píng)分,評(píng)分可為百分制也可十分制,可為小數(shù)也可為分?jǐn)?shù),根據(jù)決策者的喜好自行決定。設(shè)評(píng)價(jià)指標(biāo)Bi的重要性評(píng)分為Pi,則Bi的權(quán)重為:
式中:wi為指標(biāo)Bi的權(quán)重。
加權(quán)規(guī)范化數(shù)據(jù)為評(píng)價(jià)對(duì)象各指標(biāo)規(guī)范數(shù)據(jù)與其對(duì)應(yīng)的權(quán)重之積,即:
式中:wi為指標(biāo)Bi的權(quán)重;
yij為第j個(gè)評(píng)價(jià)對(duì)象第i個(gè)評(píng)價(jià)指標(biāo)的規(guī)范化數(shù)據(jù)。
以某小麥樣品為例,品種為襄麥25。選取15個(gè)樣本,以圖1所示的容重、不完善率、雜質(zhì)含量、雜質(zhì)中礦物質(zhì)含量、水分、色澤氣味6個(gè)指標(biāo)為小麥綜合等級(jí)評(píng)定指標(biāo)。故評(píng)價(jià)對(duì)象集為 S={s1,s2,…,s15},評(píng)價(jià)指標(biāo)集為B={B1,B2,…,B6}。所有指標(biāo)性能測(cè)試參照國(guó)家相關(guān)標(biāo)準(zhǔn),經(jīng)檢測(cè),這15樣品的6個(gè)指標(biāo)值如表1所示(其中色澤氣味采用專家評(píng)分法),數(shù)據(jù)為測(cè)試3次的平均值。
表1 小麥質(zhì)量指標(biāo)測(cè)試值
小麥質(zhì)量6項(xiàng)性能指標(biāo)中,第1項(xiàng)和第6項(xiàng)為效益型指標(biāo),其余項(xiàng)為成本性指標(biāo),分別按式(2)和式(3)進(jìn)行規(guī)范化處理,結(jié)果如表2所示。
根據(jù)有關(guān)標(biāo)準(zhǔn)結(jié)合生產(chǎn)實(shí)際經(jīng)驗(yàn),給出小麥質(zhì)量6項(xiàng)性能指標(biāo)的重要性評(píng)分。它們分別為:P1=10,P2=9.5,P3=9.0,P4=8.5,P5=8.0,P6=7.5,按式(4)計(jì)算出6 項(xiàng)性能指標(biāo)的權(quán)重為:w1=0.1905,w2=0.1809,w3=0.1714,w4=0.1619,w5=0.1524,w6=0.1429。
按式(5)計(jì)算加權(quán)規(guī)范化數(shù)據(jù),結(jié)果如表3所示。
按上述k-均值聚類方法進(jìn)行聚類。首先確定聚類數(shù)目,聚類數(shù)目太多理不清頭緒,太少無(wú)從體現(xiàn)差別,對(duì)于15個(gè)大小的樣本,分為3類比較合適,于是取聚類數(shù)目k=3,據(jù)此得到各類別的中心,結(jié)果如表4所示。
表2 原始數(shù)據(jù)規(guī)范化結(jié)果
表3 加權(quán)規(guī)范化數(shù)據(jù)
續(xù) 表
表4 各類別的中心值
以誤差平方和準(zhǔn)則函數(shù)為聚類準(zhǔn)則函數(shù) 由此,可得到樣本的分類結(jié)果及各類別樣本至其中心的距離之和,結(jié)果如表5所示。
表5 分類結(jié)果及類間距離
從分類情況看,第一類的樣品的質(zhì)量要劣于第二類,第二類樣品的質(zhì)量要劣于第三類。樣本的分類結(jié)果直觀圖見圖2所示。
圖2 聚類結(jié)果直觀圖
客觀準(zhǔn)確評(píng)價(jià)小麥的質(zhì)量,對(duì)維護(hù)小麥?zhǔn)袌?chǎng)的正常秩序,保護(hù)麥農(nóng)的利益,維護(hù)糧食企業(yè)的合法權(quán)利,促進(jìn)我國(guó)小麥生產(chǎn)持續(xù)健康發(fā)展等具有重要的意義。k-均值聚類根據(jù)較少的已知聚類樣本的類別,對(duì)決策對(duì)象進(jìn)行優(yōu)化調(diào)整確定部分樣本的分類,降低總的聚類時(shí)間復(fù)雜度,此外該算法具有優(yōu)化迭代功能,在已經(jīng)求得的聚類基礎(chǔ)上,再次進(jìn)行迭代修正調(diào)整部分樣本的聚類,優(yōu)化了初始監(jiān)督學(xué)習(xí)樣本分類不合理的部分,提高了聚類的準(zhǔn)確性。
本文運(yùn)用k-均值聚類對(duì)小麥質(zhì)量進(jìn)行分析,有利于發(fā)揮小麥的商品特性,對(duì)面粉企業(yè)選擇物有所值的產(chǎn)品,經(jīng)銷商誠(chéng)實(shí)守信經(jīng)營(yíng),提高面粉的質(zhì)量,更高好滿足人們生活需要等具有重要現(xiàn)實(shí)意義。
[1]王小平,萬(wàn)蘭.小麥質(zhì)量指標(biāo)的檢測(cè)與分析[J].現(xiàn)代面粉工業(yè),2009(6):38-40
[2]馬心宇,馬琳.試論創(chuàng)新機(jī)制統(tǒng)籌發(fā)展構(gòu)筑糧食安全保障新體系[J].糧食問題研究,2017(6):16-23
[3]成升魁,汪壽陽(yáng).新時(shí)期糧食安全觀與糧食供給側(cè)改革[J].中國(guó)科學(xué)院院刊,2017,32(10)