丁夢(mèng)雅 余雁王 漢坤 鄭文瑞 韓亞魯 金秀 李紹穩(wěn)
(安徽農(nóng)業(yè)大學(xué),合肥,230036)(福建農(nóng)林大學(xué))(國際竹藤中心)(安徽農(nóng)業(yè)大學(xué))
目前世界范圍內(nèi)造紙?jiān)现饕悄静睦w維原料,木漿比占90%以上。隨著造紙需求增加和木材供應(yīng)不足,竹材成為造紙纖維原料的第二供應(yīng)者。我國有豐富的竹林資源,分布區(qū)域廣泛。人工經(jīng)營的竹林面積近600萬hm2,其中毛竹占420萬hm2。據(jù)統(tǒng)計(jì)資料顯示,可用于紙漿造紙的竹林約140萬hm2,其中集約經(jīng)營的梁山慈竹、慈竹、硬頭黃竹等約20萬hm2,主要集中在四川省瀘州市、宜賓市和貴州省赤水市,年產(chǎn)竹材約400萬t[1]。全球有三大竹區(qū),分別是亞太竹區(qū)、美洲竹區(qū)、非洲竹區(qū)。亞太竹區(qū)是世界上最大的竹區(qū),面積約1 400萬hm2,其中中國、印度、日本、緬甸、泰國、菲律賓、孟加拉等國是竹子資源較豐富的國家。截至2018年,印度竹漿年產(chǎn)量近50萬t;緬甸、泰國、菲律賓等國,單個(gè)竹材制漿廠的年產(chǎn)量不超過10萬t。美洲竹區(qū)的面積約160萬hm2,其中以叢生竹為主,且多為小型低矮竹種,經(jīng)濟(jì)價(jià)值低。非洲竹區(qū)面積約150萬hm2,其中鄉(xiāng)土竹種很少,而東非的馬達(dá)加斯加島的竹種較為豐富,有11屬40種[2]。然而,全球可用于紙漿造紙的竹材只局限于極少數(shù)竹種,大多數(shù)竹種的造紙性能并不知曉,也不為造紙工業(yè)所用,造成了資源浪費(fèi)。并且隨著可用于竹林的土地資源越來越緊張,靠擴(kuò)大竹林種植面積增加竹材產(chǎn)量不太現(xiàn)實(shí)。只能通過選育優(yōu)良竹種提高增益,擴(kuò)大竹材產(chǎn)量。
近年來,在制漿造紙技術(shù)方面,國內(nèi)外已有較多新成果、新技術(shù)[3-6]。但是,對(duì)竹種制漿造紙性能篩選技術(shù)和方法方面的研究較少,使得選育優(yōu)良竹種陷入了困境,成為亟待解決的難題。為此,本研究依據(jù)“十二五”國家科技支撐計(jì)劃課題“竹藤種質(zhì)資源基礎(chǔ)數(shù)據(jù)庫構(gòu)建”,以“竹藤種質(zhì)資源數(shù)據(jù)庫”中126個(gè)竹種為基礎(chǔ)數(shù)據(jù),應(yīng)用K均值聚類算法(K-means算法)、小批量K均值聚類算法(Mini Batch K means算法)、凝聚層次聚類算法,依據(jù)竹種酸不溶木質(zhì)素、苯醇提取物、綜纖維素、基本密度、纖維長度、纖維雙壁厚、纖維壁腔比7個(gè)特征對(duì)竹種篩選分級(jí);評(píng)估不同聚類算法的有效性以及不同竹種的造紙適應(yīng)性,選出一批優(yōu)良造紙竹種,旨在為合理利用竹林資源提供參考。
本研究數(shù)據(jù)來源于“十二五”國家科技支撐計(jì)劃課題“竹藤種質(zhì)資源基礎(chǔ)數(shù)據(jù)庫構(gòu)建”項(xiàng)目,由國際竹藤中心提供竹種材性數(shù)據(jù),由安徽農(nóng)業(yè)大學(xué)開發(fā)竹藤種質(zhì)資源數(shù)據(jù)管理平臺(tái)(以下簡稱“管理平臺(tái)”)并構(gòu)建竹藤種質(zhì)資源數(shù)據(jù)庫(以下簡稱“數(shù)據(jù)庫”)。竹種材性數(shù)據(jù)采集地點(diǎn),來自安徽太平、中國科學(xué)院西雙版納熱帶植物園、云南金平、四川都江堰、廣西南寧等地;竹種材性指標(biāo)由國際竹藤中心的專家核定。
管理平臺(tái),目前共錄入43個(gè)竹屬,551個(gè)竹種,由于跨科屬種類別大,竹種間材性差異較大。竹藤專家參照GB/T 15780—1995《竹材物理力學(xué)性質(zhì)實(shí)驗(yàn)方法》標(biāo)準(zhǔn),采用物理化學(xué)等實(shí)驗(yàn)與測(cè)量方法,獲得了大量數(shù)據(jù),這些數(shù)據(jù)是本文建模工作的主要依據(jù)。數(shù)據(jù)庫中,由竹種的化學(xué)性質(zhì)、物理性質(zhì)、纖維形態(tài)的部分材性指標(biāo)的數(shù)據(jù)量統(tǒng)計(jì)(見表1)可見,除了酸溶木質(zhì)素只有54條記錄,其他幾項(xiàng)指標(biāo)數(shù)據(jù)量都在100條以上。木質(zhì)素由酸不溶木質(zhì)素和酸溶木質(zhì)素組成,由于酸溶木質(zhì)素?cái)?shù)據(jù)量過少,本研究采用酸不溶木質(zhì)素替代木質(zhì)素研究不同竹種之間木質(zhì)素的差異性。
表1 竹種部分材性數(shù)據(jù)統(tǒng)計(jì)
材性數(shù)據(jù)分布在數(shù)據(jù)庫中化學(xué)成分、物理性質(zhì)、纖維形態(tài)3個(gè)表中,由于每個(gè)表數(shù)據(jù)量不一致,合并為1個(gè)表后會(huì)產(chǎn)生部分缺失值。為保證數(shù)據(jù)中缺失值盡可能少,本研究將合并后超過3條材性指標(biāo)缺失的竹種刪除,最終保留了126個(gè)竹種。此時(shí),基本密度、纖維雙壁厚、纖維長度、纖維壁腔比分別缺失33、48、8、22個(gè)數(shù)據(jù);酸不溶木質(zhì)素、苯醇提取物、綜纖維素沒有缺失值。竹種數(shù)據(jù)進(jìn)行分析之前,用各指標(biāo)值的中位數(shù)填充各自缺失值,將數(shù)據(jù)補(bǔ)充完整。
根據(jù)竹種的纖維形態(tài)、化學(xué)性質(zhì)、物理性質(zhì)將竹種分類,結(jié)合造紙適應(yīng)性評(píng)價(jià)指標(biāo)選出優(yōu)良造紙竹種。聚類分析法可以根據(jù)多條性質(zhì)的相似性程度對(duì)樣本進(jìn)行分類。最終目的是將相似性大的樣本聚到一個(gè)簇,相似性小的樣本聚到不同的簇。本研究采用了6種聚類算法:K均值聚類算法、小批量K均值聚類算法、利用層次方法的平衡迭代規(guī)約和聚類算法(BIRCH聚類算法)、譜聚類算法、凝聚層次聚類、高斯混合模型聚類算法。
——K均值聚類算法。通過不斷更新聚類中心和分配樣本點(diǎn)的過程,最終將樣本分為幾個(gè)不同的簇,實(shí)現(xiàn)簇內(nèi)樣本點(diǎn)緊湊,簇間樣本點(diǎn)分離[7]。本研究采用K-means++算法初始化聚類中心,以解決傳統(tǒng)K均值聚類算法收斂到局部最優(yōu)的問題。
——小批量K均值聚類算法。是K均值聚類算法的一種改進(jìn)算法,其在分配樣本點(diǎn)給聚類中心時(shí),隨機(jī)抽取少批量的樣本點(diǎn),更新聚類中心,因此聚類速度比K均值聚類算法快,適合大規(guī)模數(shù)據(jù)集的聚類。
——利用層次方法的平衡迭代規(guī)約和聚類算法。是適合大規(guī)模數(shù)據(jù)集的聚類。與小批量K均值聚類算法不同,小批量K均值聚類算法適合于樣本量大、數(shù)據(jù)特征維度高、類別數(shù)小的情況,而利用層次方法的平衡迭代規(guī)約和聚類算法適合于樣本量大、數(shù)據(jù)特征維度低、類別數(shù)大的情況。
——譜聚類。以無向權(quán)重圖的思想聚類數(shù)據(jù)集中的樣本點(diǎn),距離較遠(yuǎn)的兩點(diǎn)之間邊的權(quán)重較低,距離較近的兩點(diǎn)之間邊的權(quán)重較高,通過切圖讓子圖內(nèi)邊的權(quán)重之和盡可能高,不同子圖間邊的權(quán)重之和盡可能低,從而達(dá)到聚類的目的。
——凝聚層次聚類算法。通過不斷迭代循環(huán)地找距離最近的兩個(gè)簇進(jìn)行合并,最終形成一棵聚類樹,簇與簇之間的相似度也在樹的生成過程中得到。該算法可以不用預(yù)先給定聚類個(gè)數(shù),避免了聚類個(gè)數(shù)調(diào)參的問題。
——高斯混合模型聚類。通過高斯模型估計(jì)樣本數(shù)據(jù)的概率密度分布,最后得到樣本數(shù)據(jù)屬于某個(gè)簇的概率,概率最大的簇即為該樣本所屬的簇。
聚類有效性指標(biāo)是用來評(píng)價(jià)聚類算法好壞的一種適應(yīng)性指標(biāo)。本研究在聚類前不知道竹種的分類情況,即數(shù)據(jù)集的分類標(biāo)簽未知,故選用內(nèi)部有效性指標(biāo)評(píng)價(jià)聚類算法的有效性。聚類算法在有效性指標(biāo)達(dá)到最優(yōu)時(shí)取得的聚類個(gè)數(shù)稱為“最佳聚類數(shù)”[8],此時(shí)聚類算法的性能最好。內(nèi)部有效性指標(biāo)由緊湊度、分離度兩個(gè)指標(biāo)構(gòu)成,緊湊度衡量一個(gè)簇中不同樣本之間的距離是否足夠近、分離度衡量不同簇之間的距離是否足夠遠(yuǎn)。本研究重點(diǎn)研究竹種數(shù)據(jù)不同簇之間的分離度,因此采用了僅考量分離度的指標(biāo)(決定系數(shù)(R2))以及綜合考量緊湊度和分離度的指標(biāo)(包括卡林斯其-哈瑞本斯(CH)指標(biāo)、戴維森堡丁指數(shù)(DBI)、輪廓系數(shù))。
——決定系數(shù)。由簇之間距離平方和與所有數(shù)據(jù)距離平方和的比值得到,該指標(biāo)在“肘點(diǎn)”[9]處取得最佳聚類數(shù)。
——卡林斯其-哈瑞本斯指標(biāo)。通過計(jì)算簇中樣本點(diǎn)與簇中心的距離平方和,度量簇內(nèi)的緊湊度;通過計(jì)算子簇中心點(diǎn)與數(shù)據(jù)集中心點(diǎn)距離平方和,度量數(shù)據(jù)集的分離度;通過分離度與緊湊度的比值得到指標(biāo)值,并且在指標(biāo)最大值處取得最佳聚類數(shù)。
——戴維森堡丁指數(shù)。通過計(jì)算一個(gè)簇C與其他簇的相似度,將最大值作為簇C的相似度,最后平均所有簇的相似度即為指標(biāo)值。該指標(biāo)在最小值處取得最佳聚類數(shù)。
——輪廓系數(shù)。計(jì)算方法為S(i)=[b(i)-a(i)]/max{a(i),b(i)},式中的a(i)為樣本i到同簇其他樣本的平均距離、b(i)為樣本i到其他簇的樣本的平均距離。輪廓系數(shù)指標(biāo)最大值對(duì)應(yīng)的聚類數(shù)為最佳聚類數(shù)。
蘇文會(huì)等[10]認(rèn)為,綜纖維素質(zhì)量分?jǐn)?shù)較高而木質(zhì)素質(zhì)量分?jǐn)?shù)較少或中等的造紙材,其纖維得率高、易打漿、化學(xué)藥品消耗少。范友華等[11]在對(duì)湖南益陽毛竹的研究中發(fā)現(xiàn),綜纖維素質(zhì)量分?jǐn)?shù)高于70%、酸不溶木質(zhì)素質(zhì)量分?jǐn)?shù)低于26%的竹種,適合做造紙優(yōu)良竹材。趙燕等[12]認(rèn)為,苯醇提取物質(zhì)量分?jǐn)?shù)過多,在制漿時(shí)會(huì)增加化學(xué)藥品的消耗。杜復(fù)元等[13]認(rèn)為,基本密度是影響紙漿得率的重要因素,一般認(rèn)為基本密度介于0.4~0.6 g/cm3之間的竹種適合做優(yōu)良造紙?jiān)?。馬靈飛等[14]認(rèn)為,細(xì)長的纖維能增加紙張的耐折度、耐破度、撕裂度。國際木材解剖協(xié)會(huì)將纖維按長度大于1.6 mm的纖維稱為長纖維[15]。王菊華[16]認(rèn)為,纖維壁薄且壁腔比小的原料,纖維結(jié)合強(qiáng)度高,抄制的紙張結(jié)合強(qiáng)度大,可壓扁性好,通常認(rèn)為壁腔比小于1的纖維適合造紙;而陳富樞[17]在實(shí)驗(yàn)中表明,竹種纖維壁腔比小于2.24,同樣可以用作紙漿造紙。參考上述文獻(xiàn),本研究設(shè)計(jì)了竹種造紙的適應(yīng)性評(píng)價(jià)指標(biāo)(見表2)。本研究選定的126個(gè)竹種的苯醇提取物均值是3.669%,故將苯醇提取物質(zhì)量分?jǐn)?shù)低于等于3.669%的竹種視為適合造紙的優(yōu)良竹種,高于3.669%的竹種視為不適合造紙的劣等竹種。
綜合上述分析,本研究選用數(shù)據(jù)庫中126個(gè)竹種,每個(gè)竹種包含酸不溶木質(zhì)素、苯醇提取物、綜纖維素、基本密度、纖維長度、纖維雙壁厚、纖維壁腔比7個(gè)特征,進(jìn)行聚類分析,結(jié)合表2,篩選出優(yōu)良造紙竹種。
表2 造紙適應(yīng)性評(píng)價(jià)指標(biāo)值
對(duì)竹種數(shù)據(jù)進(jìn)行缺失數(shù)據(jù)填補(bǔ)、異常數(shù)據(jù)處理等數(shù)據(jù)整理后,選定聚類個(gè)數(shù)在2~7之間,分別進(jìn)行K均值聚類、小批量K均值聚類、利用層次方法的平衡迭代規(guī)約和聚類算法、譜聚類、凝聚層次聚類、高斯混合模型聚類,每個(gè)算法通過決定系數(shù)、卡林斯其-哈瑞本斯指標(biāo)、戴維森堡丁指數(shù)、輪廓系數(shù)有效性指標(biāo)評(píng)價(jià)聚類效果(見圖1)。
由圖1(a)可見:K均值聚類算法、小批量K均值聚類算法、利用層次方法的平衡迭代規(guī)約和聚類算法、凝聚層次聚類算法在聚類個(gè)數(shù)為6時(shí),決定系數(shù)指標(biāo)取得“肘點(diǎn)”,即竹種數(shù)據(jù)聚為6類時(shí)4個(gè)算法的聚類有效性最大,此時(shí)最佳聚類數(shù)為6。綜合圖1中4個(gè)子圖可見:小批量K均值聚類算法在聚類個(gè)數(shù)為6時(shí),決定系數(shù)指標(biāo)取得“肘點(diǎn)”、卡林斯其-哈瑞本斯指標(biāo)取得最大值、戴維森堡丁指數(shù)取得最小值、輪廓系數(shù)取得最大值,4個(gè)有效性指標(biāo)均達(dá)到最優(yōu),表明小批量K均值聚類算法依據(jù)4個(gè)聚類有效性指標(biāo)的最佳聚類數(shù)均為6。在圖1(b)中,K均值聚類算法、小批量K均值聚類算法、凝聚層次聚類算法、利用層次方法的平衡迭代規(guī)約和聚類算法在聚類個(gè)數(shù)為6時(shí),指標(biāo)達(dá)到最大值,且K均值聚類算法的卡林斯其-哈瑞本斯指標(biāo)值最高,達(dá)到63.568,聚類有效性最好。而K均值聚類算法、小批量K均值聚類算法、凝聚層次聚類算法的卡林斯其-哈瑞本斯指標(biāo)值很相近,遠(yuǎn)高于譜聚類算法、高斯混合模型算法。
因此,本研究主要討論K均值聚類算法、小批量K均值聚類算法、凝聚層次聚類算法對(duì)竹種數(shù)據(jù)的聚類分析。上述3種聚類算法依據(jù)4個(gè)聚類有效性指標(biāo)得到的最佳聚類數(shù)見表3。
表3 3種聚類算法依據(jù)4個(gè)有效性指標(biāo)得到的最佳聚類數(shù)
將K均值聚類算法、小批量K均值聚類算法、凝聚層次聚類算法分別應(yīng)用到竹種數(shù)據(jù)進(jìn)行聚類分析,得到聚類結(jié)果。由表4可見:3種聚類算法得到的竹種聚類情況大致相似,大多數(shù)竹種在3個(gè)聚類算法的分析中被聚為同一類,如甜筍竹、金絲毛竹、黃槽毛竹等11個(gè)竹種始終屬于同一類,糯竹、空竹、泰竹等51個(gè)竹種屬于一類,油簕竹、酸竹等19個(gè)竹種屬于一類,斑竹自成一類,泡竹、茶竿竹、版納甜龍竹屬于一類,毛竹、思勞竹等28個(gè)竹種屬于一類。說明這些竹種間的纖維形態(tài)、理化性質(zhì)具有很多相似之處。
表4 3種聚類算法的聚類結(jié)果
續(xù)(表4)
A1為K均值聚類算法、A2為小批量K均值聚類算法、A3為利用層次方法的平衡迭代規(guī)約和聚類算法、A4為譜聚類算法、A5為高斯混合模型算法、A6為凝聚層次聚類算法。
竹種數(shù)據(jù)經(jīng)過3種聚類算法分析后均聚為6類。為使竹種紙漿造紙適應(yīng)性評(píng)價(jià)較為客觀,以各類材性指標(biāo)的平均值為依據(jù),綜合判定各類竹種的造紙適應(yīng)性等級(jí)(見表5)。
表5 3種聚類方法聚類后各類指標(biāo)的均值
由表5可見:K均值算法聚類結(jié)果中,第4類只有1個(gè)竹種(是斑竹),綜纖維素質(zhì)量分?jǐn)?shù)為18.13%,遠(yuǎn)低于竹種造紙纖維標(biāo)準(zhǔn)70%。第5類有3個(gè)竹種(是泡竹、茶竿竹、版納甜龍竹),纖維雙壁厚均值為32.17 μm,纖維壁腔比均值為4.76,纖維壁腔比值遠(yuǎn)高于2.24。故認(rèn)為第4類的竹種、第5類的竹種不適合造紙,在造紙適應(yīng)性判定里不考慮這兩類竹種。
結(jié)合表2中竹種造紙適應(yīng)性評(píng)價(jià)指標(biāo),判定K均值算法聚類結(jié)果的第1、2、3、6類竹種的造紙適應(yīng)性。然后分別進(jìn)行統(tǒng)計(jì),6類材性指標(biāo)均達(dá)到設(shè)定值或者有5類達(dá)標(biāo)且纖維細(xì)長的視為Ⅰ級(jí)造紙竹種,有4類或3類達(dá)標(biāo)的視為Ⅱ級(jí)造紙竹種,只有2類或1類達(dá)標(biāo)的視為Ⅲ級(jí)造紙竹種(見表6)。同理可得出,應(yīng)用小批量K均值聚類算法、凝聚層次聚類2種算法的竹種造紙適用性的評(píng)定情況(見表6)。
表6 3種聚類方法的竹種造紙適應(yīng)性評(píng)定結(jié)果
由表6可見:K均值聚類算法評(píng)為Ⅰ級(jí)的造紙竹種為第2類(糯竹、空竹等),小批量K均值聚類算法評(píng)為Ⅰ級(jí)的為第1類(毛竹、思勞竹等)、第5類(糯竹、空竹等),凝聚層次聚類評(píng)為Ⅰ級(jí)的為第2類(油簕竹、酸竹等)、第5類(糯竹、空竹等)。K均值聚類算法評(píng)為Ⅱ級(jí)的為第3類(油簕竹、酸竹等)、第6類(毛竹、思勞竹等),小批量K均值聚類算法評(píng)為Ⅱ級(jí)的為第3類(油簕竹、酸竹等),凝聚層次聚類評(píng)為Ⅱ級(jí)的為第3類(毛竹、思勞竹等)。K均值聚類算法、小批量K均值聚類算法、凝聚層次聚類評(píng)為Ⅲ級(jí)的均為甜筍竹、金絲毛竹等。由于纖維雙壁厚沒有確切的劃分范圍,且一般纖維壁腔比小的竹種纖維雙壁厚小,故表6中不含纖維雙壁厚指標(biāo)的評(píng)定。
雖然3種算法的聚類結(jié)果不完全一致,但是大部分竹種的分類情況是一致的。綜合竹種的造紙適應(yīng)性評(píng)定,3種算法均將糯竹、空竹等51個(gè)竹種評(píng)為Ⅰ級(jí)造紙竹,而甜筍竹、金絲毛竹等11個(gè)竹種為Ⅲ級(jí)造紙竹。云南甜龍竹、短穗竹,在K均值聚類算法、小批量K均值聚類算法聚類時(shí)評(píng)為Ⅲ級(jí),在凝聚層次聚類時(shí)評(píng)為Ⅱ級(jí),故本研究將這2個(gè)竹種劃分為Ⅲ級(jí)造紙竹。其余62個(gè)竹種,依據(jù)3種聚類算法評(píng)為Ⅱ級(jí)造紙竹2次、Ⅰ級(jí)造紙竹1次,故本研究將這些竹種劃分為Ⅱ級(jí)造紙竹。為此,本研究給出造紙竹種的綜合評(píng)定結(jié)果(見表7)。
表7 造紙竹種的綜合評(píng)定結(jié)果
由竹種造紙適應(yīng)性的評(píng)定可知,應(yīng)用K均值聚類算法評(píng)定的,Ⅰ級(jí)造紙竹種的6個(gè)材性指標(biāo)均達(dá)到設(shè)定值、Ⅱ級(jí)造紙竹種達(dá)標(biāo)了4個(gè)、Ⅲ級(jí)造紙竹種僅達(dá)標(biāo)1個(gè)。應(yīng)用小批量K均值聚類算法評(píng)定的,Ⅰ級(jí)造紙竹種達(dá)標(biāo)5個(gè)、Ⅱ級(jí)造紙竹種達(dá)標(biāo)了4個(gè)、Ⅲ級(jí)造紙竹種達(dá)標(biāo)1個(gè)。應(yīng)用凝聚層次聚類算法評(píng)定的,Ⅰ級(jí)造紙竹種達(dá)標(biāo)5個(gè)或6個(gè)、Ⅱ級(jí)造紙竹種達(dá)標(biāo)了3個(gè)、Ⅲ級(jí)造紙竹種達(dá)標(biāo)2個(gè)。
可以看到,小批量K均值聚類算法的Ⅰ級(jí)造紙竹種存在苯醇提取物略高、基本密度略低2個(gè)缺陷,包含部分化學(xué)處理困難、得漿率低的竹種。凝聚層次聚類算法同樣是在Ⅰ級(jí)造紙竹種的選擇上有不足,其第2類和第5類均評(píng)為Ⅰ級(jí),而第2類綜纖維素略低,包含部分纖維得率低、不易打漿的竹種。K均值聚類算法分級(jí)最清晰,其Ⅰ級(jí)造紙竹種明顯比Ⅱ級(jí)竹種造紙適應(yīng)性高,Ⅲ級(jí)竹種明顯不適合造紙。上述分析表明,K均值聚類算法聚類效果最好,達(dá)到了類內(nèi)相似度大、類間差異性大的目的。這與前面表述的“K均值聚類算法的卡林斯其-哈瑞本斯指標(biāo)得分最高,算法有效性最高”的結(jié)果一致。
由張喜[18]對(duì)貴州竹種的纖維形態(tài)和造紙性能的研究表明,苦竹、慈竹、吊絲單、早園竹都是優(yōu)良的造紙竹種,這4個(gè)竹種均在本研究的Ⅰ級(jí)造紙竹種中。陳其兵等[19]通過實(shí)驗(yàn)分析認(rèn)為,麻竹、綠竹、綿竹、料慈竹是優(yōu)良造紙竹種,同樣存在于本研究的Ⅰ級(jí)造紙竹種中。劉曉波等[20]研究的適合做造紙竹種的巨龍竹,在本研究的Ⅱ級(jí)造紙竹種可以找到。趙燕等[12]認(rèn)為,撐綠竹適合紙漿造紙,其在本研究的Ⅱ級(jí)造紙竹種可以找到。蘇文會(huì)等[10]研究的造紙竹種大木竹,在本研究的Ⅱ級(jí)造紙竹種可以找到。上述分析表明,本研究采用K均值聚類算法對(duì)竹種的造紙適應(yīng)性評(píng)價(jià)與多數(shù)學(xué)者的研究相吻合,說明K均值聚類算法對(duì)探索未知造紙性能的竹種是一個(gè)切實(shí)可行的方法。通過酸不溶木質(zhì)素、苯醇提取物、綜纖維素、基本密度、纖維長度、纖維雙壁厚、纖維壁腔比7個(gè)造紙適應(yīng)性評(píng)價(jià)指標(biāo),選出了較為可靠的優(yōu)良造紙竹種,表明竹種這7個(gè)指標(biāo)是評(píng)價(jià)其造紙?zhí)匦缘年P(guān)鍵因素。
本研究重點(diǎn)研究了K均值聚類算法、小批量K均值聚類算法、凝聚層次聚類算法對(duì)竹種數(shù)據(jù)聚類的有效性,結(jié)合不同竹種纖維形態(tài)、化學(xué)性質(zhì)、物理性質(zhì)適用于造紙的指標(biāo),對(duì)竹種用于紙漿造紙的適應(yīng)性分級(jí),選出優(yōu)良造紙竹種。最后將126個(gè)竹種評(píng)定出Ⅰ級(jí)、Ⅱ級(jí)、Ⅲ級(jí),Ⅰ級(jí)竹種的造紙性能最好、Ⅱ級(jí)竹種的造紙性能次之、Ⅲ級(jí)竹種的造紙性能最差不適合做造紙纖維原料。
根據(jù)本研究,造紙工業(yè)可以優(yōu)先發(fā)展Ⅰ級(jí)竹種作為制漿造紙?jiān)?,其具有酸不溶木質(zhì)素含量低、綜纖維素含量高、苯醇提取物含量低、基本密度適中、纖維長度長、纖維壁腔比小的特點(diǎn),適合制造高撕裂度、高耐破度、高耐折度的優(yōu)質(zhì)紙張。Ⅱ級(jí)竹種的苯醇提取物和纖維壁腔比略高,可以在具備良好排污能力的造紙廠作為備用造紙?jiān)?。Ⅲ?jí)竹種的苯醇提取物高、酸不溶木質(zhì)素高、基本密度大、纖維長度小、纖維壁厚度大,不適合造紙。