(楊鵬,副教授,東南大學(xué)未來網(wǎng)絡(luò)研究中心副主任)
2017年12月29日,由全國中文新聞信息標(biāo)準(zhǔn)化技術(shù)委員會牽頭制定的中華人民共和國國家標(biāo)準(zhǔn)《統(tǒng)一內(nèi)容標(biāo)簽格式規(guī)范》,經(jīng)國家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局、國家標(biāo)準(zhǔn)化管理委員會正式批準(zhǔn)頒布,標(biāo)準(zhǔn)編號GB/T 35304-2017。該標(biāo)準(zhǔn)的主要起草單位包括東南大學(xué)、新華通訊社、國家新聞出版廣電總局、清華大學(xué)、大有數(shù)字資源有限公司和北京大學(xué)。統(tǒng)一內(nèi)容標(biāo)簽(Uniform Content Label,簡稱UCL)是我國科學(xué)家原創(chuàng)的內(nèi)容元數(shù)據(jù),國家標(biāo)準(zhǔn)《統(tǒng)一內(nèi)容標(biāo)簽格式規(guī)范》的正式頒布,為統(tǒng)一內(nèi)容標(biāo)簽技術(shù)的推廣、普及和應(yīng)用,以及內(nèi)容大數(shù)據(jù)的規(guī)范標(biāo)引、高效共享與依法治理等,提供了關(guān)鍵的標(biāo)準(zhǔn)支持。
在2000年左右,中國工程院李幼平院士在深入研究互聯(lián)網(wǎng)信息共享方式及其缺陷的基礎(chǔ)上,提出了統(tǒng)一內(nèi)容標(biāo)簽UCL的概念。關(guān)于UCL的最初研究成果主要發(fā)表在《中國工程科學(xué)》和《電視技術(shù)》等雜志上。2002年,《中國傳媒科技》陸續(xù)發(fā)表了李幼平院士和新華通訊社孫寶傳同志關(guān)于后萬維網(wǎng)時代和第五媒體“猜想”的對話,對UCL及新型信息共享網(wǎng)絡(luò)進(jìn)行了早期較為系統(tǒng)的闡述。自統(tǒng)一內(nèi)容標(biāo)簽UCL概念提出以來,經(jīng)過李幼平院士與多位科學(xué)家、領(lǐng)域?qū)<液脱芯咳藛T等的多年研究和應(yīng)用實(shí)踐,它的內(nèi)涵和外延得到不斷豐富和完善。
統(tǒng)一內(nèi)容標(biāo)簽主要在統(tǒng)一資源定位符URL(Uniform Resource Locator)的基礎(chǔ)上發(fā)展而來。URL是互聯(lián)網(wǎng)的基礎(chǔ),互聯(lián)網(wǎng)中的各種信息資源都是按照URL地址符(“Locator”)進(jìn)行組織。URL的提出及標(biāo)準(zhǔn)化極大推動了互聯(lián)網(wǎng)的發(fā)展,但是URL通常只能表示信息資源的位置,無法描述信息資源的豐富語義,由此帶來互聯(lián)網(wǎng)信息資源難找、難管、失序等弊端。具體而言,互聯(lián)網(wǎng)的主要弊端表現(xiàn)為:有用信息不易尋找,個性需求無法滿足;網(wǎng)上內(nèi)容難以有效治理,良莠不齊垃圾泛濫;網(wǎng)絡(luò)導(dǎo)讀嚴(yán)重缺失,輿論導(dǎo)向難以落實(shí)等。盡管Tim Berners-Lee提出了語義網(wǎng)(Semantic Web)概念,試圖使Web變成能夠自動理解詞語和概念、以及它們之間邏輯關(guān)系的智能網(wǎng)絡(luò),但是語義網(wǎng)實(shí)現(xiàn)起來非常困難。統(tǒng)一內(nèi)容標(biāo)簽從互聯(lián)網(wǎng)中內(nèi)容資源難找、難管和失序等問題的根本癥結(jié)入手,兼顧了內(nèi)容共享應(yīng)用中的三個重要角色(讀者、作者和管理者),能夠有效彌補(bǔ)統(tǒng)一資源定位符URL的語義缺失和管理缺失。
關(guān)于統(tǒng)一內(nèi)容標(biāo)簽的研究,與我國近年來若干重大戰(zhàn)略需求緊密相關(guān)?;ヂ?lián)網(wǎng)已經(jīng)成為網(wǎng)絡(luò)空間的主要載體,與此同時,互聯(lián)網(wǎng)的缺陷和不足日益顯露。我國政府發(fā)出“用好互聯(lián)網(wǎng),管好互聯(lián)網(wǎng)”的號召,提倡采用“三網(wǎng)融合”營造國家公共文化服務(wù)體系。2013年11月,全面深化改革若干重大問題的決定,指出要“促進(jìn)基本公共文化服務(wù)標(biāo)準(zhǔn)化、均等化”,在此基礎(chǔ)上“構(gòu)建現(xiàn)代公共文化服務(wù)體系”;同時,要“確保國家網(wǎng)絡(luò)和信息安全”。2014年2月,中央網(wǎng)絡(luò)安全和信息化領(lǐng)導(dǎo)小組第一次會議指出,沒有網(wǎng)絡(luò)安全就沒有國家安全,沒有信息化就沒有現(xiàn)代化,網(wǎng)絡(luò)安全和信息化是一體之兩翼、驅(qū)動之雙輪,我們要從網(wǎng)絡(luò)大國建設(shè)成為網(wǎng)絡(luò)強(qiáng)國。2015年12月,第二屆世界互聯(lián)網(wǎng)大會指出,依法開展網(wǎng)絡(luò)空間治理,網(wǎng)絡(luò)空間日漸清朗,國際社會應(yīng)該加強(qiáng)對話合作,推動互聯(lián)網(wǎng)全球治理體系變革,構(gòu)建網(wǎng)絡(luò)空間命運(yùn)共同體。2016年4月,網(wǎng)絡(luò)安全和信息化工作座談會指出,網(wǎng)絡(luò)空間是億萬民眾共同的精神家園,網(wǎng)絡(luò)空間天朗氣清、生態(tài)良好,符合人民利益,網(wǎng)絡(luò)空間不是“法外之地”,要依法加強(qiáng)網(wǎng)絡(luò)空間治理。統(tǒng)一內(nèi)容標(biāo)簽充分考慮這些戰(zhàn)略需求,采取內(nèi)容驅(qū)動的先進(jìn)理念對內(nèi)容標(biāo)識進(jìn)行了全新設(shè)計,形成生產(chǎn)、消費(fèi)和管理三位一體的內(nèi)容大數(shù)據(jù)創(chuàng)新標(biāo)識體系,使之成為網(wǎng)絡(luò)空間新的內(nèi)容基元。
此外,統(tǒng)一內(nèi)容標(biāo)簽的研究也與媒體領(lǐng)域的最新發(fā)展趨勢緊密關(guān)聯(lián)。2015年6月,蘋果公司在Apple全球開發(fā)者大會上推出Apple News,它可以為iOS用戶提供新聞內(nèi)容定制服務(wù),熱門網(wǎng)站和報紙的內(nèi)容都可以按用戶需求出現(xiàn)在Apple News中;Facebook也在同時期推出了交互式媒體內(nèi)容創(chuàng)建和發(fā)布工具Instant Articles。2015年10月,國際著名媒體紐約時報(New York Times)為了應(yīng)對蘋果公司和Facebook等進(jìn)軍傳媒業(yè)的挑戰(zhàn),提出研制“新聞編碼”(Particles Code),通過可檢索的“新聞編碼”來實(shí)現(xiàn)累積性新聞(accumulative news),把新聞報道按照時間軸和知識點(diǎn)進(jìn)行組織。我國政府高度重視互聯(lián)網(wǎng)時代媒體融合與轉(zhuǎn)型的新趨勢,中央《關(guān)于推動傳統(tǒng)媒體和新興媒體融合發(fā)展的指導(dǎo)意見》明確提出,堅持傳統(tǒng)媒體和新興媒體優(yōu)勢互補(bǔ)、一體發(fā)展,推動傳統(tǒng)媒體和新興媒體在內(nèi)容、渠道、平臺、經(jīng)營、管理等方面的深度融合。統(tǒng)一內(nèi)容標(biāo)簽順應(yīng)傳統(tǒng)媒體、新興媒體、以及互聯(lián)網(wǎng)等領(lǐng)域的發(fā)展趨勢,按照媒體融合發(fā)展要求著力支持內(nèi)容信息的聚合、傳播、管理和個性化服務(wù)等,注重提高海量內(nèi)容的匯聚和分析能力,建立“內(nèi)容自尋網(wǎng)民”的主動服務(wù)機(jī)制。
東南大學(xué)李幼平院士團(tuán)隊關(guān)于統(tǒng)一內(nèi)容標(biāo)簽的研究工作,受到全國中文新聞信息標(biāo)準(zhǔn)化技術(shù)委員會的高度重視,從2013年開始推動統(tǒng)一內(nèi)容標(biāo)簽的標(biāo)準(zhǔn)化工作。在此過程中,國家若干重要戰(zhàn)略需求和媒體領(lǐng)域最新發(fā)展趨勢得到充分重視,并通過不斷發(fā)展和完善,體現(xiàn)在剛剛頒布的統(tǒng)一內(nèi)容標(biāo)簽國家標(biāo)準(zhǔn)中。
考慮到統(tǒng)一內(nèi)容標(biāo)簽自2000年以來已經(jīng)過十余年研究和發(fā)展,其核心思想和主體結(jié)構(gòu)已趨成熟,李幼平院士從2013年初開始籌劃統(tǒng)一內(nèi)容標(biāo)簽的標(biāo)準(zhǔn)化工作,并帶領(lǐng)東南大學(xué)未來網(wǎng)絡(luò)研究中心團(tuán)隊進(jìn)行了大量準(zhǔn)備工作。2013年11月,在全國中文新聞信息標(biāo)準(zhǔn)化技術(shù)委員會第二次主任辦公會上,明確提出“籌建‘統(tǒng)一內(nèi)容標(biāo)簽標(biāo)準(zhǔn)工作組’,加快統(tǒng)一內(nèi)容標(biāo)簽技術(shù)標(biāo)準(zhǔn)的制定”的要求。2014年2月,新標(biāo)委秘書處邀請李幼平院士擔(dān)任工作組顧問,正式成立“統(tǒng)一內(nèi)容標(biāo)簽標(biāo)準(zhǔn)工作組”,致力于統(tǒng)一內(nèi)容標(biāo)簽技術(shù)標(biāo)準(zhǔn)的制定和推廣工作。工作組主要由東南大學(xué)、新華通訊社、國家新聞出版廣電總局、清華大學(xué)、大有數(shù)字資源有限公司和北京大學(xué)等機(jī)構(gòu)的專家學(xué)者組成。
統(tǒng)一內(nèi)容標(biāo)簽標(biāo)準(zhǔn)工作組自成立后,迅速開始著手研制統(tǒng)一內(nèi)容標(biāo)簽的核心標(biāo)準(zhǔn)《統(tǒng)一內(nèi)容標(biāo)簽(UCL)格式規(guī)范》。2014年3月,統(tǒng)一內(nèi)容標(biāo)簽標(biāo)準(zhǔn)工作組召開第一次會議,討論和審議了工作組關(guān)于統(tǒng)一內(nèi)容標(biāo)簽(UCL)研究進(jìn)展及標(biāo)準(zhǔn)研制工作的報告,圍繞統(tǒng)一內(nèi)容標(biāo)簽中代碼部分和屬性部分的格式展開討論,并達(dá)成一致。在此基礎(chǔ)上,工作組整理匯總了前期UCL技術(shù)的主要研究成果,組織召開了多次討論會,并對國內(nèi)外相關(guān)技術(shù)標(biāo)準(zhǔn)進(jìn)行深入研究,在充分吸收各方意見建議后,由多名起草專家協(xié)同工作、聯(lián)合攻關(guān),于2014年5月初完成《統(tǒng)一內(nèi)容標(biāo)簽(UCL)格式規(guī)范(征求意見稿)》的起草工作。隨后又進(jìn)行了廣泛的意見征求,經(jīng)修改完善后形成標(biāo)準(zhǔn)送審稿,于2014年8月順利通過標(biāo)準(zhǔn)審查會的審查,并于2015年1月正式發(fā)布成為新華社技術(shù)標(biāo)準(zhǔn)。
以新華社技術(shù)標(biāo)準(zhǔn)《統(tǒng)一內(nèi)容標(biāo)簽(UCL)格式規(guī)范》為基礎(chǔ),2015年3月新標(biāo)委秘書處上報國家標(biāo)準(zhǔn)化管理委員會申請國家標(biāo)準(zhǔn)立項(xiàng),國家標(biāo)準(zhǔn)化管理委員會在2015年7月正式批準(zhǔn)UCL國家標(biāo)準(zhǔn)立項(xiàng)。其后的兩年多時間,工作組圍繞統(tǒng)一內(nèi)容標(biāo)簽國家標(biāo)準(zhǔn)編制工作,多次召開工作組會議和院士專家咨詢研討會,不斷吸納媒體融合發(fā)展、網(wǎng)絡(luò)空間安全、互聯(lián)網(wǎng)內(nèi)容治理等新的需求,從UCL描述完備性和結(jié)構(gòu)靈活性方面對標(biāo)準(zhǔn)文本進(jìn)行了創(chuàng)新性修改和完善,先后完成了統(tǒng)一內(nèi)容標(biāo)簽推薦性國家標(biāo)準(zhǔn)復(fù)審、國家標(biāo)準(zhǔn)《統(tǒng)一內(nèi)容標(biāo)簽格式規(guī)范》征求意見稿、送審稿和報批稿,在2017年5月報送國家標(biāo)準(zhǔn)化管理委員。2017年12月29日,經(jīng)國家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局、國家標(biāo)準(zhǔn)化管理委員會批準(zhǔn),《統(tǒng)一內(nèi)容標(biāo)簽格式規(guī)范》正式頒布成為中華人民共和國國家標(biāo)準(zhǔn),標(biāo)準(zhǔn)編號為GB/T 35304-2017,標(biāo)準(zhǔn)正式實(shí)施時間為2018年4月1日。
國家標(biāo)準(zhǔn)《統(tǒng)一內(nèi)容標(biāo)簽格式規(guī)范》按照科學(xué)、完善的方法定義了UCL數(shù)據(jù)包的基本格式,包括各個域的名稱、含義及定義規(guī)則等。UCL數(shù)據(jù)包主要分成前后兩個部分,分別為UCL代碼(UCL Code)部分和UCL屬性(UCL Properties)部分。UCL代碼部分儲存與內(nèi)容相關(guān)的代碼信息,用于面向讀者的快速導(dǎo)航,主要的域包括版本、媒體類型、優(yōu)先級與策略、內(nèi)容來源、一級類別、二級類別、話題、內(nèi)容版權(quán)與類型、安全能級碼、語種、時間戳、順序號等,標(biāo)準(zhǔn)規(guī)約了各個域的定義、位置、長度、取值、數(shù)據(jù)類型等格式信息。UCL屬性部分儲存與內(nèi)容相關(guān)的語義信息和管理信息等,主要的域包括UCL屬性總頭部、內(nèi)容標(biāo)題、內(nèi)容關(guān)鍵詞、內(nèi)容摘要、內(nèi)容作者、內(nèi)容實(shí)體、傳播路徑、內(nèi)容數(shù)字簽名、內(nèi)容責(zé)任鏈、UCL包數(shù)字簽名等,標(biāo)準(zhǔn)規(guī)約了各個域的定義、屬性類別、屬性長度、屬性凈荷、凈荷數(shù)據(jù)類型等格式信息。
國家標(biāo)準(zhǔn)《統(tǒng)一內(nèi)容標(biāo)簽格式規(guī)范》瞄準(zhǔn)我國未來信息共享網(wǎng)絡(luò)的發(fā)展目標(biāo),聚焦互聯(lián)網(wǎng)中內(nèi)容難找、難管和失序等棘手問題,以互聯(lián)網(wǎng)思維和大數(shù)據(jù)思維為指導(dǎo),為整合富類型、多渠道、寬領(lǐng)域的國家信息資源提供標(biāo)準(zhǔn)支持,成為富有中國特色的原創(chuàng)性內(nèi)容大數(shù)據(jù)創(chuàng)新標(biāo)識體系。大數(shù)據(jù)趨勢與互聯(lián)網(wǎng)飛速發(fā)展下的媒體變革,已經(jīng)促使互聯(lián)網(wǎng)演變?yōu)椤安┐缶睢眱?nèi)容大數(shù)據(jù)的集散地,實(shí)現(xiàn)全民科學(xué)享用內(nèi)容大數(shù)據(jù),必然面臨三個挑戰(zhàn):內(nèi)容共享如何普惠全民,內(nèi)容服務(wù)如何安全可信,國家如何對內(nèi)容依法治理。統(tǒng)一內(nèi)容標(biāo)簽國家標(biāo)準(zhǔn)是應(yīng)對這些挑戰(zhàn)的利器,它可以提高內(nèi)容大數(shù)據(jù)的聚合和分析能力,提升內(nèi)容的傳播力和影響力,建立“以內(nèi)容為中心”的普惠全民引導(dǎo)機(jī)制,為實(shí)現(xiàn)“加快構(gòu)建輿論引導(dǎo)新格局”做出貢獻(xiàn)。
國家標(biāo)準(zhǔn)《統(tǒng)一內(nèi)容標(biāo)簽格式規(guī)范》聚焦和服務(wù)于我國現(xiàn)代公共文化服務(wù)體系、網(wǎng)絡(luò)空間安全與媒體融合發(fā)展等重大戰(zhàn)略需求,填補(bǔ)了我國傳媒科技領(lǐng)域和原創(chuàng)性內(nèi)容元數(shù)據(jù)標(biāo)準(zhǔn)方面的重大空白。統(tǒng)一內(nèi)容標(biāo)簽國家標(biāo)準(zhǔn)適用于對傳媒、互聯(lián)網(wǎng)及相關(guān)行業(yè)中主要面向群體受眾的內(nèi)容資源進(jìn)行標(biāo)引,其應(yīng)用范圍不僅包括新聞網(wǎng)站、信息門戶、通訊社、廣播、電視、報刊、網(wǎng)絡(luò)媒體等新聞媒體,也包括應(yīng)急廣播、內(nèi)容聚合、輿情分析、版權(quán)保護(hù)等其他應(yīng)用,并且已經(jīng)在相關(guān)領(lǐng)域得到實(shí)際應(yīng)用。與現(xiàn)有的各種內(nèi)容元數(shù)據(jù)標(biāo)準(zhǔn)和內(nèi)容標(biāo)識技術(shù)方案相比,統(tǒng)一內(nèi)容標(biāo)簽具有理念先進(jìn)、簡潔高效、結(jié)構(gòu)靈活等特點(diǎn),可以從多個維度描述內(nèi)容資源的語用、語義和管理信息,允許按照應(yīng)用需求進(jìn)行裁剪和自由擴(kuò)展,能夠有效支持內(nèi)容大數(shù)據(jù)的高效聚合與泛在分發(fā)、個性化主動服務(wù)、語義分析與知識萃取、認(rèn)證注冊物證鏈管理、追蹤溯源與依法追責(zé)等,尤其在內(nèi)容依法治理與網(wǎng)絡(luò)空間安全等方面具有顯著優(yōu)勢。