王雅 杜濤 賈鑫
摘要:大數(shù)據(jù)技術(shù)作為人工智能的核心要素,受到各領(lǐng)域越來越多專家學(xué)者的重點關(guān)注。利用Baiten專利檢索數(shù)據(jù)庫和INNOJOY專利搜索引擎針對國內(nèi)及國際大數(shù)據(jù)技術(shù)專利進(jìn)行信息檢索,通過對中國及世界主要國家的專利數(shù)據(jù)進(jìn)行統(tǒng)計,分析大數(shù)據(jù)技術(shù)領(lǐng)域的專利研究現(xiàn)狀,預(yù)測大數(shù)據(jù)技術(shù)未來專利競爭態(tài)勢,就中國企業(yè)大數(shù)據(jù)發(fā)展戰(zhàn)略提出應(yīng)對策略。
關(guān)鍵詞:大數(shù)據(jù),信息檢索,專利分析
中圖分類號:G350?文獻(xiàn)標(biāo)志碼:A?文章編號:2095-5383(2020)01-0069-04
Abstract:Big data technology as a key factor of artificial intelligence is becoming increasingly focused by the experts and scholars in different fields.?Using the Chinese patent database of BaiTen web and the world patent search engine of INNOJOY,the patent competition situation of big data technology in China and some other countries in the world was discussed in this paper,and the patent-related statistics in the field of big data technology was analyzed,and the conclusions about the big data technology status and its future development were drawn,and finally the countermeasures on the development strategy of big data technology for Chinese enterpriseswere given.
Keywords:big data,information retrieval,patent analysis
大數(shù)據(jù)是指利用常規(guī)軟件工具無法在一定時間跨度內(nèi)進(jìn)行捕獲、管理以及處理的數(shù)據(jù)集合,是需要新的處理模式以獲得更強的決策力、洞察力及流程優(yōu)化能力的海量、多樣化和高增長率的信息資產(chǎn)[1]。
Viktor Meyer-Schnberg在其著作《Big data:A revolution that will transform how we live,work,and think》[2]中指出,與采用隨機分析法只針對抽樣數(shù)據(jù)不同,大數(shù)據(jù)是對全量數(shù)據(jù)進(jìn)行的分析處理。IBM公司歸納出大數(shù)據(jù)所具有的5V特點,分別是Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)和Veracity(真實性)。
早在2008年《Nature》就推出了“Big Data”??痆3]。2011年2月《Science》推出了“Dealing With Data”??痆4],由此說明學(xué)術(shù)界率先展開對大數(shù)據(jù)技術(shù)的科學(xué)研究。2011年6月,McKinsey公司發(fā)布了 《Big data:The next frontier for innovation,competition,and productivity》報告[5],針對大數(shù)據(jù)的關(guān)鍵技術(shù)、應(yīng)用領(lǐng)域及潛在影響等方面進(jìn)行了詳盡分析。自2012年以來,社會各界對大數(shù)據(jù)的關(guān)注與日俱增。
目前,大數(shù)據(jù)技術(shù)已經(jīng)得到各領(lǐng)域越來越多專家學(xué)者的重視。孟小峰等[6]剖析了大數(shù)據(jù)的演變歷程,闡釋了大數(shù)據(jù)技術(shù)的基本框架,并對大數(shù)據(jù)在集成、分析、軟硬件協(xié)同、易用性、測試基準(zhǔn)等方面提出見解。程學(xué)旗等 [7]闡述了國內(nèi)外大數(shù)據(jù)政策動態(tài)及中國大數(shù)據(jù)產(chǎn)業(yè)界發(fā)展態(tài)勢,并提出了多學(xué)科融合、大數(shù)據(jù)可視化、深度分析等發(fā)展趨勢。此外,劉煒、陶雪嬌、劉智慧、韓晶等[8-11]也分別就大數(shù)據(jù)關(guān)鍵技術(shù)的研究提出思考。以上科學(xué)研究主要從大數(shù)據(jù)技術(shù)綜述角度出發(fā),而從專利視角進(jìn)行探討的文章較少。本文主要從情報分析的角度,研究大數(shù)據(jù)相關(guān)專利的進(jìn)展情況,預(yù)測大數(shù)據(jù)技術(shù)的專利競爭態(tài)勢,并就中國企業(yè)大數(shù)據(jù)發(fā)展戰(zhàn)略提出應(yīng)對策略。
1?數(shù)據(jù)來源
相關(guān)研究[12-15]表明,專利數(shù)據(jù)是進(jìn)行產(chǎn)業(yè)技術(shù)競爭態(tài)勢研究的有效信息來源,專利分析為企業(yè)技術(shù)研發(fā)、發(fā)展戰(zhàn)略研究以及科學(xué)決策提供強有力的支撐。
本文使用Baiten專利檢索數(shù)據(jù)庫對國內(nèi)大數(shù)據(jù)技術(shù)相關(guān)專利進(jìn)行檢索,檢索式為ti:(大數(shù)據(jù) or Hadoop or MapReduce) AND ab:(大數(shù)據(jù) or Hadoop or MapReduce) AND (ad:[20020101 TO 20181118]),使用INNOJOY專利搜索引擎對國際大數(shù)據(jù)技術(shù)相關(guān)專利進(jìn)行檢索,輸入智能關(guān)鍵詞“big data”。
2?國內(nèi)競爭態(tài)勢分析
2.1?年度專利申請量分析
年度專利申請量分布數(shù)據(jù)可以反映出大數(shù)據(jù)技術(shù)從萌芽、發(fā)展到成熟及衰落的發(fā)展歷程與演變態(tài)勢。檢索結(jié)果顯示,截至2018年11月18日,國內(nèi)有關(guān)大數(shù)據(jù)技術(shù)的專利共計6 783件,其中發(fā)明專利6 037件(公開專利5 286件,授權(quán)專利751件),實用新型707件,外觀設(shè)計39件??梢妵鴥?nèi)有關(guān)大數(shù)據(jù)技術(shù)的發(fā)明專利數(shù)量約占專利總數(shù)量的89%。該分布數(shù)據(jù)充分表明,目前大數(shù)據(jù)技術(shù)同時具備新穎性、創(chuàng)造性和實用性的特點,為推動科學(xué)發(fā)展及科技進(jìn)步起著至關(guān)重要的作用。
同時,專利申請量分布側(cè)面反映了專利技術(shù)的發(fā)展歷程,從其申請量變化數(shù)據(jù)中可以了解各階段技術(shù)創(chuàng)新情況,國內(nèi)大數(shù)據(jù)技術(shù)專利數(shù)量分布數(shù)據(jù),如圖1所示。
可以看出,國內(nèi)大數(shù)據(jù)技術(shù)的發(fā)展歷程可以大致分為3個階段。第1階段為2002—2004年,首件大數(shù)據(jù)技術(shù)專利于2002年出現(xiàn),其后2年沒有專利出現(xiàn),該階段屬于大數(shù)據(jù)技術(shù)的萌芽期,第2階段為2005—2011年,年度專利申請量不超過25件,專利申請量呈現(xiàn)出緩慢增長的趨勢,該階段屬于大數(shù)據(jù)技術(shù)的初步發(fā)展期,第3階段為2012年至今,專利申請量呈現(xiàn)出急劇增長的趨勢,前景可觀,該階段屬于大數(shù)據(jù)技術(shù)的蓬勃發(fā)展期。此外注意到,2013年的年增長率為161%,2014年的年增長率為113%,2015年的年增長率為108%,2016年的年增長率為93%,2017年的年增長率為43%。不難看出隨著專利數(shù)量逐年增大,年增長率也隨之逐年放緩,表明大數(shù)據(jù)關(guān)鍵技術(shù)進(jìn)行穩(wěn)定發(fā)展期,其創(chuàng)新性有待突破。
2.2?重要技術(shù)專家分析
參與專利申請的發(fā)明人在一定程度上代表了該領(lǐng)域技術(shù)創(chuàng)新的重要專家,其參與的專利申請量的多寡能夠反映出其科研能力水平,因此該專利分析數(shù)據(jù)可為技術(shù)人才的引進(jìn)提供指導(dǎo)與參考。
根據(jù)國內(nèi)大數(shù)據(jù)技術(shù)發(fā)明人專利量檢索結(jié)果,如圖2所示。
除去99件不公告發(fā)明人作為發(fā)明人參與的專利申請,王振宇、石楊、張鵬分列國內(nèi)大數(shù)據(jù)技術(shù)專利發(fā)明人的前3名,圖2中的發(fā)明人均可視為國內(nèi)大數(shù)據(jù)技術(shù)領(lǐng)域?qū)<?,在學(xué)術(shù)交流及引進(jìn)技術(shù)人才時應(yīng)當(dāng)予以優(yōu)先考慮。
2.3?重要申請人分析
通過了解專利申請人的專利申請量,可以掌握當(dāng)前技術(shù)創(chuàng)新的核心領(lǐng)軍人物及所屬機構(gòu),判斷該領(lǐng)域的技術(shù)競爭現(xiàn)狀并發(fā)現(xiàn)潛在競爭對手,對于領(lǐng)域內(nèi)的領(lǐng)軍機構(gòu)可重點關(guān)注其研發(fā)動態(tài)。根據(jù)國內(nèi)大數(shù)據(jù)專利申請人專利量相關(guān)數(shù)據(jù),得到其分布情況如圖3所示。
其中國家電網(wǎng)公司申請專利數(shù)量最為突出,申請專利數(shù)量總計210件,浪潮集團(tuán)有限公司與華南理工大學(xué)分列第2、3位。根據(jù)檢索數(shù)據(jù)可知,專利申請量排名前10的申請人中,5個為企業(yè),4個為高校,1個為研究院,可見大數(shù)據(jù)技術(shù)已得到了產(chǎn)業(yè)界、學(xué)術(shù)界的高度重視與關(guān)注。究其原因,首先,大數(shù)據(jù)技術(shù)在提高企業(yè)效能、增強企業(yè)核心競爭力等方面能夠為企業(yè)帶來可觀利益和發(fā)展優(yōu)勢。其次,由于國家對人工智能學(xué)科的統(tǒng)籌規(guī)劃以及大數(shù)據(jù)技術(shù)發(fā)展的迅猛態(tài)勢,國內(nèi)高校、科研院所也對大數(shù)據(jù)技術(shù)的愈發(fā)重視,與之相關(guān)的科研活動也逐步深入。
2.4?專利技術(shù)布局分析
通過統(tǒng)計專利技術(shù)分類情況可以了解當(dāng)前專利檢索領(lǐng)域的技術(shù)分布狀況,從而找到專利技術(shù)申請熱點與空白點,對于了解專利技術(shù)布局找到研發(fā)方向非常有幫助。
對國內(nèi)大數(shù)據(jù)技術(shù)相關(guān)專利的研究方向進(jìn)行IPC專利分類檢索,檢索結(jié)果如圖4所示。容易看出,目前大數(shù)據(jù)技術(shù)研究方向較為統(tǒng)一,主要集中在G物理和H電學(xué)相關(guān)領(lǐng)域。根據(jù)大組分類編號可以看出,目前針對大數(shù)據(jù)技術(shù)的研究主要基于計算機處理技術(shù),例如數(shù)據(jù)挖掘、數(shù)據(jù)處理及通信控制等方面。根據(jù)具體IPC分類號可以看出,當(dāng)前大數(shù)據(jù)領(lǐng)域的技術(shù)研究熱點為信息檢索及其數(shù)據(jù)庫結(jié)構(gòu)。
3?國際競爭態(tài)勢分析
3.1?年度專利申請量分析
根據(jù)國際大數(shù)據(jù)技術(shù)相關(guān)專利檢索結(jié)果數(shù)據(jù),世界首件涉及“big data”的專利是1985年由日本率先提出的,盡管當(dāng)時其所代表的含義與目前主流的含義并不完全相同,但它的確是國際上在字面上首個包含“big data”術(shù)語的專利。國際大數(shù)據(jù)技術(shù)專利申請量檢索數(shù)據(jù)如圖5所示。
將圖5的國際大數(shù)據(jù)技術(shù)專利申請量檢索數(shù)據(jù)與圖1的國內(nèi)檢索數(shù)據(jù)進(jìn)行比較,不難發(fā)現(xiàn)大數(shù)據(jù)技術(shù)相關(guān)國際專利同樣也可以分為3個階段。第1階段為2002年以前,該階段只有少數(shù)專利出現(xiàn),大數(shù)據(jù)相關(guān)技術(shù)還未得到長足發(fā)展,該階段屬于技術(shù)萌芽期,第2個階段為2002—2011年,相關(guān)專利申請量呈現(xiàn)緩慢增長的趨勢,該階段是大數(shù)據(jù)技術(shù)的初步發(fā)展期,第3階段從2012年開始,專利申請量呈現(xiàn)倍數(shù)級增長,該階段為大數(shù)據(jù)技術(shù)的蓬勃發(fā)展期。此外,2018年國際、國內(nèi)大數(shù)據(jù)相關(guān)專利申請數(shù)量均有不同程度的回落。由此可見,國內(nèi)大數(shù)據(jù)技術(shù)相關(guān)專利雖然起步較晚,但在蓬勃發(fā)展期與國際發(fā)展水平接軌,發(fā)展態(tài)勢良好。
3.2?專利授權(quán)國家和組織數(shù)據(jù)分析
根據(jù)國際大數(shù)據(jù)專利授權(quán)國家和組織檢索數(shù)據(jù),結(jié)果如圖6所示。專利數(shù)量排名前3的授權(quán)國家和組織分別為中國、美國和韓國,其中中國專利數(shù)量占比約為70%,遠(yuǎn)超世界上其他國家和組織。由此表明,目前中國已在大數(shù)據(jù)技術(shù)領(lǐng)域具備一定的實力,對大數(shù)據(jù)技術(shù)的專利研究受到廣泛關(guān)注和重視。
另一方面,雖然中國大數(shù)據(jù)技術(shù)相關(guān)專利數(shù)量遠(yuǎn)超世界上其他國家和組織,但中國大數(shù)據(jù)相關(guān)授權(quán)專利數(shù)量為559件,而美國大數(shù)據(jù)相關(guān)授權(quán)專利數(shù)量為1 028件。因此不難看出,美國是世界第一的專利授權(quán)國家和組織,同時也說明美國對大數(shù)據(jù)技術(shù)領(lǐng)域的相關(guān)研究具有更強的核心競爭力。
3.3?國際專利申請人排行榜
根據(jù)國際大數(shù)據(jù)專利申請人檢索數(shù)據(jù),可以得到國際大數(shù)據(jù)專利申請人排行榜,如表1所示。根據(jù)檢索結(jié)果,在排名前20的專利申請人中,申請人主要來自美國、中國和韓國。其中,15個來自中國,4個來自美國,1個來自韓國。所有申請人中,有5個為中國高校,其余15個均為產(chǎn)業(yè)界科技龍頭企業(yè)。由此表明,中國高等學(xué)校對大數(shù)據(jù)技術(shù)的高度重視與緊密關(guān)注,也說明中國高校的科研力量正在逐步提升,同時也表明大數(shù)據(jù)技術(shù)在國際上得到了眾多電子信息類公司的密切關(guān)注。
4?結(jié)語
通過對國內(nèi)、國際大數(shù)據(jù)技術(shù)專利檢索數(shù)據(jù)對比分析可以得出,目前我國對大數(shù)據(jù)技術(shù)領(lǐng)域的研究水平與美國先進(jìn)水平相比仍存在一定差距,尚未掌握核心技術(shù),但是我國大數(shù)據(jù)技術(shù)產(chǎn)業(yè)呈現(xiàn)出良好的發(fā)展態(tài)勢。
目前我國高校和電子信息類企業(yè)成為大數(shù)據(jù)技術(shù)相關(guān)專利的主要申請主體。對大數(shù)據(jù)技術(shù)領(lǐng)域的研究主題主要集中在計算機處理技術(shù),當(dāng)前研究熱點為信息檢索及其數(shù)據(jù)庫結(jié)構(gòu)。同時大數(shù)據(jù)技術(shù)已逐步向各個應(yīng)用領(lǐng)域滲透,國家電網(wǎng)、浪潮集團(tuán)等龍頭企業(yè)成為大數(shù)據(jù)技術(shù)應(yīng)用的領(lǐng)跑者。隨著人工智能領(lǐng)域快速崛起、智能制造產(chǎn)業(yè)發(fā)展如火如荼,大數(shù)據(jù)技術(shù)作為人工智能的核心技術(shù)將會被應(yīng)用在越來越多的研究領(lǐng)域。
基于分析研究,我們對中國企業(yè)的大數(shù)據(jù)發(fā)展戰(zhàn)略提出以下應(yīng)對策略:
1)充分發(fā)揮大數(shù)據(jù)資源優(yōu)勢,建立健全數(shù)據(jù)披露、數(shù)據(jù)共享機制,形成行業(yè)間數(shù)據(jù)透明、數(shù)據(jù)共享的良性發(fā)展態(tài)勢。
2)靈活運用大數(shù)據(jù)技術(shù),積極引導(dǎo)企業(yè)技術(shù)發(fā)展與科技創(chuàng)新,加速企業(yè)轉(zhuǎn)型升級。
3)進(jìn)一步增強企業(yè)知識產(chǎn)權(quán)保護(hù)意識,優(yōu)化企業(yè)戰(zhàn)略布局,加強企業(yè)風(fēng)險防范,及時有效維護(hù)企業(yè)合法權(quán)益。
4)密切關(guān)注發(fā)達(dá)國家的前沿技術(shù)發(fā)展動向,避免在新一輪國際競爭中陷入被動,力爭取得關(guān)鍵技術(shù)上的重大突破。
5)抓住人工智能、智能制造等國家重大戰(zhàn)略契機,充分發(fā)揮民營經(jīng)濟體的巨大能量,助力大數(shù)據(jù)智能制造飛速前進(jìn)。
盡管我國大數(shù)據(jù)技術(shù)發(fā)展歷程與國際發(fā)展態(tài)勢基本吻合,但在核心技術(shù)的創(chuàng)新上仍缺乏重大突破。因此,應(yīng)大力加強工業(yè)大數(shù)據(jù)與人工智能核心技術(shù)研發(fā)能力,積極參與相關(guān)國際標(biāo)準(zhǔn)制定,力爭在新興技術(shù)領(lǐng)域的國際標(biāo)準(zhǔn)化進(jìn)程中占據(jù)有利地形。
參考文獻(xiàn):
[1]知乎.?大數(shù)據(jù)[EB/OL].(2008-08-15)[2018-11-30].https://www.zhihu.com/topic/19740929/intro.
[2]?MAYER-SCHNBERGER V,CUKIER K.Big data:a revolution that will transform how we live,work,and think[M].London:John Murray Publisher,2013.
[3]Nature.?Big Data[EB/OL].?(2008-09-03)[2018-11-30].http://www.nature.com/news/specials/bigdata/index.html.
[4]Science.?Special online collection:dealing with data[EB/OL].?(2011-02-11)[2018-11-30].http://www.scie ncemag.org/site/special/data/.
[5]MANYIKA J,CHUI M,BROWN B,et al.?Big data:the next frontier for innovation,competition and productivity [R/OL].(2011-05-18)[2018-11-30].https://www.mckinsey.com/business-functions/digital-mckinsey/our-insights/big-data-the-next-frontier-for-innovation.
[6]孟小峰,慈祥.?大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].?計算機研究與發(fā)展.2013,50(1):146-169.
[7]程學(xué)旗,靳小龍,楊婧,等.?大數(shù)據(jù)技術(shù)進(jìn)展與發(fā)展趨勢[J].科技導(dǎo)報.2016,34(14):49-59.
[8]劉煒,夏翠娟,張春景.?大數(shù)據(jù)與關(guān)聯(lián)數(shù)據(jù):正在到來的數(shù)據(jù)技術(shù)革命[J].?現(xiàn)代圖書情報技術(shù),2013(4):2-9.
[9]陶雪嬌,胡曉峰,劉洋.?大數(shù)據(jù)研究綜述[J].?系統(tǒng)仿真學(xué)報,2013(S1):142-146.
[10]劉智慧,張泉靈.?大數(shù)據(jù)技術(shù)研究綜述[J].?浙江大學(xué)學(xué)報(工學(xué)版),2014,48(6):957-972.
[11]韓晶.?大數(shù)據(jù)服務(wù)若干關(guān)鍵技術(shù)研究[D].?北京:北京郵電大學(xué),2013.
[12]李鵬飛,盧瑾,辛一.?基于專利的大數(shù)據(jù)技術(shù)發(fā)展情報分析及戰(zhàn)略研究[J].?情報雜志,2014(9):45-50.
[13]李文娟,劉桂鋒,盧章平.?基于專利分析的我國大數(shù)據(jù)產(chǎn)業(yè)技術(shù)競爭態(tài)勢研究[J].?情報雜志,2015(7):65-70.
[14]沈瀅,張倩.?大數(shù)據(jù)關(guān)鍵技術(shù)專利態(tài)勢研究[J].?電信網(wǎng)技術(shù),2017(3):43-49.
[15]任成梅,馬麗儀,洪成,等.?大數(shù)據(jù)技術(shù)專利發(fā)展情況分析[J].?科技經(jīng)濟導(dǎo)刊,2018(1):7-11.