(四川大學(xué)圖書館 四川成都 610041)
數(shù)據(jù)創(chuàng)新與知識產(chǎn)權(quán)保護是大數(shù)據(jù)時代背景下所面臨的兩大重要內(nèi)容。由于國內(nèi)具有價值的數(shù)據(jù)大多散落在各級政府、醫(yī)院、科研院校以及其他行業(yè)并相互獨立,形成了信息孤島,從而產(chǎn)生了暫時擱淺的休眠數(shù)據(jù),這些數(shù)據(jù)不僅單項價值巨大,多重數(shù)據(jù)的整合開發(fā)更能發(fā)揮出巨大潛能。休眠數(shù)據(jù)是指已經(jīng)存在于數(shù)據(jù)庫中、當前并不使用、將來有可能使用的數(shù)據(jù),這種數(shù)據(jù)隨著時間延長而積累蔓延[1]。也有學(xué)者認為休眠數(shù)據(jù)是指數(shù)據(jù)價值被特定主體利用殆盡之時,只是這些數(shù)據(jù)的某一方面用途的價值被使用,并不意味著這些數(shù)據(jù)沒有其他任何價值,可能由于主體或主體數(shù)據(jù)需求的改變,可能由于數(shù)據(jù)技術(shù)的發(fā)展,也可能由于其關(guān)聯(lián)數(shù)據(jù)的出現(xiàn),使其成為非常有價值的數(shù)據(jù)或者數(shù)據(jù)集合[2]。而如何將大量具有潛在價值的休眠數(shù)據(jù)進行再利用或重組創(chuàng)新,以及相關(guān)知識產(chǎn)權(quán)保護問題對傳統(tǒng)知識產(chǎn)權(quán)法提出了怎樣的要求,都亟需進一步探討和分析。
休眠數(shù)據(jù)的數(shù)據(jù)創(chuàng)新是將已經(jīng)存在于各種數(shù)據(jù)庫中的不經(jīng)常被使用或不被挖掘,但是具有一定潛在價值的數(shù)據(jù),通過重組或整合等方式釋放,從而使數(shù)據(jù)的潛在價值得到充分體現(xiàn)。
海量休眠數(shù)據(jù)的潛在價值巨大,其數(shù)據(jù)再利用的不同環(huán)節(jié)和不同階段都蘊含著重大的商業(yè)性價值,并能促使產(chǎn)品增值以實現(xiàn)新的價值創(chuàng)造[3]。休眠數(shù)據(jù)再利用的典型例子是通過大數(shù)據(jù)技術(shù)搜索關(guān)聯(lián)數(shù)據(jù),使主體和客體數(shù)據(jù)之間瞬時交互形成關(guān)聯(lián)列表,使數(shù)據(jù)中隱藏的價值得以實現(xiàn)。例如,京東商城將顧客在網(wǎng)站內(nèi)的所有瀏覽軌跡都通過機器人系統(tǒng)自動記錄下來,根據(jù)不同的數(shù)據(jù)特點進行自動分類并分析處理,按照商品類別形成不同的推薦欄目,從而為客戶提供個性化的服務(wù);攜程網(wǎng)對機票價格與機票預(yù)定時間二者銷售數(shù)據(jù)之間的關(guān)系進行了分析,以預(yù)測未來一段時間機票價格的走勢。
休眠數(shù)據(jù)有時需要通過與另一個毫無相干的數(shù)據(jù)集結(jié)合,其價值才能被激活變得有意義,即用一種用戶自己特定需要的方式根據(jù)不同的創(chuàng)新要求混合這些數(shù)據(jù)——數(shù)據(jù)重組。例如,廣州軍區(qū)廣州總醫(yī)院在2013年對手機輻射是否可增加大腦神經(jīng)膠質(zhì)瘤風(fēng)險進行了研究,其中手機用戶以中華人民共和國工業(yè)和信息化部統(tǒng)計數(shù)據(jù)其中一部分(2 750人)為例,與此同時,選取膠質(zhì)瘤患者2 630名作為參照對象,結(jié)合兩個數(shù)據(jù)集研究后發(fā)現(xiàn)二者并沒有任何的直接關(guān)系??傊S著大數(shù)據(jù)時代的到來,兩個或多個數(shù)據(jù)源重組再利用的總和比部分數(shù)據(jù)更加有價值。當我們將多個獨立數(shù)據(jù)集合的總和重組在一起時,重組總和本身的價值比單個數(shù)據(jù)總和更大。
大數(shù)據(jù)時代,創(chuàng)新主體對休眠數(shù)據(jù)的分析和挖掘以及重組再利用是通過對數(shù)據(jù)的抓取、分析與加工等手段得到新的數(shù)據(jù)集信息。但是這一過程中同時又產(chǎn)生了新的問題,即原有數(shù)據(jù)創(chuàng)造者的權(quán)利維護(即知識產(chǎn)權(quán))與創(chuàng)新主體現(xiàn)有權(quán)利的擁有該如何界定和分配,對傳統(tǒng)的知識產(chǎn)權(quán)法提出了更高更精準的要求。而傳統(tǒng)意義上的知識產(chǎn)權(quán)是指人們就其智力勞動成果所依法享有的專有權(quán)利,通常是國家賦予創(chuàng)造者對其智力成果在一定時期內(nèi)享有的專有權(quán)或獨占權(quán)[4]。知識產(chǎn)權(quán)從本質(zhì)上說是一種無形財產(chǎn)權(quán),其客體是智力成果或者知識產(chǎn)品,是一種無形財產(chǎn)或者一種沒有形體的精神財富,是創(chuàng)造性的智力勞動所創(chuàng)造的勞動成果。
傳統(tǒng)的知識產(chǎn)權(quán)簡單來說具有3個特征:專有性、地域性、時間性。大數(shù)據(jù)時代又重新賦予了知識產(chǎn)權(quán)新的特征:其網(wǎng)絡(luò)資源相對于傳統(tǒng)文字資源有著自己獨特的特征。①數(shù)字化、網(wǎng)絡(luò)化,這是網(wǎng)絡(luò)信息資源的基本特征;②信息量大,種類繁多;③信息更新周期短;④資源龐大,開放性強,信息資源不受地域限制,任何聯(lián)網(wǎng)的計算機都可以上傳和下載信息;⑤組織分散,沒有統(tǒng)一的管理機制和機構(gòu)。而黃立芳提出數(shù)據(jù)產(chǎn)權(quán)這一概念,即數(shù)據(jù)開發(fā)者對合法獲得的共有或?qū)S蓄I(lǐng)域的數(shù)據(jù),通過抓取、分析、加工、處理等智力勞動獲得的數(shù)據(jù)或數(shù)據(jù)集所擁有的人身權(quán)和財產(chǎn)權(quán)[5],也是對大數(shù)據(jù)時代背景下知識產(chǎn)權(quán)的補充。
海量休眠數(shù)據(jù)經(jīng)過數(shù)據(jù)重組或整合等方式加工處理后成功創(chuàng)造出新的數(shù)據(jù)集合或數(shù)據(jù)集,即數(shù)據(jù)創(chuàng)新。這些創(chuàng)新數(shù)據(jù)既可以作為評價科研機構(gòu)產(chǎn)出水平的數(shù)據(jù),也可以通過在商業(yè)領(lǐng)域、銀行、商戶之間的交易記錄和憑證預(yù)測消費者消費傾向[6]。李學(xué)龍、龔海剛依據(jù)目前大數(shù)據(jù)分析的主要領(lǐng)域?qū)⒋髷?shù)據(jù)生成的來源劃分為科學(xué)數(shù)據(jù)、商業(yè)數(shù)據(jù)和互聯(lián)網(wǎng)數(shù)據(jù)3種類型[7]。無論是嚴謹?shù)目茖W(xué)數(shù)據(jù)、熱點的商業(yè)數(shù)據(jù)還是自然語言處理的互聯(lián)網(wǎng)數(shù)據(jù),都存在暫時被擱置的具有潛在價值的休眠數(shù)據(jù)。這些休眠數(shù)據(jù)經(jīng)過進一步挖掘、加工、分析與整理需要新的知識產(chǎn)權(quán)政策支撐,是否會侵害到原有數(shù)據(jù)創(chuàng)造者的合法權(quán)利,是否對重組的結(jié)果給予合理的保護,這些都使得原有知識產(chǎn)權(quán)保護面臨新的挑戰(zhàn)。
數(shù)據(jù)創(chuàng)新強調(diào)利用數(shù)據(jù)挖掘(包括關(guān)聯(lián)規(guī)則學(xué)習(xí)、聚類分析和分類分析等[8])與知識發(fā)現(xiàn)(是指從數(shù)據(jù)中識別出有效的、新穎的、潛在有用的、最終可理解的模式過程[9])等大數(shù)據(jù)技術(shù)對具有潛在價值的休眠數(shù)據(jù)進行重組與整合,而創(chuàng)新的過程就是知識產(chǎn)權(quán)的應(yīng)用和獲得過程。數(shù)據(jù)的二次利用涉及源數(shù)據(jù)隱私及商業(yè)機密的知識產(chǎn)權(quán)保護問題,其產(chǎn)權(quán)的保護與歸屬不僅是相關(guān)原有主體間的利益分割問題,更是創(chuàng)新主體持續(xù)發(fā)展和掌握競爭主動的重要支撐,所以知識產(chǎn)權(quán)保護與歸屬是數(shù)據(jù)創(chuàng)新的關(guān)鍵所在。在創(chuàng)新過程中,創(chuàng)新主體需要投入優(yōu)勢資源和秘密技術(shù)等,同時圍繞一項產(chǎn)生的知識產(chǎn)權(quán)有很多利益主體,所以知識產(chǎn)權(quán)對于數(shù)據(jù)創(chuàng)新主體更多的是約束而不是激勵和促進,這在一定程度上阻礙了創(chuàng)新主體的創(chuàng)新積極性。只有數(shù)據(jù)創(chuàng)新各方面的利益達到均衡保障,創(chuàng)新主體的潛力與優(yōu)勢才能充分發(fā)揮,數(shù)據(jù)創(chuàng)新活動才能順利開展。
如何平衡各創(chuàng)新主體之間新的利益格局以及使知識產(chǎn)權(quán)法律規(guī)則更具彈性,是在大數(shù)據(jù)時代環(huán)境下所面臨的新的要求。筆者認為上述問題可以簡化為兩個名詞:“平衡”與“彈性”。
(1)平衡。在新的背景下,休眠數(shù)據(jù)的重新整合以及利用知識產(chǎn)權(quán)法對原有數(shù)據(jù)資源的控制,導(dǎo)致知識產(chǎn)權(quán)法的發(fā)展必須在更廣闊的空間內(nèi)的各種利益之間進行平衡。一方面,海量休眠數(shù)據(jù)再利用使得知識產(chǎn)權(quán)保護成為一個迫不及待的問題,因為數(shù)據(jù)的二次利用涉及大量知識產(chǎn)品,而創(chuàng)新主體所生產(chǎn)的本身就是知識產(chǎn)品,如果缺乏法律意義上的知識產(chǎn)權(quán)保護,技術(shù)的發(fā)展就會受到限制,數(shù)字化進程就會遇到障礙;而提高知識產(chǎn)權(quán)保護標準又可能束縛科技的發(fā)展。另一方面,數(shù)字化帶來的利益沖突是數(shù)據(jù)創(chuàng)新獲得的利益是否受到知識產(chǎn)權(quán)的保護,如果應(yīng)受到保護,保護的范圍有多大,與原專利權(quán)團體之間的關(guān)系又該如何處理。因為新專利可能會侵害到原專利權(quán)人的權(quán)利,一旦受到保護之后,原專利權(quán)人的權(quán)利又該受到何種保護,同時對于重新組合的產(chǎn)品,法律風(fēng)險已經(jīng)被規(guī)避,但是對原專利權(quán)人造成的損失又該如何處理[10]。
(2)彈性。彈性與平衡相輔相成,各種利益需要在更廣泛的空間內(nèi)保持平衡,因此就得充分保持法律法規(guī)的彈性。就數(shù)據(jù)創(chuàng)新主客體而言,彈性的需求是顯而易見的。因為協(xié)調(diào)創(chuàng)新主客體之間知識產(chǎn)權(quán)的法律法規(guī),而協(xié)調(diào)本身不可能統(tǒng)一,因此妥協(xié)就不可避免,而妥協(xié)本身也就意味著彈性,只有更具彈性的法律法規(guī)才更具有廣泛性。過分原則的法律法規(guī)會導(dǎo)致規(guī)則范圍內(nèi)所追求的目標無法實現(xiàn)[4]。在大數(shù)據(jù)時代,彈性這一要求表現(xiàn)得尤為突出,具有恰當彈性的知識產(chǎn)權(quán)法律法規(guī),不僅可以使知識產(chǎn)權(quán)法能夠更好地適用各種新技術(shù)所帶來的法律問題,又可以使創(chuàng)新主客體之間清晰地理解相關(guān)規(guī)范。
大數(shù)據(jù)時代,數(shù)據(jù)創(chuàng)新越來越受到密切關(guān)注,且成了新的利益增長點和競爭力,而休眠數(shù)據(jù)的二次利用并重新釋放它的能量,為創(chuàng)新主體注入了新的活力。但如何平衡數(shù)據(jù)創(chuàng)新與知識產(chǎn)權(quán)保護的利益點是科學(xué)研究的重要課題。本文初步探析了二者之間的平衡點,為以后的研究打下基礎(chǔ),至于如何建立二者沖突與協(xié)調(diào)機制,有待于進一步研究。