国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

圖像識別系統(tǒng)在鑒定盜版圖書中的應(yīng)用

2009-07-16 09:33:54林小玲
新媒體研究 2009年8期
關(guān)鍵詞:防偽圖像識別版面

林小玲

中圖分類號:TP2文獻標(biāo)識碼:A文章編號:1671-7597(2009)0420026-01

一、盜版圖書概述

盜版是我國圖書市場乃至世界圖書市場的一個頑疾。圖書市場盜版、盜印活動的猖獗,已到了無孔不入的地步。幾乎所有的暢銷圖書或教材教輔,甚至權(quán)威工具書《新華字典》,都無法擺脫被盜版的命運。盜版行為嚴(yán)重?fù)p害了出版社和著作權(quán)人的利益,侵害了廣大讀者閱讀正規(guī)、高品質(zhì)圖書的權(quán)利,貽害無窮。

盜版圖書主要有以下幾種形式:

1.通過掃描的電子文件輸出膠片印刷,其清晰度、色彩等都會與原版書不同。此類盜版書很容易判斷,錯別字多,紙張粗劣,印刷模糊,偏遠地區(qū)的出版社,版權(quán)頁前后不符等等。但現(xiàn)在的盜版書商越來越專業(yè),上述問題他們也在逐漸改善,判斷也越來越難。但狐貍終究會露出尾巴,一般封面的原文件他們是搞不到的,只能掃描正版書的封面。受目前印刷技術(shù)的限制,掃描后再制片、印刷的封面在色澤上一定會有偏差,如偏暗、偏艷、明暗變化突然等等,而且里面的圖紋細(xì)節(jié)也會很模糊。不同印刷廠提供的紙張常常有差異,主要是質(zhì)地手感上有區(qū)別。另外,盜版書的內(nèi)容文字,要么是掃描后重新識別成文本文件再出片,那么它的錯字率較高;要么是掃描成圖片文件直接出片,那么文字的邊角就會有些模糊。

2.直接使用電子文件,甚至正版膠片印刷,質(zhì)量能夠以假亂真,這是對排版和印刷環(huán)節(jié)管理不嚴(yán)所造成的。例如在出版社方面,內(nèi)部參與編校排人員私下將書稿盜出,盜印發(fā)行。

3.不法書商與印刷廠勾結(jié),私自加印圖書。印刷廠方面在制版印刷時,主要會采取如下盜版手段:(1)文件另存;(2)另拷照排版;(3)加曬PS版;(4)私自增加印數(shù)等等。

這些盜版書,有些假冒出版者名義出版,有的盜用出版社已出版圖書的書號,有些甚至自己亂編書號。越來越多的出版社和著作權(quán)人意識到,打擊盜版不僅是政府的事,更是出版社自身的事。有些出版單位設(shè)置了專門的“打盜”機構(gòu)和專人,從當(dāng)初單純投訴和一般化調(diào)研的被動狀態(tài),到積極調(diào)查、主動介入,有組織、有計劃地開展工作,并就某些案件提起民事訴訟。因此,做好出版物盜版鑒定工作成為必不可少的一道程序。出版社希望通過有效的、系統(tǒng)的手段,清晰地鑒別出盜版書,分析其盜版根源,通過整理、分析,形成盜版信息分析報告,便于執(zhí)法部門有重點地打擊盜版行為?,F(xiàn)今,鑒別工作的所有工序都是通過人工處理的,都是靠出版界專業(yè)人士或印刷行業(yè)協(xié)會專家的個人經(jīng)驗做技術(shù)鑒定,缺乏軟硬件系統(tǒng)作為科學(xué)有效的工具使用。圖書盜版是一種專業(yè)性很強的犯罪,涉及出版業(yè)的一些專門知識,一般非業(yè)內(nèi)人士所知,傳統(tǒng)的司法物證鑒定部門要完成此種鑒定有困難。在以往司法實踐中,曾以被盜版的正版出版社或其下設(shè)的出版部有關(guān)人員為鑒定人,出具鑒定結(jié)論,作為法庭證據(jù)。這種情況下的鑒定注重正版書的特征,用正版與盜版比較得出結(jié)論。

每個出版社的圖書都有其獨特之處,一般只有該出版社的出版部人員最了解。其常規(guī)鑒別方法如下:正版圖書的用料,包括正文用紙、內(nèi)封或環(huán)襯用紙、封面用紙或其他用料是國產(chǎn)的還是進口的;圖書的裝訂方式是膠訂聯(lián)動裝訂還是人工素線裝訂;圖書是否含防偽水印;水印是否真實等等。隨著出版社內(nèi)部管理系統(tǒng)如ERP(Enterprise Resource Planning,企業(yè)資源管理計劃)的完善,鑒別方法也有了進一步的發(fā)展,可以先針對圖書身份驗證的重要信息數(shù)據(jù)書名、書號進行數(shù)據(jù)排查,初步確定是否為假冒出版者名義,或已出版圖書的書號,或是自己亂編書號出版等的盜版方式。

雖然由出版社內(nèi)部人員鑒別正版與盜版最直截了當(dāng),但是被盜版的出版社是此類案件的利害關(guān)系人,由他們做鑒定往往不符合鑒定結(jié)論的法定條件,在司法實踐中常被詬病。因此,仍然需要有第三方參與的科學(xué)的鑒定結(jié)論,這就需要有一套相對完善的系統(tǒng)支持。本文結(jié)合圖像識別技術(shù),以圖書封面、內(nèi)文數(shù)字圖像為對象,綜合運用圖書出版制作管理技術(shù)、數(shù)據(jù)庫技術(shù)、圖像處理、模式識別原理,設(shè)計一套專供出版社或鑒定單位進行基于圖像識別的盜版圖書鑒定系統(tǒng)。

二、核心技術(shù)及設(shè)計思路

一直以來,國內(nèi)外出版社和發(fā)行單位防止和鑒別盜版圖書工作大多集中在印前工藝和印刷工藝上,如反盜版專用標(biāo)識、新式防偽紙、在圖書上粘貼激光防偽、數(shù)碼防偽標(biāo)貼等方式。最近,一項物品身份信息管理新技術(shù)“S-DNA元素標(biāo)記信息技術(shù)”的問世,為打擊盜版增添了新武器。中國版權(quán)協(xié)會反盜版委員會近期還推出了“反盜版短信防偽信息系統(tǒng)”,該系統(tǒng)是通過推出全國統(tǒng)一的反盜版短信防偽標(biāo)識,利用現(xiàn)有短信息防偽技術(shù)結(jié)合反盜版工作的特點和需要,集數(shù)據(jù)庫技術(shù)、遠程訪問技術(shù)、安全技術(shù)于一體的新型電子防偽反盜版系統(tǒng)。目前尚沒有專供出版社進行盜版圖書鑒別用的基于圖像識別的系統(tǒng),但該系統(tǒng)綜合采用的核心技術(shù)模式識別、圖像特征識別技術(shù)等早被廣泛應(yīng)用于其他領(lǐng)域。

模式識別(Pattern Recognition)就是機器識別、計算機識別或機器自動識別,目的在于讓機器自動識別事物。模式識別研究的內(nèi)容是利用計算機對客觀物體進行分類,在錯誤概率最小的條件下,使識別的結(jié)果盡量與客觀物體相符合。模式識別中的一個基本概念是相似度(similarity),這和已知的其他一些學(xué)科方法都不相關(guān)。一般認(rèn)為兩個對象相似是因為他們具有相似的特征,相似度經(jīng)常被描述成更加抽象的概念,它并不是在幾個對象之間衡量,而是在一個對象和一個目標(biāo)概念之間進行衡量。讓機器辨別事物的最基本的方法是計算待識別事物與標(biāo)準(zhǔn)模板之間的相似度。

圖像識別也屬于模式識別,是數(shù)字圖像處理的一個新興的研究方向。首先,經(jīng)過深入分析,不同的印前制作過程、不同的印刷工序印出來的印刷網(wǎng)點是有區(qū)別的。因而,同一個文字及圖像中打出來的黑點均不相同。文字圖像的描述依靠黑色像素點,這樣,可以選灰度值為第一個特征向量。計算機將封面及內(nèi)文處理成黑白圖像時,認(rèn)為灰度值為0就是全黑,灰度值為255就是全白,在本系統(tǒng)中,選取灰度值為少于122的像素點為黑點。其次,整個版面內(nèi)容的面積和周長也會有所區(qū)別,這樣可以選取包含整個字體的最小的矩形作為一個特征。本系統(tǒng)設(shè)定以面積灰度值為第二個特征向量,周長灰度值為第三個特征向量,所設(shè)的灰度值是該矩形面積中少于122的像素點的總數(shù)等。簡單來說,首先將出版社的正版圖書作為樣本,建立正版圖書圖像數(shù)據(jù)庫;其次對待查圖書數(shù)字化,經(jīng)過一系列的識別過程,分析鑒別圖書的真?zhèn)?。系統(tǒng)操作流程設(shè)計如圖1。

其中,核心部分的操作分為幾個步驟:封面數(shù)字化圖像處理、版面分析、數(shù)字圖像識別、統(tǒng)計分析。封面數(shù)字化圖像處理是將紙質(zhì)文稿、圖像輸入計算機的過程。為了提高識別率,要對獲得的圖像信息進行預(yù)處理,包括濾去干擾、噪聲等,這樣可提高信噪比。版面分析是把印刷品上同一版面中的圖像分割成一些圖像塊,每一圖像塊大小不等,但都含有相對獨立、完整的內(nèi)容。如標(biāo)題、圖、作者、其他文字內(nèi)容等等。這些內(nèi)容在版面上的安排有一定的、但不是固定不變的順序和規(guī)則。對于豐富多彩的印刷版面,人們在閱讀時大都能一目了然,理解其中的含義及相互連接的關(guān)系。然而,如果我們不賦予電腦必要的功能,它將無法處理這樣復(fù)雜的排列組合,這種特殊功能就是對版面的分析與理解。數(shù)字圖像的識別有四個步驟,包括圖像預(yù)處理(如二值化)、圖像分割、特征提取和圖像分類。最后,統(tǒng)計分析是在版面標(biāo)識的錯誤及差異經(jīng)過特征提取后,通過分類器與特征庫進行匹配,然后分別以不同的算法比較,找出與特征值最相似的結(jié)果,分析其情況并輸出報告。

總之,在圖像識別中,特征量的選擇及優(yōu)化組合是設(shè)計識別系統(tǒng)的關(guān)鍵,它強烈地影響到分類器的設(shè)計及其性能。特征提取階段主要是對物體進行度量從而通過度量值識別物體。計算特征是為了對物體的一些重要特征進行定量估計。特征抽取過程產(chǎn)生了一組特征,把它們組合在一起,就形成了特征向量。常用于特征提取的方法有尺寸測量、形狀分析和紋理分析。其中紋理是一種反映一個區(qū)域中像素灰度級的空間分布的屬性,紋理特征是從物體的圖像中計算出來的一個值,它是對物體內(nèi)部灰度級變化的特征進行量化。特征提取后要在這些特征中選出最適合分類器設(shè)計的特征。本研究用的是基于最小距離的模板匹配法,首先確定圖像的具體特征,哪些特征可作為鑒別使用特征,哪些特征可以忽略。其次是以這些特征為參數(shù),在樣本與檢材間進行距離的對應(yīng)計算,統(tǒng)計取樣后以某值為界,大于該值則可以確定為盜版。

該系統(tǒng)的設(shè)計思路主要基于圖像、文字等特征的相似度識別圖像處理,涉及圖像的二值化處理,圖像、文字特征的提取,模式匹配算法的實現(xiàn),OCR技術(shù)的應(yīng)用等,從而設(shè)計出最優(yōu)的圖書封面等數(shù)字圖像的特征及提取方法,并把這些功能模塊集成在系統(tǒng)中,最終實現(xiàn)基于圖像、文字特征的圖書盜版識別系統(tǒng)。

參考文獻:

[1]王蘭萍,圖書盜版案件中鑒定結(jié)論的使用辨析[M].《中國版權(quán)》,2002年第2期.

[2]王秀珍,圖像識別技術(shù)淺論[M].內(nèi)蒙古電大學(xué)刊,2008年第8期.

[3]章毓晉,圖像處理和分析基礎(chǔ)[M].北京:高等教育出版社,2002.

[4]章毓晉,圖像分割[M].北京:科學(xué)出版社,2001.

[5]莊軍、李弼程,一種基于灰度共生矩陣的文本圖像識別方法[M].《計算機工程》,2006年2月第3期.

猜你喜歡
防偽圖像識別版面
INTEGRITYTM ECO100再生縫紉線引入防偽技術(shù)
你知道古代圣旨和紙鈔是怎樣防偽的嗎
基于Resnet-50的貓狗圖像識別
電子制作(2019年16期)2019-09-27 09:34:50
高速公路圖像識別技術(shù)應(yīng)用探討
圖像識別在物聯(lián)網(wǎng)上的應(yīng)用
電子制作(2018年19期)2018-11-14 02:37:04
圖像識別在水質(zhì)檢測中的應(yīng)用
電子制作(2018年14期)2018-08-21 01:38:16
民國時期紙鈔上的防偽暗記
版面擷英
好版面要有獨到的創(chuàng)新技巧
新聞傳播(2016年3期)2016-07-12 12:55:35
版面“三評”看得失
新聞前哨(2015年2期)2015-03-11 19:29:25
武宣县| 南陵县| 中牟县| 克山县| 南郑县| 台江县| 同江市| 堆龙德庆县| 九龙坡区| 永新县| 永德县| 葵青区| 巨鹿县| 法库县| 桦甸市| 汨罗市| 高密市| 泌阳县| 辉县市| 东山县| 庆安县| 锡林浩特市| 江山市| 馆陶县| 措勤县| 北流市| 濉溪县| 石嘴山市| 桑日县| 宝清县| 三亚市| 罗城| 鹤壁市| 阜新| 分宜县| 册亨县| 曲周县| 青海省| 琼结县| 济宁市| 鹰潭市|