郭 萍
(仙桃職業(yè)學(xué)院 計科院, 湖北 仙桃 433000)
CAJViewer在學(xué)術(shù)文獻使用中的功能與技巧
郭 萍
(仙桃職業(yè)學(xué)院 計科院, 湖北 仙桃 433000)
CAJViewer作為一款專門的學(xué)術(shù)文獻瀏覽軟件,兼容多種文獻格式,具有瀏覽頁面、查找文字、文本識別、郵件傳輸?shù)裙δ?。支持PDF的瀏覽和集成OCR文本識別是該軟件的兩大亮點,準(zhǔn)確及時解決可能出現(xiàn)的問題,靈活使用其功能,可極大地方便用戶對學(xué)術(shù)文獻的瀏覽和使用。
CAJ文件;PDF文件;OCR識別;學(xué)術(shù)文獻
CAJViewer支持中國知網(wǎng)的CAJ、KDH、NH、CAA、TEB及PDF等多種格式文件,用于閱讀中國知網(wǎng)源數(shù)據(jù)庫中的期刊、學(xué)位論文、會議論文、報紙和專業(yè)知識倉庫中的學(xué)術(shù)文獻。它可以在線閱讀中國知網(wǎng)的學(xué)術(shù)文獻,也可以閱讀下載到本地硬盤的中國知網(wǎng)全文和通過各種形式獲得的PDF文件,是用戶查閱學(xué)術(shù)文獻不可或缺的工具軟件。
CAJViewer的瀏覽和打印功能被使用者所熟知,但對其他功能可能知之甚少。其實,CAJViewer的功能遠(yuǎn)不止這些,下面介紹CAJViewer三個非常實用的使用技巧[1]。
1.1 學(xué)術(shù)文獻標(biāo)注技巧
對于有價值的學(xué)術(shù)文獻,使用者可能要反復(fù)研讀,重點的內(nèi)容還必須做上不同的標(biāo)注,這一要求在CAJViewer中可輕松實現(xiàn)。步驟如下:
點擊菜單項“查看”→“標(biāo)注”,即可在當(dāng)前文檔的主頁面左邊出現(xiàn)標(biāo)注管理的窗口,在該窗口下,可以顯示并管理當(dāng)前文檔上所作的所有標(biāo)記。標(biāo)注共有十種,分別是直線、曲線、矩形、橢圓、文本注釋、高亮文本、下劃線文本、刪除線文本、知識元鏈接和書簽。
在標(biāo)注窗口里,鼠標(biāo)點擊右鍵,將彈出5個菜單項,內(nèi)容如下:刪除所選項,將把當(dāng)前選擇的一個標(biāo)注從文檔主界面上刪除;清除本類型的所有項,將彈出小的確認(rèn)對話框,如果選擇是,將把文檔上本類型的所有標(biāo)注清除;清除所有標(biāo)注,將彈出小的確認(rèn)對話框,如果選擇是,將把文檔上的所有標(biāo)注清除;屬性,彈出對話框讓用戶編輯標(biāo)注的描述信息;設(shè)置顏色,改變所選中的標(biāo)注的顏色。
1.2 學(xué)術(shù)文獻搜索技巧
在閱讀學(xué)術(shù)文獻的過程中,CAJViewer可以搜索與使用者提供的關(guān)鍵詞匹配的內(nèi)容。步驟如下:
點擊菜單項“編輯”→“搜索”,將會出現(xiàn)搜索窗口,一般在屏幕的右邊。在編輯窗口里輸入要搜索的文本,選擇搜索的范圍,內(nèi)容如下:
1) 在當(dāng)前活動文檔中搜索,搜索結(jié)果都將在窗口下部的列表框里顯示,搜索完成后主頁面上將顯示搜索到的第一條文本,點擊不同的搜索結(jié)果,主頁面將進入到相應(yīng)的區(qū)域。
2) 在所有打開的文檔中搜索,搜索結(jié)果都將在窗口下部的列表框里顯示,搜索完成后主頁面上將顯示搜索到的第一條文本,點擊不同的搜索結(jié)果,主頁面將進入到相應(yīng)的區(qū)域。
3) 在PDL中搜索,如果安裝了個人數(shù)字圖書館將打開該軟件,并在該軟件中搜索,搜索結(jié)果在個人數(shù)字圖書館中顯示。
4) 選擇范圍搜索,選擇一個目錄進行搜索,將搜索所有CAJViewer可以打開的文件,搜索結(jié)果都將在窗口下部的列表框里顯示,搜索完成后主頁面上將顯示搜索到的第一條文本,點擊不同的搜索結(jié)果,主頁面將進入到相應(yīng)的區(qū)域,如果文件沒有打開將首先打開文件。
1.3 學(xué)術(shù)文獻識別技巧
對于一些用掃描方式制作的電子文檔,由于無法直接復(fù)制其中的文字內(nèi)容,給用戶操作帶來極大不便。CAJViewer除了能閱讀目前國內(nèi)常見的PDF、CAJ、KDH、NH、CAA、TEB六種電子文檔外,還內(nèi)置了免費的OCR識別工具,可以輕松識別和復(fù)制各種文獻電子文檔內(nèi)容,實現(xiàn)文檔格式的轉(zhuǎn)換,大大節(jié)省了論文編輯的時間。
根據(jù)文獻原文檔的生成方式,可選擇以下其中一種技巧,對文獻文本進行復(fù)制或識別。
方法一:文件另存法
在工具欄中選擇“文件”→“另存為”,在保存類型中選擇“文本文件(*.txt)”,整篇文檔即迅速實現(xiàn)了格式轉(zhuǎn)換。此法僅保留文檔中文本內(nèi)容。
方法二:文本選擇法
文本選擇法可分為普通的按行選擇和按區(qū)域選擇。按行的方式選擇:首先,使工具欄上的“選擇文本”處于選中狀態(tài),然后在頁面區(qū)按住鼠標(biāo)左鍵拖動;按區(qū)域的方式選擇:使工具欄上的“選擇文本”處于選中狀態(tài),然后在頁面區(qū)按住鼠標(biāo)左鍵拖動。被變亮顯示的文本都是被選中的文本,使用工具欄上的“把選擇結(jié)果復(fù)制到剪貼板”,或可以使用快捷鍵Ctrl+C來進行。使用編輯軟件中菜單中“粘貼”功能或使用快捷鍵Ctrl+V將文本復(fù)制到指定位置,文本轉(zhuǎn)換或復(fù)制工作即完成。
方法三:文本識別法
CAJViewer采用的是清華文通的OCR識別技術(shù),識別精度非常高,操作方法非常簡單。當(dāng)工具欄中“選擇文本”置灰時,表示不可直接復(fù)制,需進行文本識別后方可復(fù)制。
點擊工具欄中的“文字識別”按鈕,然后按住鼠標(biāo)左鍵拖動形成選取文字識別范圍,稍候就會彈出個“文字識別結(jié)果”窗口來顯示識別出來的文字內(nèi)容,點擊“復(fù)制到剪貼板”按鈕可以將該內(nèi)容保存到剪貼板中使用,若點擊“發(fā)送到WPS/WORD(W)”按鈕則可以自動粘貼到WORD文檔使用。[2]
有些學(xué)術(shù)文獻當(dāng)我們找到它時,它要么是紙質(zhì)書面材料,要么是在電腦屏幕上顯示著,無法拷貝,更無法編輯。使用CAJViewer,您同樣可將其轉(zhuǎn)換成可以隨意編輯的TXT和WORD文檔。首先,將紙質(zhì)書面材料掃描成圖片文件或?qū)⑵聊晃淖纸仄帘4鏋閳D片;然后,使用CAJViewer進行文本識別。具體操作步驟如下:
2.1 紙質(zhì)文檔的掃描或屏幕文字的截屏
掃描或截屏生成文件格式一般有jpeg、bmp、tiff等。為了識別提高識別效果,請將格式設(shè)置成bmp、黑白、分辨率設(shè)置在300以上。如果是書或雜志,可先把訂書針拆開,按順序逐頁平整放在掃描儀上進行掃描。清晰美觀的圖片,有利于后期編輯與識別。文檔掃描成多張圖片時,請按順序進行編號。
2.2 把掃描或截屏的圖片文件制成PDF文檔
把圖片文件轉(zhuǎn)換成PDF文檔比較簡單的方法是使用Image To PDF軟件。[3]
1) 把Image To PDF軟件文件夾復(fù)制到硬盤任意目錄,點擊“Image To PDF”圖標(biāo)啟動主程序。
2) 點擊主界面中的“設(shè)置”進行軟件的相關(guān)設(shè)置。在設(shè)置對話框的“輸出設(shè)置”選項卡中,選擇第一種輸出方式,使用多個圖像文件生成一個PDF文件,其他使用默認(rèn)值。
3) 在設(shè)置對話框的“圖像處理”選項卡中,選擇jpeg。壓縮質(zhì)量這項,數(shù)值設(shè)置大,生成的PDF體積就大,當(dāng)然也清楚,反之體積就越小,可以通過調(diào)節(jié)獲得最好的效果。
4) 在設(shè)置對話框的“頁設(shè)置”選項卡中,選擇A4紙。此外,像PDF水印、加密、信息等其它項,均使用默認(rèn)值。設(shè)置完成后,點擊“確認(rèn)”,保存設(shè)置。
5) 返回主界面,點擊“文件”→“添加文件”,找到掃描或截屏好并且已經(jīng)編好號的圖片,選定全部圖片后打開,打開后您還可以在右邊調(diào)整順序。
5) 點擊“生成PDF文件”。在存放圖片的文件夾里就可以看到已經(jīng)轉(zhuǎn)換生成的PDF文件。
如果對生成的文件質(zhì)量不滿意,可以通過調(diào)整設(shè)置里的“圖像處理”里的參數(shù)來更改文件。
2.3 使用CAJViewer對PDF文件進行文本識別
具體操作參照以上CAJViewer文本識別技巧。
3.1 如何直接打開PDF格式文獻
PDF格式文獻默認(rèn)打開方式是使用Acrobat Reader,要使用CAJViewer直接打開PDF格式文獻,必須進行文件關(guān)聯(lián)設(shè)置,步驟如下:
選擇“工具”→“參數(shù)設(shè)置”;彈出“設(shè)置參數(shù)”對話框,選擇“文件關(guān)聯(lián)”選項,選擇“Adobe Acrobat文件(*.PDF)”;點出“應(yīng)用”或“確定”即可。[4]
3.2 如何截取學(xué)術(shù)文獻中的公式、圖表或圖片
如果用戶要引用或保存原文中的公式、圖表或圖片,可以使用CAJViewer的圖片復(fù)制功能,將原文中的公式、圖表或圖片等復(fù)制下來,粘貼到其他文字處理(如Word)或圖片處理程序(如 Photoshop)中進行編輯、處理、保存或引用。
運行CAJViewer,打開學(xué)術(shù)文獻文件,點擊工具欄中的“選擇圖像”按鈕,然后按住鼠標(biāo)左鍵拖動形成選取公式、圖表和圖片的范圍,點擊鼠標(biāo)右鍵,選擇右鍵菜單中“發(fā)送圖像到WPS/WORD(W)”,圖像將可以自動粘貼到WORD文檔中。也可選擇右鍵菜單中“復(fù)制CTRL+C”,然后使用快捷鍵CTRL+V將公式、圖表或圖片粘貼到任何圖片處理軟件。
3.3 如何解決無法在線瀏覽博碩士論文問題
CAJViewer啟動時需要將信息下載到本地后才能正常瀏覽,如果網(wǎng)絡(luò)速度慢或博碩士論文比較長,瀏覽器啟動的時間相對比較長,這時用戶很容易誤認(rèn)為點擊鏈接無效而連續(xù)點擊“在線瀏覽”。其實這時已經(jīng)是打開了數(shù)個CAJViewer進程,而導(dǎo)致系統(tǒng)無響應(yīng)。
解決辦法:打開“任務(wù)管理器”,在進程列表中可以看到很多個正在運行的CAJViewer.exe進程,將這些進程保留一個或全部結(jié)束,等待片刻便可瀏覽到全文了。
3.4 如何解決瀏覽文獻時顯示亂碼問題
1) 首先檢查CAJViewer的版本,如果程序版本較低,請進入中國知網(wǎng)(http://www.cnki.net/)下載。
2) 檢查系統(tǒng)的字體目錄(C:WINDOWSFonts),看是否有以“CAJ”開頭的字體文件,如果有,按F5刷新顯示;如果沒有,需重新安裝最新版本的CAJViewer全文瀏覽器,然后重新啟動計算機。
3) 如果是非中文環(huán)境,請先至少安裝一種中文字體,然后設(shè)置CAJViewer全文瀏覽器的默認(rèn)字體為中文字體。
4) 在BIG5環(huán)境下,選擇默認(rèn)字體最好設(shè)置“細(xì)明”為中文字體,不要設(shè)置楷體等其他字體。
3.5 如何解決將CAJ中的文字粘貼到WORD中顯示亂碼問題
可以在打開WORD或記事本的同時打開中文輸入法,然后再將CAJviewer中復(fù)制的文字拷貝粘貼到WORD或記事本中,一般可以解決此類問題。
3.6 如何解決“文字識別”出現(xiàn)錯誤識別比例過高問題
在CAJViewer瀏覽器中,打開“工具”→“參數(shù)設(shè)置”,打開“參數(shù)設(shè)置”對話框;選擇“瀏覽”選項卡,將選項內(nèi)“平滑文本”前的√去掉,按“確定”保存設(shè)置即可。
3.7 如何取消學(xué)術(shù)文獻下載時的提示對話框
在點擊學(xué)術(shù)文獻下載后,如果您認(rèn)為彈出的“文件下載處理”對話框是多余的,請先選擇文件保存位置,然后將“在打開這種類型的文件前始終詢問”前的打勾去掉,點擊“確定”即可取消學(xué)術(shù)文獻下載時多余的提示對話框。
3.8 如何設(shè)置可以使CAJViewer不保存歷史紀(jì)錄
在默認(rèn)情況下,CAJViewer會保存用戶的瀏覽歷史,如果涉及用戶隱私,可取消這個功能。解決方法如下:
單擊“開始”→“運行”,輸入regedit并回車,打開注冊表編輯器,如使用的是CAJViewer 7.0,應(yīng)找到[HKEY_CURRENT_USERSoftwareTTKNCAJViewer 7.0Config],然后在此項中新建名為“SaveFileHistory”的DWORD值,并設(shè)為“0”即可。
3.9 如何設(shè)置可以使CAJViewer不保存文件列表
在默認(rèn)情況下,關(guān)閉CAJViewer時,都會保存已打開的文件列表。在某些情況下,用戶可能不需要此功能。解決方法如下:
運行CAJViewer,在文件菜單中選擇“工具”→“參數(shù)設(shè)置”,在出現(xiàn)的對話框中切換到“通用”,選上“退出時提示保存打開的文件列表”,然后關(guān)閉程序(必須有打開的文件),就會出現(xiàn)提示是否要保存文件列表,選擇“否”并勾選上“記住我的選擇,下次不要提醒我”的選項,此后就不會有提示,也不會再保存打開的文件列表。
3.10 如何解決自動更新完成后無法正常瀏覽文獻內(nèi)容問題
這一問題主要是由于程序沒有正常關(guān)閉,導(dǎo)致一些參數(shù)保存不正常所致。解決方法如下:
單擊“開始”→“運行”,輸入Regedit并回車,打開注冊表編輯器,手工刪除注冊表下列鍵:[HKEY_CURRENT_USERSoftwareTTKN/CAJViewer 7.0]。
啟動CAJViewer會出現(xiàn)自動升級,請“取消”,在菜單欄單擊“工具”→“參數(shù)設(shè)置”→“通用”選項卡,取消掉“自動更新”,選擇“從不檢查”。
提示:如果此問題還得不到完全解決,可能是文件本身保存了不正確的瀏覽參數(shù)所致,可使用工具菜單中的“重置所有參數(shù)”來解決。
CAJViewer作為一款專門的學(xué)術(shù)文獻瀏覽軟件,支持多種不同類型的文獻格式。既可取代Adobe Reader閱讀器對PDF的瀏覽功能,又不需要單獨使用OCR軟件而進行文本識別,極大地方便用戶對學(xué)術(shù)文獻的瀏覽和使用。
[1] 中國知網(wǎng).CAJViewer 7.0常見問題列表[EB/OL].http://cajviewer.cnki.net/cajviewer7/help/faq.html.
[2] 無人喝彩.看抓一體化CAJViewer[J].電腦迷,2006(2):69.
[3] 張秀秀,張立峰.PDF文件文本內(nèi)容提取研究[J].科技情報開發(fā)與經(jīng)濟,2008(36):118.
[4] 田學(xué)軍.PDF文件格式及其轉(zhuǎn)化方法探討[J].荊門職業(yè)技術(shù)學(xué)院學(xué)報,2005(5):30.
[責(zé)任編輯:張超]
FunctionsandSkillsoftheUsageofCAJViewerintheacademicliterature
GUO Ping
(XianTao Vocational College Xiantao 433000, China)
CAJViewer, as a special browser software for academic literature, compatible with a variety of documentation formats, has a lot of functions such as viewing page, finding text, text recognition, transferring Internet mail and so on. The software has two highlights as follows: supporting PDF browse and OCR text recognition. It can solve problems accurately. We can greatly facilitate the users to browse and use the academic literature if one can use its function flexiblely.
CAJ files; PDF file; OCR recognition; CAJViewer; academic literature
G255.75
A
1671-6876(2011)04-0357-04
2011-05-20
郭萍(1963-),男,湖北省仙桃人,教授,主要從事高等職業(yè)教育理論及計算機網(wǎng)絡(luò)安全研究。