国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

編校軟件局限性的應(yīng)對措施

2016-03-30 14:07:39莫西
科技視界 2016年1期
關(guān)鍵詞:局限性

莫西

【摘 要】當(dāng)計算機科學(xué)應(yīng)用于出版領(lǐng)域,通過計算機視覺的圖像識別、語言判斷、邏輯處理和專家系統(tǒng),模擬人的思維進行反應(yīng)的智能處理編校軟件,迅速改變編輯校對的工作模式,由于編輯這一特殊職業(yè)所要求對各種錯誤的判斷能力和改錯準(zhǔn)確程度,目前編校軟件還有一定的局限性。為了有效提高軟件的編校水平,利用互聯(lián)網(wǎng)匯集全球的編輯經(jīng)驗,共建共享網(wǎng)絡(luò)編校系統(tǒng)。及時對語料庫的收集、整理、加工和測試,利用人工智能技術(shù)提高詞匯自動檢索過濾質(zhì)量。本文根據(jù)軟件在編輯工作中不能解決的各種問題進行歸類分析,提出應(yīng)對措施。

【關(guān)鍵詞】編校軟件;局限性;網(wǎng)絡(luò)編校

【Abstract】When the application of computer science and technology in the publishing field, using computer vision image recognition, linguistic judgment, logic processing, expert system and simulate human thinking of intelligent may responses to treatment editing software and changes in the mode of editing and proofreading rapidly. However, there are some limitations for the current series of editing software, due to the editor is special profession which was required to response to all the wrong judgment and correction accurately. In order to effectively improve the level of the software, the use of the Internet are suggested to gather the world's editorial experience and to build a shared network system, So that the corpus can be timely collected, collated, processed, tested, and automatic retrieval and filtering the quality of vocabulary can be improved by using artificial intelligence technology. According to the classification and analysis of the problems that can not be solved in the editing work, this paper puts forward the measures to deal with them.

【Key words】Editing software; Limitation; Network editing

當(dāng)計算機科學(xué)應(yīng)用于出版領(lǐng)域,編校軟件對文字的自動檢測極大地提高了工作效率,編校軟件是一種能勝任編輯復(fù)雜工作的智能型機器人的雛形。機器人是人工智能科學(xué)領(lǐng)域,人工智能是計算機科學(xué)的分支,集文化、歷史、藝術(shù)、哲學(xué)、心理學(xué)和計算機科學(xué)為一體的智能識別判斷處理程序。通過計算機視覺的圖像識別、語言判斷、邏輯處理和專家系統(tǒng),模擬人的思維進行反應(yīng)的智能處理編校軟件,需要達到的目標(biāo)不僅對圖文進行自動檢測,還通過邏輯判斷出思想內(nèi)容的正誤。

1 網(wǎng)絡(luò)編校策略

由于編輯這一特殊職業(yè)所要求對各種錯誤的判斷能力和改錯準(zhǔn)確程度,需要長期的學(xué)習(xí)與實踐才能在相關(guān)專業(yè)領(lǐng)域達到一定的編輯水平。一個人的時間精力、專業(yè)水平、文化修養(yǎng)、知識積累、判斷能力是有限的。當(dāng)編輯操作計算機上的編校軟件只能采集本人發(fā)現(xiàn)的問題,整理添加到本機上的錯詞庫,比較而言整個社會對相關(guān)文化知識的潛能是巨大的,利用互聯(lián)網(wǎng)匯集全球的編輯經(jīng)驗,共建共享網(wǎng)絡(luò)編校系統(tǒng)。將編輯工作中發(fā)現(xiàn)的各種問題收集到網(wǎng)絡(luò)語料庫,有效提高軟件的編校質(zhì)量。今后編輯書稿直接進入互聯(lián)網(wǎng)上的相關(guān)編校網(wǎng)站,把文件加載到網(wǎng)站指定的編校系統(tǒng)里,點擊相關(guān)命令按鈕進行編校工作,編校結(jié)果自動形成審核意見和文字編輯加工報告,下載意見、報告和修改好的書稿進行復(fù)審、終審。

在實際工作中遇見的編校軟件不能解決的,經(jīng)過人工發(fā)現(xiàn)的錯誤問題,整理存入網(wǎng)站的服務(wù)器指定的數(shù)據(jù)庫,待專家審核后加入網(wǎng)絡(luò)語料庫,積累和加大語料庫的容量,加強語料處理的能力。以最大程度發(fā)揮全球同行的智慧充實完善編校軟件知識庫,有關(guān)文字詞句、專業(yè)術(shù)語、人名地名等專有詞匯自動檢索比對的質(zhì)量就有較大的提升,網(wǎng)絡(luò)編校反過來又對人工編校形成有力的補充。

編校軟件根據(jù)《現(xiàn)代漢語詞典》最新版在傳統(tǒng)的二分檢索法的基礎(chǔ)上,建立索引和轉(zhuǎn)換知識庫,通過增加一個檢索過濾器提高效率。由于開發(fā)編校軟件的公司的財力、人力和知識水平有限,對語料庫的收集、整理、加工和應(yīng)用測試等環(huán)節(jié)出現(xiàn)不能滿足社會發(fā)展的需要,編校軟件借助各種專業(yè)電子詞典也不能完全解決編輯在實際工作中的問題。盡管不斷推出新的版本,始終沒有突破本地計算機的版本升級方法。最近,北京黑馬飛騰科技有限公司推出的《黑馬網(wǎng)站查錯V18版》只是對網(wǎng)站上的網(wǎng)頁文字進行檢查,將整站和指定范圍下載到本地計算機上來操作;支持html、shtml、asp、php、jsp 等各種類型網(wǎng)頁。這種V18版不是真正意義上的全球共建共享的網(wǎng)絡(luò)編校系統(tǒng)。

2 編校軟件的局限性

由于目前編校軟件主要功能和優(yōu)勢僅體現(xiàn)在詞語的編校上,在其他方面仍有局限性,還需要人工進行仔細編校。編校軟件出現(xiàn)的問題有以下幾個方面:

2.1 疑似錯誤

對疑似錯誤詞句標(biāo)注粉色待人工排疑,如:“正當(dāng)須求”、“既總發(fā)行”、“面封設(shè)計”、“函套”。

2.2 文字錯誤

①詞句的形近字錯誤,有的錯字組成的詞也是漢語中就有的詞,需要根據(jù)語言環(huán)境進行分析才能做出判斷,例如“人口”誤作“入口”,“木科”誤作“本科”,“讀法”誤作“續(xù)法”,“膠合”誤作“絞合”,“不失時機”誤作“不失時計”等。

②正確詞組在不適合的語言環(huán)境中的錯誤

如“品位”和“品味”,一般“品位”用作名詞,如“藝術(shù)品位高”,而“品味”當(dāng)動詞用,如“品味人生”。類似需要判斷的有:檢查—檢察,反映—反應(yīng),權(quán)利—權(quán)力,啟示—啟事,截止—截至等。[1]遇到這些容易誤用的詞組,需要檢查具體在語言環(huán)境中的作用。

③兩詞之間相連的詞頭和詞尾前后2字組合成錯詞或組成合理的詞時,編校軟件是不能檢查出來,如:“前后勒口”把“前后”“勒口”拆分組成“后勒”并提議改成“后勤”。

④有的專業(yè)術(shù)語中的一個字不同,所代表的概念、意義就大不一樣,如果這個字用錯,校對軟件就不能發(fā)現(xiàn)。例如,地質(zhì)學(xué)中的“侏羅紀(jì)”與“侏羅系”,“碳酸巖”與“碳酸鹽巖”,“拗陷”與“凹陷”,等等。

⑤對翻譯書稿注意人名、作品名、地名等對應(yīng)統(tǒng)一。如某書講凱恩斯在伊頓公學(xué)的某數(shù)學(xué)老師,同一個老師,卻翻出兩個名字,第79頁為“赫斯特”,第87頁為“赫思特”。[2]在文章不同位置(如摘要、正文、插圖、表格、參考文獻等)對同一對象的寫法不一致。

⑥簡繁體的正確使用

如“繁體轉(zhuǎn)簡體”的文稿:什么字可以是簡體,什么字不可以是簡體。如:“藉口”應(yīng)作“借口”,而“聲名狼藉”的“藉”不能轉(zhuǎn)為“借”;清代畫家“華喦”不能轉(zhuǎn)為“華巖”,“覆蓋”不能轉(zhuǎn)為“復(fù)蓋”,而“覆信”可轉(zhuǎn)為“復(fù)信”,“曹霑”不能轉(zhuǎn)為“曹沾”等。

⑦字母的大小寫、正斜體出現(xiàn)的錯誤,編校對軟件檢查不出來。

⑧字母與數(shù)字混淆,例如,把字母“I”當(dāng)作數(shù)字“1”, 把字母“O”當(dāng)作數(shù)字“0”。[3]

2.3 標(biāo)點符號錯誤

①該用標(biāo)點符號的地方?jīng)]有使用,例如“畫一十字”,其中的“十”字應(yīng)該加引號。

②沒有正確使用逗號,在該用頓號或分號的地方均用了逗號。軟件能將引號、括號、書名號等的錯誤顯紅,如:有前引號而無后引號的,括號套法不規(guī)范等問題顯紅,但標(biāo)點用法是否合理還需要人工去判斷。

③把冒號“:”當(dāng)作比例號“:”使用。

④把一字線“一”當(dāng)作破折號“——”使用。

⑤把“X”當(dāng)作乘號“×”使用。

2.4 公式錯誤

公式中很多錯誤都不能被編校軟件查出來,包括正體與斜體,大寫與小寫,上角標(biāo)與下角標(biāo),不符合科學(xué)規(guī)則,不符合編排規(guī)則,同一個公式在不同地方出現(xiàn)時的寫法不一致,等等。

2.5 插圖錯誤

插圖和表格的錯誤以及圖(表)位置錯誤,軟件都不能發(fā)現(xiàn)和解決插圖及表格的問題。

2.6 物理量和單位的符號錯誤

①國家標(biāo)準(zhǔn)中有明確規(guī)定的物理量,沒有使用其法定的符號。

②誤用物理量的單位,如質(zhì)量的單位誤用成kN。

③沒有使用法定單位,如長度單位用了A。計量單位的錯誤:如“加溫到42度”,其“度”應(yīng)改為“℃”或“攝氏度”;再如:(翻譯書稿)某人身高五英尺四寸,其錯在單位對應(yīng)問題上,這里“英尺”應(yīng)對“英寸”而不是“寸”等。[4]

④SI詞頭用錯,如把m寫成M. 把k寫成K . 把μ寫成u,等等。

2.7 數(shù)字的用法

編輯工作中執(zhí)行GB《出版物上數(shù)字用法的規(guī)定》。分清何時用“阿碼”,何時用“漢碼”,特別是“阿碼”書寫的數(shù)值(含小數(shù)、分數(shù)、百分數(shù)和科學(xué)計數(shù)法)不能拆分轉(zhuǎn)行。[5]

2.8 編號錯誤

如圖序、表序、層次標(biāo)題序號和參考文獻序號,等出現(xiàn)錯誤。

2.9 邏輯關(guān)系錯誤或者算式的計算錯誤

如“z=2 ,y=3 ,x>y”“1/3 338≥1/2 000”“a= 2,b=3,x=α+b=6”,等等。

2.10 病句問題

編校軟件對書稿中的思想不正確,不合邏輯、不合語法、不合修辭的錯誤無能為力。

①成分殘缺是指文稿的病句中殘缺主語、賓語、謂語的,如:從這一件平凡的小事中,說明了一個大問題?!皬摹?、“中”二字刪除即可。

②主謂配搭不當(dāng),如:由于工人甩開膀子大干,這個廠今年的生產(chǎn)任務(wù)已經(jīng)提前實現(xiàn)了。“實現(xiàn)”應(yīng)改為“完成”。

③動賓配搭不當(dāng),如:我們一定要盡量節(jié)省不必要的開支和浪費。“浪費”刪除即可。

④狀語與中心詞配搭不當(dāng),如:他深深地保持著沉默?!吧钌睢睉?yīng)改為“一直”。

⑤結(jié)構(gòu)錯亂,如:廣大知識青年表現(xiàn)了無比的學(xué)習(xí)文化科學(xué)知識熱忱。“無比的”置于“熱忱”的前面即可。

⑥用詞不當(dāng),如:老師對我們的幫助教育的事例,可真是罄竹難書??!貶義的“罄竹難書”應(yīng)改為“不勝枚舉”。

⑦呼應(yīng)混亂,如:只要經(jīng)常鍛煉,才能增強體質(zhì)。[6]“只要”應(yīng)改為“只有”。

2.11 概括問題

書中涉及的是農(nóng)民內(nèi)容,如“讓法律走進大眾生活”[7]被軟件正常通過,“大眾”應(yīng)改為“農(nóng)民”。

2.12 版面格式不規(guī)范統(tǒng)一

版面格式問題無法利用編校軟件進行檢查,如版式設(shè)計的書名、章名和頁碼在天頭,又出現(xiàn)在其他地方,各級標(biāo)題的字體、字號、色彩、空行等,只能靠人工進行核對。

3 應(yīng)對措施

3.1 單機版編校軟件,在編輯文稿之前使用編校軟件對錯誤進行粗略過濾,有的在校對環(huán)節(jié)使用。對編校軟件查出來的問題需要人工進行排疑,沒有檢查出來的還需要編輯仔細審核和編輯加工,確保在文字詞句、語法修辭、公式符號、插圖表格、版式格式、思想內(nèi)容等方面無差錯。專業(yè)詞匯編輯需要相關(guān)的知識與原則進行判斷,可以利用互聯(lián)網(wǎng)上的搜索引擎查找驗證。采用人工編輯為主與軟件編校為輔的應(yīng)對策略,解決目前編校軟件局限性的問題。

3.2 互聯(lián)網(wǎng)操作的網(wǎng)絡(luò)編校系統(tǒng)還沒有問世之前,建議采用編校軟件多機版,授權(quán)在單位局域網(wǎng)內(nèi)部使用,通過自帶的用戶庫管理系統(tǒng),擴展和使用共享用戶詞庫??蛻舳说拿總€編輯校對檢查出來的錯誤及時添加到局域網(wǎng)服務(wù)器上軟件的錯詞庫,通過集體的編輯經(jīng)驗盡可能增強對錯誤詞句的檢查力度。

3.3 建立軟件機校流程制度,在流程中出現(xiàn)的問題,及時報送相關(guān)部門處理。

3.4 編校軟件及時升級到新版本,被人工檢查出來而軟件不能發(fā)現(xiàn)的各種錯誤,發(fā)送到軟件開發(fā)公司,以便收集、整理、加工和測試,充實編校軟件語料庫的。軟件開發(fā)公司可以采取技術(shù)手段,客戶在使用軟件出現(xiàn)標(biāo)注粉色的疑似錯誤時自動發(fā)送到開發(fā)公司,由公司組織專家審核排疑。

3.5 編號一般是有規(guī)律性的,如:圖1—圖50,表1—表50,中間缺號、跳號、重號,軟件采用特定的編程就可以自動檢測出來。

3.6 插圖和表格的錯用或位置錯誤,與編號不一致問題,在計算機視覺的圖像識別沒有出來之前,只有靠編輯來核對。

3.7 對應(yīng)統(tǒng)一問題,編校軟件自動提取相近的詞和頁碼,待編輯排疑。

3.8 通過互聯(lián)網(wǎng)匯集全球的編輯經(jīng)驗,共建共享網(wǎng)絡(luò)編校系統(tǒng)是一種全新的觀念。軟件開發(fā)公司根據(jù)這一思路,策劃組織實施網(wǎng)絡(luò)編校系統(tǒng)的開發(fā),可以借鑒在線翻譯和百度百科模式。軟件開發(fā)公司可以采取客戶對語料庫的貢獻分值與網(wǎng)絡(luò)編校使用分值的值差來獲得收益。采取這一策略極大地促進網(wǎng)絡(luò)編校系統(tǒng)的建立和完善。

4 結(jié)語

單機版、多機版編校軟件向智能型網(wǎng)絡(luò)編校系統(tǒng)發(fā)展,將是出版領(lǐng)域的一場革命,改變?nèi)藗兯季S模式和工作程序。也是計算機人工智能的一次質(zhì)的飛躍,不僅是對文稿問題的智能判斷,還能促進其他領(lǐng)域的發(fā)展。

【參考文獻】

[1][2][4][5]何敏.試論出版社編輯配備校對軟件“黑馬”后,校對存在的必要性[J].校對之友,2007(4).

[3]胡曉強,黃曉紅.輔以校對軟件條件下的編校工作重點[J].編輯學(xué)報,2012(3).

[6]游本遙.常見病句的語法錯誤[J].語文教學(xué),1979(3).

[7]2003-2012年出版專業(yè)基礎(chǔ)知識(中級)試題真題與答案[J]. doc in 豆丁. http://www.docin.com/p-623720341.html.

[責(zé)任編輯:湯靜]

猜你喜歡
局限性
局限性皮膚瘙癢癥案
“拯救大地”理論的內(nèi)在邏輯、局限性與改進思路
漢德公式的局限性——《侵權(quán)責(zé)任法》第87條視角
自動化事實核查的前景及局限性
傳媒評論(2018年5期)2018-07-09 06:05:26
梅里埃API 20NE生化鑒定系統(tǒng)在布魯氏菌鑒定中的局限性
基于反身性理論對公共行政學(xué)實踐教學(xué)局限性的解讀與探析
食品檢驗在食品安全保障中的意義及其局限性分析
食品界(2016年4期)2016-02-27 07:36:27
頸動脈狹窄伴局限性皮質(zhì)腦萎縮22例臨床觀察
胸腹部局限性Castleman病的CT特征
我國公共行政的系統(tǒng)分析:可行性、必要性及局限性
新密市| 和静县| 丹寨县| 名山县| 临武县| 含山县| 玛纳斯县| 青海省| 甘孜县| 华安县| 综艺| 桑日县| 玉屏| 文成县| 蓬溪县| 搜索| 屏边| 专栏| 榆社县| 星座| 屏东县| 刚察县| 三穗县| 大悟县| 柘城县| 迁西县| 旬阳县| 沐川县| 湘乡市| 临湘市| 交城县| 台江县| 白山市| 岳池县| 新乐市| 福州市| 宁强县| 精河县| 高阳县| 深水埗区| 庆安县|