謝松興 蒙宗燦 盤俊春
教師們都碰到過想要從圖片中把需要的文字復(fù)制到可編輯的Word文檔中。常用的解決辦法要么全手工鍵盤錄入,但是費時費力,易出錯;要么通過訊飛輸入、袋鼠輸入等語音識別APP或軟件,通過語音轉(zhuǎn)文字方式,前提是普通話相對標準識別率才比較高;也還可以利用QQ截圖文字識別或微信小程序,如傳圖識字等小工具,聯(lián)通網(wǎng)絡(luò)后拍照上傳識別,再通過計算機逐行選擇文字復(fù)制,最后發(fā)送到Word里進行編輯,但缺點是不能一次選擇全文識別,而且要兼顧手機和計算機幾方面操作,流程復(fù)雜、效率不高;省事的還可以利用專業(yè)的軟件,如風(fēng)云PDF轉(zhuǎn)換器、WPS會員版等進行識別轉(zhuǎn)換,但是費用不低。那么有沒有免費的中文英文識別,理科公式識別軟件呢?今天就介紹兩款十分出色的OCR識別工具:天若文字識別軟件和Mathpix。
● 天若OCR文字識別的主要功能及特點
天若OCR文字識別工具是一款十分強大的文字智能識別軟件,擁有圖片識別、PDF識別、屏幕取色、屏幕錄像、截圖、貼圖、錄制Gif、文本翻譯和段落排版等功能。專業(yè)版還增加了識別豎排、識別公式、識別表格、識別三線表、傾斜矯正等一系列功能,可以幫您減少重復(fù)勞動、助您提高工作效率。
天若OCR文字識別的下載地址是https://www.pcsoft.com.cn/soft/175155.html。下載安裝好后打開的界面如圖1所示。
天若OCR文字識別界面很簡單,軟件有以下主要功能及特點:
(1)圖片識別:JPG、BMP、PNG、TIF等格式圖片識別為TXT;高效的識別各類復(fù)雜字體。
(2)PDF識別:支持普通PDF文件,PDF掃描件、加密的PDF文件進行掃描識別。
(3)文字識別后再加工的功能很強大,如置頂功能、字體功能和朗讀功能等等十多項文字編輯功能。
● 利用天若OCR文字識別工具進行圖片文字轉(zhuǎn)換
天若OCR文字識別簡單易用,使用之前我們先確保計算機都處于網(wǎng)絡(luò)聯(lián)接狀態(tài)。具體操作步驟如下:
(1)先單擊軟件圖標啟動軟件,在計算機右下方對著天若軟件圖標雙擊鼠標左鍵開始截圖識別功能,如圖2所示。
(2)利用十字形標志的光標選定預(yù)識別PDF文檔或者圖片形式的文檔, 可以一次選擇一整頁A4紙張,也可以根據(jù)需要按段落或者幾行文字選擇好,截圖之后松開左鍵即可。完成識別,段落識別圖片,越清晰越準確,識別率高達98%;
(3)識別好中文或英文及一些公式在天若軟件以記事本形式呈現(xiàn),識別速度由計算機使用網(wǎng)絡(luò)情況而定,用時一般是1~6秒即可完成;
(4)在天若軟件工具欄,可以對轉(zhuǎn)化好的文字進行適當?shù)呐虐姘ㄗ煮w、顏色、加粗、錯別字識別,自動分欄操作,工具欄還有很多強大功能包括中英文翻譯,朗誦錄音等;
(5)最后把識別好的中文或英文理科公式,復(fù)制到Word文檔中,加以自主編輯使用即可,文字識別完畢,如圖3所示。
總之,天若文字識別軟件對中英文識別效果好,易操作,識別成功率高,能力強大,基本上可以滿足文科教師的所有要求,唯一遺憾的是對圖畫插圖識別沒有能夠直接引用成插圖原圖,那么我們只需要把截圖配上文檔當中去就可以形成講義。
前面我們利用天若文字識別軟件解決了文科類教師最大的文字錄入、轉(zhuǎn)換的問題,我們發(fā)現(xiàn)天若文字識別軟件對中英文識別成功率高,但是對理科公式識別會出現(xiàn)亂碼,不能直接復(fù)制利用,如圖4所示,因此很多教師只能采用打開數(shù)學(xué)公式編輯通過手工錄入的方法進行公式錄入。
有什么方法可以幫助理科教師,有什么方法可以快速錄入公式和理科符號,提高工作效率呢?下面推薦理科公式精準識別的利器Mathpix軟件。
Mathpix是一款十分出色的OCR公式識別工具,Mathpix界面美觀大方,功能強勁實用,能夠識別理科符合數(shù)學(xué)公式,然后將它轉(zhuǎn)換成LaTeX編輯器的代碼,使用起來簡單便捷。下載地址:http://www.downza.cn/soft/275117.html。
使用Mathpix前,首先要在官網(wǎng)上注冊帳號,得到鏈接后,每個月每個注冊賬號可以免費使用500次,若次數(shù)不夠有可以多用不同郵箱注冊,即可免費使用,若從事文檔編輯工作經(jīng)常大量使用的建議注冊會員繳費使用次數(shù)更多。如圖5所示為注冊界面。
● Mathpix的主要功能及特點
Mathpix是一個十分強大的排版系統(tǒng),除了能編寫數(shù)學(xué)公式,還能非常完整的撰寫學(xué)術(shù)論文,并且被國際各大機構(gòu)接受,但一直以入門難著稱。今天我們主要想介紹它的文字識別功能和公式識別功能。軟件有以下主要功能及特點:
(1)Mathpix 能夠直接截取數(shù)學(xué)公式的圖片,轉(zhuǎn)換為 LaTeX 語法,非常簡單方便,并且支持蘋果、windows、Linux三大主流系統(tǒng);
(2)可以截圖識別中文和公式;
(3)可以先手工書寫純證明過程中的公式等信息,手機拍照上傳計算機端,通過軟件截圖,能夠識別公式然后將它轉(zhuǎn)換成LaTeX編輯器的代碼。
● 利用Mahpix軟件識別PDF格式下數(shù)學(xué)試卷轉(zhuǎn)換成Word格式
Mathpix簡單易用,具體操作步驟如下:
(1)啟動Mahpix軟件:通過輸入鍵盤快捷鍵蘋果計算機上是Ctrl ++ M、在Windows和Linux上按Ctrl+Alt+M,如圖6所示軟件啟動界面。
(2)利用Mahpix軟件捕獲公式:在待轉(zhuǎn)換PDF文檔或者圖片里,鼠標左鍵單擊選定區(qū)域,只需單擊并拖動松開左鍵即可完成捕獲;如圖7所示為截圖識別后的效果。
(3)編輯:其中中文可以全識別,數(shù)學(xué)公式以latex代碼格式呈現(xiàn),很容易從任務(wù)欄直接選擇所需的格式,若需要在Word文檔對識別后文件加工,點擊Copy MS Word 按鍵即可對文檔全選復(fù)制,進行編輯等。
(4)粘貼:將latex代碼導(dǎo)入任何兼容的編輯器,它已經(jīng)被復(fù)制到你的剪貼板了,最后粘貼到Word文檔效果如圖8所示。
(5)latex代碼轉(zhuǎn)變?yōu)閿?shù)學(xué)編輯器MathType中的公式:將latex代碼復(fù)制粘貼到數(shù)學(xué)公式編輯器MathType中實現(xiàn)公式最后轉(zhuǎn)換,然后把多余的符號文字引用符去掉就直接可以使用。如圖9所示是復(fù)制到Word后的界面。
總之,兩個軟件各有專長,天若OCR文字識別對中英文文檔識別效果好,Mahpix軟件理科公式識別轉(zhuǎn)換效果好,經(jīng)過識別,PDF文檔和圖片公式里文字和公式都能在Word文檔中加工編排,完美解決了手工輸入的低效率和費時費力的問題。利用這兩個軟件對電子文檔進行識別,公式識別率高,準確度很不錯,極大的方便的理科教師對格式轉(zhuǎn)換編輯的需求,會給教育教學(xué)帶來極大的便利。
基金項目:本文為廣西教育科學(xué)“十三五”規(guī)劃2019年度課題“‘互聯(lián)網(wǎng)+背景下大數(shù)據(jù)與云計算技術(shù)工具與學(xué)科教學(xué)融合的實踐研究”(課題編號:2019C429)的階段性研究成果。