俞木發(fā)
類(lèi)似從百度知道中復(fù)制網(wǎng)頁(yè)內(nèi)容時(shí)出現(xiàn)的多余字符,其實(shí)是網(wǎng)站設(shè)置的一些代碼,增加的這些看似“多余”的字符,是制作者不希望讀者直接引用該內(nèi)容,因此這些復(fù)制的內(nèi)容只適合作為個(gè)人的參考資料,不適合發(fā)表。我們?cè)谑褂脮r(shí)需要注意這個(gè)問(wèn)題。
這些代碼不會(huì)在正常的網(wǎng)頁(yè)中顯示其內(nèi)容,但復(fù)制粘貼后會(huì)顯露出來(lái)。比如圖1的例子,在網(wǎng)頁(yè)中右擊并選擇“查看網(wǎng)頁(yè)源代碼”,在打開(kāi)的頁(yè)面中就可以看到在“簡(jiǎn)單”和“來(lái)說(shuō)”之間有段代碼,屬性值是“hidden”(即隱藏),代碼是“2112”(對(duì)應(yīng)“bai”),這些代碼所對(duì)應(yīng)的內(nèi)容會(huì)在粘貼為文本形式后自動(dòng)顯示(圖2)。
既然多余字符是由于網(wǎng)頁(yè)中的代碼導(dǎo)致的,如果要解決這個(gè)問(wèn)題,我們就需要根據(jù)不同的需求對(duì)代碼進(jìn)行處理。
方法1:使用瀏覽器組件屏蔽代碼
現(xiàn)在很多瀏覽器都有“沉浸式閱讀器”,在這個(gè)模式下會(huì)自動(dòng)屏蔽上述代碼。以在新核心的Edge中復(fù)制知乎頁(yè)面的內(nèi)容為例,當(dāng)我們?cè)陧?yè)面上直接復(fù)制文本后,粘貼的文本沒(méi)有換行格式,而且會(huì)在內(nèi)容的最后自動(dòng)加上版權(quán)字段。如果在打開(kāi)的頁(yè)面中點(diǎn)擊地址欄后的“沉浸式閱讀器”按鈕,進(jìn)入該模式后再進(jìn)行復(fù)制,粘貼后就不會(huì)有這些字符了(圖3)。
如果網(wǎng)頁(yè)(如上述的百度知道頁(yè)面)不支持“沉浸式閱讀器”,我們還可以在網(wǎng)頁(yè)中按下“Ctrl+A”組合鍵全選內(nèi)容(或者使用鼠標(biāo)選中需要復(fù)制的內(nèi)容),接著在網(wǎng)頁(yè)中右擊并選擇“在沉浸式閱讀器中打開(kāi)”,手動(dòng)設(shè)置網(wǎng)頁(yè)使用沉浸式閱讀器瀏覽(圖4)。
此外,我們還可以使用打印模式進(jìn)行復(fù)制,依次點(diǎn)擊Edge瀏覽器右上角的“…→打印”,接著在打開(kāi)的打印窗口中進(jìn)行文章的復(fù)制即可(在這個(gè)頁(yè)面中也會(huì)自動(dòng)屏蔽上述代碼)(圖5)。
方法2:使用插件自動(dòng)去除代碼
如果覺(jué)得上述的方法麻煩,那么還可以使用插件來(lái)去除。比如Edge的用戶(hù),可在擴(kuò)展商店中搜索并安裝“Tampermonkey”,啟動(dòng)該插件后點(diǎn)擊“+”新建一個(gè)腳本,在腳本編輯頁(yè)中按下“Ctrl+A”組合鍵全選默認(rèn)的內(nèi)容并刪除。接著到“https://greasyfork.org/en/scripts/415814”下載腳本,下載后使用記事本打開(kāi)并全選內(nèi)容進(jìn)行復(fù)制,接著粘貼到“Tampermonkey”的新建腳本窗口中,保存后即可使用(圖6)。之后再打開(kāi)百度知道頁(yè)面,按下F5鍵刷新頁(yè)面,再次復(fù)制內(nèi)容,其中就不會(huì)包含那些字符了。
如果要去除類(lèi)似知乎網(wǎng)站復(fù)制后自帶的字符,則可以使用CopyAsPlainText插件(同樣在Edge插件商店中搜索并安裝即可)。完成插件的安裝后,在需要復(fù)制文本時(shí)右擊并選擇“CopyAsPlainText”,這樣粘貼后就是選擇的文本了(圖7)。
方法3:使用Word查找替換
很多朋友喜歡將資料粘貼到Word中保存和整理,利用Word的“查找和替換”功能也可以快速完成整理操作。比如當(dāng)需要將百度知道中多余的字符刪除時(shí),可在網(wǎng)頁(yè)中選中需要復(fù)制的資料,接著使用鼠標(biāo)將選擇的內(nèi)容拖拽到Word窗口中。拖拽完成后,在Word窗口中可以看到,其中字體為微軟雅黑、字號(hào)為1的內(nèi)容就是“bai、du、zhi、dao”這類(lèi)的多余字符(這里為了方便文章顯示,手動(dòng)將“dao”設(shè)置成了二號(hào)字體顯示),因此要?jiǎng)h除這些內(nèi)容,我們只要將字號(hào)為1的內(nèi)容替換為空即可(圖8)。
具體方法是,點(diǎn)擊“ 查找和替換”,點(diǎn)擊“查找”下的“格式→字體”,在打開(kāi)的窗口中,字體選擇微軟雅黑、字號(hào)選擇1,替換為留空,點(diǎn)擊“全部替換”即可(圖9)。