国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

關(guān)于中文拼音輸入法鍵盤(pán)字母布局的探究

2010-06-05 07:07黃金文陳斌宏何泳姝陳曉偉林慶文黃曉明
中文信息學(xué)報(bào) 2010年6期
關(guān)鍵詞:常用字右鍵工作量

黃金文,金 華,王 凡,陳斌宏,何泳姝,陳曉偉,林慶文,黃曉明

(華南師范大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,廣東 廣州 510631)

鍵盤(pán)布局設(shè)計(jì)的研究由來(lái)已久,在最初階段,鍵盤(pán)來(lái)源于打字機(jī),而鍵盤(pán)鍵位是按照字母順序排列的,但是如果打字過(guò)快會(huì)出現(xiàn)卡鍵問(wèn)題,為了解決卡鍵問(wèn)題, Christopher Latham Sholes發(fā)明了QWERTY鍵盤(pán)布局,最大限度限制敲鍵速度。此后由于鍵盤(pán)系統(tǒng)相關(guān)硬件的不斷發(fā)展,相繼出現(xiàn)了August Dvorak的DUORAK鍵盤(pán)系統(tǒng)和Lillian Malt的MALT鍵盤(pán),兩者都不同程度地提高了工作效率,但由于種種原因,都沒(méi)有得到廣泛應(yīng)用。

現(xiàn)有鍵盤(pán)的字母布局都是根據(jù)英文字母的使用情況而設(shè)計(jì)的,這對(duì)于漢字拼音快速輸入有一定的阻礙作用,而且其本身的字母布局就是不合理的。本文的主要工作是要找出現(xiàn)用鍵盤(pán)對(duì)漢字拼音輸入的不合理性,根據(jù)漢字拼音輸入的特殊性和人手功能,設(shè)計(jì)一個(gè)能夠使拼音輸入漢字科學(xué)、高效的鍵盤(pán)。早期周志農(nóng)先生的《自然碼》鍵盤(pán)設(shè)計(jì)使用的是雙拼方案,即每個(gè)漢字聲母、韻母用一個(gè)字母來(lái)表示。漢光碼漢字輸入法鍵盤(pán)布局則使用的是形碼,通過(guò)字根的統(tǒng)計(jì)和位置的優(yōu)化設(shè)計(jì)一個(gè)新的鍵盤(pán)布局,而藏文通用鍵盤(pán)布局的設(shè)計(jì)也與此類似。本文選用的是全拼方案,全拼方案?jìng)?cè)重的是單個(gè)字母的統(tǒng)計(jì)數(shù)據(jù)和使用情況,其已經(jīng)包含了大部分雙拼方案中字母的統(tǒng)計(jì)數(shù)據(jù)。因此,本課題具有極其重要的研究意義和現(xiàn)實(shí)意義。

1 文本資料的采集與統(tǒng)計(jì)

本文采用對(duì)各種題材、體裁的文本資料進(jìn)行隨機(jī)抽樣統(tǒng)計(jì)的方法,以選取的文本資料最大限度地接近我們?nèi)粘J褂玫那闆r為標(biāo)準(zhǔn)。同時(shí)為使所選取的文本資料更加全面,本文對(duì)最近兩年(2007年、2008年)的電子版文本資料中的日常報(bào)刊新聞材料、文學(xué)著作、學(xué)術(shù)論文三大類進(jìn)行隨機(jī)抽取,并把隨機(jī)抽取部分作為此次研究的文本資料來(lái)源。

第一類,日常報(bào)刊新聞材料。本文選擇政治、經(jīng)濟(jì)、文化、科技、娛樂(lè)、體育等與我們?nèi)粘I蠲芮新?lián)系的材料約254.79萬(wàn)字,占全部文本資料的53.37%。

第二類,文學(xué)著作。本文選用各種體裁的文學(xué)作品,節(jié)選自長(zhǎng)篇小說(shuō)、中篇小說(shuō)、戲劇等,以及篇幅完整的短篇小說(shuō)、散文,并且以白話文為主,約181.88萬(wàn)字,占全部文本資料的38.10%。

第三類,學(xué)術(shù)論文。本文選用有關(guān)數(shù)理化、信息、材料、生物、醫(yī)藥等自然科學(xué)及文化、教育、經(jīng)濟(jì)、法律等人文科學(xué)的論文材料約40.75萬(wàn)字,占全部文本資料的8.54%。

2 文字與拼音字母的統(tǒng)計(jì)

2.1 字?jǐn)?shù)統(tǒng)計(jì)

本文利用第三方軟件對(duì)選取的文本資料進(jìn)行統(tǒng)計(jì),所得結(jié)果為:文本總字?jǐn)?shù)為4 774 226個(gè),包括5 690個(gè)不同漢字。

2.2 常用字劃分標(biāo)準(zhǔn)

本文根據(jù)現(xiàn)有資料和研究成果,采用以下兩點(diǎn)作為常用字的劃分依據(jù):

(1) 根據(jù)文獻(xiàn)[5],可以利用常用字出現(xiàn)頻率不低于10-5的先驗(yàn)假定,即在十萬(wàn)文本資料中至少有一次出現(xiàn)機(jī)會(huì),此時(shí)若再增大一個(gè)數(shù)量級(jí),即選取百萬(wàn)文本資料,對(duì)于本文是適度的。

(2) 《現(xiàn)代漢語(yǔ)常用字表》中常用字的個(gè)數(shù)為2 500個(gè)。

根據(jù)5 690個(gè)不同漢字的使用頻數(shù)、頻率的統(tǒng)計(jì)結(jié)果研究發(fā)現(xiàn),頻數(shù)排在第2 869位與排在第 2 870位漢字的使用頻率相差一個(gè)數(shù)量級(jí),分別為10-5和10-6,與上述劃分依據(jù)相符,且其在文本資料中的覆蓋率已達(dá)到99.29%,故可判定常用字個(gè)數(shù)為2 869,而此數(shù)據(jù)與《現(xiàn)代漢語(yǔ)常用字表》中常用字個(gè)數(shù)相近,因此判定成立。因此根據(jù)以上統(tǒng)計(jì)及多方面分析的結(jié)果,本文將使用頻率排在前2 869的漢字劃分為常用字,其余為非常用字。

2.3 拼音字母統(tǒng)計(jì)

本文利用第三方軟件及自主開(kāi)發(fā)的程序,對(duì)所選取的文本資料進(jìn)行轉(zhuǎn)換和拆分處理,統(tǒng)計(jì)得出26個(gè)字母的使用頻數(shù)、頻率數(shù)據(jù)如表1所示。

表1 全部字字母使用頻數(shù)頻率表

由于常用字各字母使用頻率與全部字字母使用頻率相差不大,且其使用頻率的大小排序一致,故后文用到的數(shù)據(jù)以全部字字母使用頻率為準(zhǔn)。

表2 常用字字字母使用頻數(shù)頻率表

續(xù)表

3 有關(guān)名詞的定義

定義1設(shè)某一個(gè)漢字的拼音為a1a2…ai…an,其中ai∈{a,b,c,…,z},拼音長(zhǎng)度|a1a2…ai…an|<7,i=1,2,…,n,n∈N+,則ai在某一文本T中出現(xiàn)的次數(shù)稱為ai在T中的使用頻數(shù),又稱工作量。

定義5設(shè)某一個(gè)漢字的拼音為a1a2…ai…an,其中ai∈{a,b,c,…,z},拼音長(zhǎng)度|a1a2…an|<7,ai在拼音a1a2…an中的排列序號(hào)為K,i=1,2,…,n,K∈N+,n∈N+,若K為奇數(shù),則稱ai出現(xiàn)在奇位置,若K為偶數(shù),則稱ai出現(xiàn)在偶位置。

4 鍵盤(pán)字母排布

4.1 排布原則

確定科學(xué)有效的鍵盤(pán)字母排布原則,對(duì)隨后的字母排布方案的確定具有重要的指導(dǎo)意義,是鍵盤(pán)字母排布的關(guān)鍵一環(huán)。根據(jù)大量的文獻(xiàn)資料,國(guó)內(nèi)外的實(shí)驗(yàn)數(shù)據(jù)和實(shí)驗(yàn)結(jié)果,結(jié)合本文所研究的項(xiàng)目的實(shí)際情況,我們確立了如下排布原則:

(1) 依頻率優(yōu)先原則,頻率高者放在鍵盤(pán)中易敲打區(qū)域;

(2) 根據(jù)理論和實(shí)踐結(jié)果,結(jié)合文獻(xiàn)[3]中的數(shù)據(jù)表(見(jiàn)表3),對(duì)于各排,根據(jù)其所能承受的的負(fù)荷量及出現(xiàn)頻率的高低,按中排、上排、下排進(jìn)行排序;

表3 各手指每分鐘最多連續(xù)敲擊的次數(shù)

(3) 對(duì)于各手及各個(gè)手指,根據(jù)其靈活度及所能承擔(dān)的負(fù)荷和出現(xiàn)頻率高低,按食指、中指、無(wú)名指、小指排布;

(4) 根據(jù)工程心理學(xué)實(shí)驗(yàn)數(shù)據(jù),同一手指敲擊鍵盤(pán)運(yùn)動(dòng)的間隔平均為0.09s,同一手的不同手指之間敲擊運(yùn)動(dòng)的間隔平均為0.03s,不同手的手指之間敲擊運(yùn)動(dòng)的間隔平均為0.02s,左右手交替敲擊鍵盤(pán)的效率高于單手連續(xù)敲擊鍵盤(pán)的效率,且此種情況手指更不易疲勞,因此要盡量使敲擊動(dòng)作在左右手中交替進(jìn)行;

(5) 避免某一手指負(fù)荷過(guò)重。

4.2 排布過(guò)程

(1) 本文對(duì)拼音字母依據(jù)其出現(xiàn)頻率進(jìn)行排序處理,并對(duì)總文本資料獲得的拼音字母的相關(guān)數(shù)據(jù)做進(jìn)一步分析。由于拼音字母在奇、偶位置出現(xiàn)的頻數(shù)是判斷交替率的最主要的數(shù)據(jù),因此本文運(yùn)用程序獲得各拼音字母在奇、偶位置出現(xiàn)的頻數(shù)數(shù)據(jù),得出表4。

表4 各拼音字母在奇偶位置出現(xiàn)頻數(shù)表

(2) 對(duì)拼音字母按其使用頻率的大小先排中排,同排中先排右鍵區(qū),再排左鍵區(qū),對(duì)于局部鍵位,依據(jù)前文所述排布原則進(jìn)行最優(yōu)化處理;

(3) 上排和下排的排布也遵循過(guò)程(2);

(4) 由表4知,26個(gè)拼音字母中,16個(gè)只出現(xiàn)在奇位置,1個(gè)只出現(xiàn)在偶位置,9個(gè)在奇偶位置都有出現(xiàn),因此為了提高左右手的交替率,本文把出現(xiàn)在偶位置上的拼音字母盡可能排在同一鍵區(qū),考慮到右鍵區(qū)可排布的鍵位數(shù)少于左鍵區(qū),因此把有出現(xiàn)在偶位置上的拼音字母根據(jù)實(shí)際情況排在右鍵區(qū),即在(3)排布的基礎(chǔ)上作微調(diào);

微調(diào)后的最終鍵盤(pán)字母排布結(jié)果如下:

圖1 最終鍵盤(pán)字母排布圖

5 鍵盤(pán)的測(cè)試

本文重新設(shè)計(jì)鍵盤(pán)字母排布的目的,就是為提高拼音輸入法輸入漢字的效率,而漢字輸入的效率在排除輸入法后,最主要的就是敲擊鍵盤(pán)的效率,而敲擊鍵盤(pán)的效率又主要體現(xiàn)在手指負(fù)荷和敲擊鍵盤(pán)速度的合理性、科學(xué)性上。提高敲擊鍵盤(pán)的效率核心在于鍵盤(pán)的工作量,其次是交替率等指標(biāo)。而工作量中又以動(dòng)態(tài)工作量這一指標(biāo)最為重要。因此,本文以工作量和交替率來(lái)比較新舊鍵盤(pán)在使用拼音輸入法情況下輸入漢字效率的高低。

5.1 新鍵盤(pán)的相關(guān)數(shù)據(jù)

(1) 由于在能夠承受的負(fù)荷上:右手>左手

理論上右鍵區(qū)的工作量應(yīng)大于左鍵區(qū),但實(shí)際是右鍵區(qū)可排布拼音字母的鍵位數(shù)為11個(gè),左鍵區(qū)為15個(gè),而根據(jù)圖1的排布用程序計(jì)算出的左右鍵區(qū)靜態(tài)工作量由表5、表6表示。

表5 左右鍵區(qū)靜態(tài)工作量

表6 左右鍵區(qū)動(dòng)態(tài)工作量

因此,在工作量上左鍵區(qū)大于右鍵區(qū)是合理的,但不宜超過(guò)太多;

(2) 用程序計(jì)算出中排上排下排的靜態(tài)和動(dòng)態(tài)工作量,詳見(jiàn)表7、表8。

表7 各排靜態(tài)工作量表

表8 各排動(dòng)態(tài)工作量表

因此,在工作量上:中排>上排>下排是合理的;

(3) 由于各手指工作量的大小直接關(guān)系到我們敲擊鍵盤(pán)的效率,為此,本文利用程序計(jì)算出了八個(gè)手指的靜態(tài)工作量和動(dòng)態(tài)工作量,得出表9和表10,同時(shí)可見(jiàn)圖2和圖3。

(4) 左右手都放寬條件下總共符合左右手交替進(jìn)行的漢字有4 258個(gè),其交替率為:0.748 33。

表9 八個(gè)手指的靜態(tài)工作量

圖2 各手指靜態(tài)工作量對(duì)比圖

表10 八個(gè)手指的動(dòng)態(tài)工作量

圖3 各手指動(dòng)態(tài)工作量對(duì)比圖

5.2 舊鍵盤(pán)的相關(guān)數(shù)據(jù)

(1) 本文利用程序計(jì)算出舊拼音字母排布鍵盤(pán)的靜態(tài)動(dòng)態(tài)工作量,見(jiàn)表11和12,同時(shí)可見(jiàn)圖4和圖5。

表11 舊鍵盤(pán)排布靜態(tài)工作量

圖4 舊鍵盤(pán)排布靜態(tài)工作量對(duì)比圖

表12 舊鍵盤(pán)排布的動(dòng)態(tài)工作量

圖5 舊鍵盤(pán)排布的動(dòng)態(tài)工作量對(duì)比圖

(2) 左右手都放寬條件下總共符合左右手交替進(jìn)行的漢字有4 261個(gè),其交替率為:0.748 858;

(3) 舊鍵盤(pán)的不合理性

舊鍵盤(pán)動(dòng)態(tài)工作量中,其不合理之處表現(xiàn)為:

① 右手負(fù)責(zé)的鍵位數(shù)為11個(gè),左手負(fù)責(zé)的鍵位數(shù)為15個(gè),右鍵區(qū)總工作量為7 969 143,遠(yuǎn)大于左鍵區(qū)的6 407 230;

② 右鍵區(qū)右手工作量為4 791 085,左手工作量為1 656 131,兩者之比為2.89,比值過(guò)大;

③ 右鍵區(qū)小指工作量為54 662,與相同鍵區(qū)的無(wú)名指工作量之比為1∶19.55,與左鍵區(qū)小指工作量之比為1∶38.36,比值過(guò)于懸殊;

④ 左鍵區(qū)小指工作量為2 097 153,大于所在鍵區(qū)其它任一手指的工作量;

⑤ 左鍵區(qū)中指工作量為1 792 673,大于食指工作量1 656 131。

舊鍵盤(pán)的靜態(tài)工作量中,其不合理之處與動(dòng)態(tài)工作量中的①,②,③,④相同。

5.3 新舊鍵盤(pán)的比較

(1) 右鍵區(qū)中,食指中指無(wú)名指小指負(fù)責(zé)的鍵位數(shù)分別是6,2,2,1,因此它們理論上的最大工作量比值為:

max(食指∶中指)=3∶1

max(無(wú)名指∶中指)=1∶1

max(無(wú)名指∶小指)=2∶1

左鍵區(qū)中,食指中指無(wú)名指小指負(fù)責(zé)的鍵位數(shù)分別是6,3,3,3,因此它們理論上的最大工作量比值為:

max(食指∶中指)=2∶1

max(無(wú)名指∶中指)=1∶1

max(小指∶無(wú)名指)=1∶1

從上述分析及前文數(shù)據(jù)可知,新鍵盤(pán)符合上述條件,而舊鍵盤(pán)則不完全符合。

(2) 由于食指所能承受的負(fù)荷大于中指的負(fù)荷,則對(duì)于總工作量來(lái)說(shuō),食指大于中指是合理的,但我們以上計(jì)算的只是各手指的顯式工作量,并未計(jì)算手指在各鍵位之間頻繁移動(dòng)所產(chǎn)生的隱式工作量,而食指由于移動(dòng)范圍大,其隱式工作量是大于其余各手指的隱式工作量的,因此,右手食指與中指的最大顯式工作量之比max(食指∶中指)應(yīng)遠(yuǎn)小于3∶1,同樣,無(wú)名指與小指最大顯式工作量之比max(無(wú)名指∶小指)也應(yīng)小于2∶1,而中指所能承受的的負(fù)荷大于無(wú)名指的負(fù)荷,則中指與無(wú)名指最大顯式工作量之比max(中指∶無(wú)名指)應(yīng)大于1∶1。

對(duì)于左手,食指與中指最大顯式工作量之比也應(yīng)小于2∶1,其余手指之間最大顯式工作量之比約為1∶1即為合理。

從上述分析及前文數(shù)據(jù)可知,新鍵盤(pán)符合性較舊鍵盤(pán)好。

(3) 根據(jù)前文數(shù)據(jù),得出新舊鍵盤(pán)工作量對(duì)比圖,見(jiàn)圖6和圖7。

圖6 新舊鍵盤(pán)靜態(tài)工作量對(duì)比圖

圖7 新舊鍵盤(pán)動(dòng)態(tài)工作量對(duì)比圖

從上述圖表分析可知,舊鍵盤(pán)各手指間的工作量與實(shí)際負(fù)荷偏差過(guò)大,而新鍵盤(pán)工作量與各手指實(shí)際負(fù)荷的符合性則相對(duì)較好。

(4) 雖然新鍵盤(pán)左右手都放寬條件下的交替率為:0.748 33,并未高于舊鍵盤(pán)的0.748 858,但舊鍵盤(pán)的字母排布具有隨機(jī)性,而這種隨機(jī)性使得字母在鍵盤(pán)上的分布更均勻,反而可能會(huì)使交替率更高。即便如此,新鍵盤(pán)左右手都放寬條件下的交替率已經(jīng)達(dá)到比較高的水平了。

5.4 測(cè)試結(jié)論

從相關(guān)數(shù)據(jù)及圖表分析得知,現(xiàn)用鍵盤(pán)在靜態(tài)和動(dòng)態(tài)工作量方面都未能很好的符合各個(gè)手指的實(shí)際可承受負(fù)荷量,左右鍵區(qū)和一部分手指工作量之間的比值過(guò)大,而新鍵盤(pán)布局依食指、中指、無(wú)名指、小指呈線性遞減關(guān)系,較好地符合各手指實(shí)際可承受負(fù)荷量,并且左右手放寬條件下的交替率為0.748 33,已經(jīng)達(dá)到較高水平。

綜合以上數(shù)據(jù),我們可以確定新的鍵盤(pán)字母排布比舊的鍵盤(pán)字母排布在使用拼音輸入法輸入漢字方面更為合理。

[1] 盧亞軍.藏文計(jì)算機(jī)通用鍵盤(pán)布局與輸入法研究[J].中文信息學(xué)報(bào),2006, 20(2):78-86.

[2] 楊道沅,董小國(guó),董紅,陳丹.《自然碼》雙拼鍵盤(pán)設(shè)計(jì)合理的研究[J].中文信息學(xué)報(bào),1994, 8(1):1-14.

[3] 張澤全.漢光碼漢字輸入法的鍵盤(pán)分布研究[J].河南師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2001. 29(3):83-87.

[4] 湯步洲,王曉龍,王軒,張強(qiáng).語(yǔ)句級(jí)漢字拼音輸入技術(shù)評(píng)估方法的研究[J].中文信息學(xué)報(bào),2008, 22(5):52-55.

[5] 北京語(yǔ)言學(xué)院教學(xué)研究所.現(xiàn)代漢語(yǔ)頻率詞典[M].北京.北京語(yǔ)言學(xué)院出版社,1986.6.

[6] 國(guó)家語(yǔ)言文字工作委員會(huì)漢字處.現(xiàn)代漢語(yǔ)常用字表[M].北京. 語(yǔ)文出版社,1988.1.

[7] 楊道沅,李棣.漢字輸入鍵盤(pán)設(shè)計(jì)方法的研究——兼論標(biāo)準(zhǔn)漢字雙拼鍵盤(pán)的設(shè)計(jì)[J].中文信息學(xué)報(bào),1997, 11(3):1-12.

[8] 王永民.計(jì)算機(jī)漢字鍵盤(pán)設(shè)計(jì)“三原理”——論計(jì)算機(jī)中文鍵盤(pán)的設(shè)計(jì),計(jì)算機(jī)學(xué)報(bào),2005, 28(5):870-881.

猜你喜歡
常用字右鍵工作量
嵌入式系統(tǒng)軟件工作量多源線性估算方法仿真
輕松整理Win10右鍵菜單
關(guān)于常用字覆蓋率統(tǒng)計(jì)算法的研究
自定義“開(kāi)始”右鍵控制菜單
用右鍵菜單管理右鍵菜單
思科發(fā)布云計(jì)算市場(chǎng)發(fā)展報(bào)告
給Windows 10右鍵菜單做“手術(shù)”
談常用字詞的選取及其等級(jí)劃分
網(wǎng)上互動(dòng)教學(xué)工作量管理的困境及對(duì)策
常用字辨正——“己-巳-已”
禄劝| 海口市| 如东县| 罗山县| 虹口区| 桓台县| 交城县| 平乐县| 司法| 曲阜市| 芷江| 义马市| 梅州市| 高阳县| 潍坊市| 邵东县| 罗定市| 白河县| 陇南市| 象州县| 凤凰县| 平陆县| 碌曲县| 台前县| 北宁市| 和静县| 仁怀市| 会同县| 肥乡县| 镇原县| 武定县| 徐汇区| 留坝县| 大城县| 普兰店市| 甘洛县| 德惠市| 莒南县| 临江市| 阿合奇县| 香河县|