黃金文,金 華,王 凡,陳斌宏,何泳姝,陳曉偉,林慶文,黃曉明
(華南師范大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,廣東 廣州 510631)
鍵盤(pán)布局設(shè)計(jì)的研究由來(lái)已久,在最初階段,鍵盤(pán)來(lái)源于打字機(jī),而鍵盤(pán)鍵位是按照字母順序排列的,但是如果打字過(guò)快會(huì)出現(xiàn)卡鍵問(wèn)題,為了解決卡鍵問(wèn)題, Christopher Latham Sholes發(fā)明了QWERTY鍵盤(pán)布局,最大限度限制敲鍵速度。此后由于鍵盤(pán)系統(tǒng)相關(guān)硬件的不斷發(fā)展,相繼出現(xiàn)了August Dvorak的DUORAK鍵盤(pán)系統(tǒng)和Lillian Malt的MALT鍵盤(pán),兩者都不同程度地提高了工作效率,但由于種種原因,都沒(méi)有得到廣泛應(yīng)用。
現(xiàn)有鍵盤(pán)的字母布局都是根據(jù)英文字母的使用情況而設(shè)計(jì)的,這對(duì)于漢字拼音快速輸入有一定的阻礙作用,而且其本身的字母布局就是不合理的。本文的主要工作是要找出現(xiàn)用鍵盤(pán)對(duì)漢字拼音輸入的不合理性,根據(jù)漢字拼音輸入的特殊性和人手功能,設(shè)計(jì)一個(gè)能夠使拼音輸入漢字科學(xué)、高效的鍵盤(pán)。早期周志農(nóng)先生的《自然碼》鍵盤(pán)設(shè)計(jì)使用的是雙拼方案,即每個(gè)漢字聲母、韻母用一個(gè)字母來(lái)表示。漢光碼漢字輸入法鍵盤(pán)布局則使用的是形碼,通過(guò)字根的統(tǒng)計(jì)和位置的優(yōu)化設(shè)計(jì)一個(gè)新的鍵盤(pán)布局,而藏文通用鍵盤(pán)布局的設(shè)計(jì)也與此類似。本文選用的是全拼方案,全拼方案?jìng)?cè)重的是單個(gè)字母的統(tǒng)計(jì)數(shù)據(jù)和使用情況,其已經(jīng)包含了大部分雙拼方案中字母的統(tǒng)計(jì)數(shù)據(jù)。因此,本課題具有極其重要的研究意義和現(xiàn)實(shí)意義。
本文采用對(duì)各種題材、體裁的文本資料進(jìn)行隨機(jī)抽樣統(tǒng)計(jì)的方法,以選取的文本資料最大限度地接近我們?nèi)粘J褂玫那闆r為標(biāo)準(zhǔn)。同時(shí)為使所選取的文本資料更加全面,本文對(duì)最近兩年(2007年、2008年)的電子版文本資料中的日常報(bào)刊新聞材料、文學(xué)著作、學(xué)術(shù)論文三大類進(jìn)行隨機(jī)抽取,并把隨機(jī)抽取部分作為此次研究的文本資料來(lái)源。
第一類,日常報(bào)刊新聞材料。本文選擇政治、經(jīng)濟(jì)、文化、科技、娛樂(lè)、體育等與我們?nèi)粘I蠲芮新?lián)系的材料約254.79萬(wàn)字,占全部文本資料的53.37%。
第二類,文學(xué)著作。本文選用各種體裁的文學(xué)作品,節(jié)選自長(zhǎng)篇小說(shuō)、中篇小說(shuō)、戲劇等,以及篇幅完整的短篇小說(shuō)、散文,并且以白話文為主,約181.88萬(wàn)字,占全部文本資料的38.10%。
第三類,學(xué)術(shù)論文。本文選用有關(guān)數(shù)理化、信息、材料、生物、醫(yī)藥等自然科學(xué)及文化、教育、經(jīng)濟(jì)、法律等人文科學(xué)的論文材料約40.75萬(wàn)字,占全部文本資料的8.54%。
本文利用第三方軟件對(duì)選取的文本資料進(jìn)行統(tǒng)計(jì),所得結(jié)果為:文本總字?jǐn)?shù)為4 774 226個(gè),包括5 690個(gè)不同漢字。
本文根據(jù)現(xiàn)有資料和研究成果,采用以下兩點(diǎn)作為常用字的劃分依據(jù):
(1) 根據(jù)文獻(xiàn)[5],可以利用常用字出現(xiàn)頻率不低于10-5的先驗(yàn)假定,即在十萬(wàn)文本資料中至少有一次出現(xiàn)機(jī)會(huì),此時(shí)若再增大一個(gè)數(shù)量級(jí),即選取百萬(wàn)文本資料,對(duì)于本文是適度的。
(2) 《現(xiàn)代漢語(yǔ)常用字表》中常用字的個(gè)數(shù)為2 500個(gè)。
根據(jù)5 690個(gè)不同漢字的使用頻數(shù)、頻率的統(tǒng)計(jì)結(jié)果研究發(fā)現(xiàn),頻數(shù)排在第2 869位與排在第 2 870位漢字的使用頻率相差一個(gè)數(shù)量級(jí),分別為10-5和10-6,與上述劃分依據(jù)相符,且其在文本資料中的覆蓋率已達(dá)到99.29%,故可判定常用字個(gè)數(shù)為2 869,而此數(shù)據(jù)與《現(xiàn)代漢語(yǔ)常用字表》中常用字個(gè)數(shù)相近,因此判定成立。因此根據(jù)以上統(tǒng)計(jì)及多方面分析的結(jié)果,本文將使用頻率排在前2 869的漢字劃分為常用字,其余為非常用字。
本文利用第三方軟件及自主開(kāi)發(fā)的程序,對(duì)所選取的文本資料進(jìn)行轉(zhuǎn)換和拆分處理,統(tǒng)計(jì)得出26個(gè)字母的使用頻數(shù)、頻率數(shù)據(jù)如表1所示。
表1 全部字字母使用頻數(shù)頻率表
由于常用字各字母使用頻率與全部字字母使用頻率相差不大,且其使用頻率的大小排序一致,故后文用到的數(shù)據(jù)以全部字字母使用頻率為準(zhǔn)。
表2 常用字字字母使用頻數(shù)頻率表
續(xù)表
定義1設(shè)某一個(gè)漢字的拼音為a1a2…ai…an,其中ai∈{a,b,c,…,z},拼音長(zhǎng)度|a1a2…ai…an|<7,i=1,2,…,n,n∈N+,則ai在某一文本T中出現(xiàn)的次數(shù)稱為ai在T中的使用頻數(shù),又稱工作量。
定義5設(shè)某一個(gè)漢字的拼音為a1a2…ai…an,其中ai∈{a,b,c,…,z},拼音長(zhǎng)度|a1a2…an|<7,ai在拼音a1a2…an中的排列序號(hào)為K,i=1,2,…,n,K∈N+,n∈N+,若K為奇數(shù),則稱ai出現(xiàn)在奇位置,若K為偶數(shù),則稱ai出現(xiàn)在偶位置。
確定科學(xué)有效的鍵盤(pán)字母排布原則,對(duì)隨后的字母排布方案的確定具有重要的指導(dǎo)意義,是鍵盤(pán)字母排布的關(guān)鍵一環(huán)。根據(jù)大量的文獻(xiàn)資料,國(guó)內(nèi)外的實(shí)驗(yàn)數(shù)據(jù)和實(shí)驗(yàn)結(jié)果,結(jié)合本文所研究的項(xiàng)目的實(shí)際情況,我們確立了如下排布原則:
(1) 依頻率優(yōu)先原則,頻率高者放在鍵盤(pán)中易敲打區(qū)域;
(2) 根據(jù)理論和實(shí)踐結(jié)果,結(jié)合文獻(xiàn)[3]中的數(shù)據(jù)表(見(jiàn)表3),對(duì)于各排,根據(jù)其所能承受的的負(fù)荷量及出現(xiàn)頻率的高低,按中排、上排、下排進(jìn)行排序;
表3 各手指每分鐘最多連續(xù)敲擊的次數(shù)
(3) 對(duì)于各手及各個(gè)手指,根據(jù)其靈活度及所能承擔(dān)的負(fù)荷和出現(xiàn)頻率高低,按食指、中指、無(wú)名指、小指排布;
(4) 根據(jù)工程心理學(xué)實(shí)驗(yàn)數(shù)據(jù),同一手指敲擊鍵盤(pán)運(yùn)動(dòng)的間隔平均為0.09s,同一手的不同手指之間敲擊運(yùn)動(dòng)的間隔平均為0.03s,不同手的手指之間敲擊運(yùn)動(dòng)的間隔平均為0.02s,左右手交替敲擊鍵盤(pán)的效率高于單手連續(xù)敲擊鍵盤(pán)的效率,且此種情況手指更不易疲勞,因此要盡量使敲擊動(dòng)作在左右手中交替進(jìn)行;
(5) 避免某一手指負(fù)荷過(guò)重。
(1) 本文對(duì)拼音字母依據(jù)其出現(xiàn)頻率進(jìn)行排序處理,并對(duì)總文本資料獲得的拼音字母的相關(guān)數(shù)據(jù)做進(jìn)一步分析。由于拼音字母在奇、偶位置出現(xiàn)的頻數(shù)是判斷交替率的最主要的數(shù)據(jù),因此本文運(yùn)用程序獲得各拼音字母在奇、偶位置出現(xiàn)的頻數(shù)數(shù)據(jù),得出表4。
表4 各拼音字母在奇偶位置出現(xiàn)頻數(shù)表
(2) 對(duì)拼音字母按其使用頻率的大小先排中排,同排中先排右鍵區(qū),再排左鍵區(qū),對(duì)于局部鍵位,依據(jù)前文所述排布原則進(jìn)行最優(yōu)化處理;
(3) 上排和下排的排布也遵循過(guò)程(2);
(4) 由表4知,26個(gè)拼音字母中,16個(gè)只出現(xiàn)在奇位置,1個(gè)只出現(xiàn)在偶位置,9個(gè)在奇偶位置都有出現(xiàn),因此為了提高左右手的交替率,本文把出現(xiàn)在偶位置上的拼音字母盡可能排在同一鍵區(qū),考慮到右鍵區(qū)可排布的鍵位數(shù)少于左鍵區(qū),因此把有出現(xiàn)在偶位置上的拼音字母根據(jù)實(shí)際情況排在右鍵區(qū),即在(3)排布的基礎(chǔ)上作微調(diào);
微調(diào)后的最終鍵盤(pán)字母排布結(jié)果如下:
圖1 最終鍵盤(pán)字母排布圖
本文重新設(shè)計(jì)鍵盤(pán)字母排布的目的,就是為提高拼音輸入法輸入漢字的效率,而漢字輸入的效率在排除輸入法后,最主要的就是敲擊鍵盤(pán)的效率,而敲擊鍵盤(pán)的效率又主要體現(xiàn)在手指負(fù)荷和敲擊鍵盤(pán)速度的合理性、科學(xué)性上。提高敲擊鍵盤(pán)的效率核心在于鍵盤(pán)的工作量,其次是交替率等指標(biāo)。而工作量中又以動(dòng)態(tài)工作量這一指標(biāo)最為重要。因此,本文以工作量和交替率來(lái)比較新舊鍵盤(pán)在使用拼音輸入法情況下輸入漢字效率的高低。
(1) 由于在能夠承受的負(fù)荷上:右手>左手
理論上右鍵區(qū)的工作量應(yīng)大于左鍵區(qū),但實(shí)際是右鍵區(qū)可排布拼音字母的鍵位數(shù)為11個(gè),左鍵區(qū)為15個(gè),而根據(jù)圖1的排布用程序計(jì)算出的左右鍵區(qū)靜態(tài)工作量由表5、表6表示。
表5 左右鍵區(qū)靜態(tài)工作量
表6 左右鍵區(qū)動(dòng)態(tài)工作量
因此,在工作量上左鍵區(qū)大于右鍵區(qū)是合理的,但不宜超過(guò)太多;
(2) 用程序計(jì)算出中排上排下排的靜態(tài)和動(dòng)態(tài)工作量,詳見(jiàn)表7、表8。
表7 各排靜態(tài)工作量表
表8 各排動(dòng)態(tài)工作量表
因此,在工作量上:中排>上排>下排是合理的;
(3) 由于各手指工作量的大小直接關(guān)系到我們敲擊鍵盤(pán)的效率,為此,本文利用程序計(jì)算出了八個(gè)手指的靜態(tài)工作量和動(dòng)態(tài)工作量,得出表9和表10,同時(shí)可見(jiàn)圖2和圖3。
(4) 左右手都放寬條件下總共符合左右手交替進(jìn)行的漢字有4 258個(gè),其交替率為:0.748 33。
表9 八個(gè)手指的靜態(tài)工作量
圖2 各手指靜態(tài)工作量對(duì)比圖
表10 八個(gè)手指的動(dòng)態(tài)工作量
圖3 各手指動(dòng)態(tài)工作量對(duì)比圖
(1) 本文利用程序計(jì)算出舊拼音字母排布鍵盤(pán)的靜態(tài)動(dòng)態(tài)工作量,見(jiàn)表11和12,同時(shí)可見(jiàn)圖4和圖5。
表11 舊鍵盤(pán)排布靜態(tài)工作量
圖4 舊鍵盤(pán)排布靜態(tài)工作量對(duì)比圖
表12 舊鍵盤(pán)排布的動(dòng)態(tài)工作量
圖5 舊鍵盤(pán)排布的動(dòng)態(tài)工作量對(duì)比圖
(2) 左右手都放寬條件下總共符合左右手交替進(jìn)行的漢字有4 261個(gè),其交替率為:0.748 858;
(3) 舊鍵盤(pán)的不合理性
舊鍵盤(pán)動(dòng)態(tài)工作量中,其不合理之處表現(xiàn)為:
① 右手負(fù)責(zé)的鍵位數(shù)為11個(gè),左手負(fù)責(zé)的鍵位數(shù)為15個(gè),右鍵區(qū)總工作量為7 969 143,遠(yuǎn)大于左鍵區(qū)的6 407 230;
② 右鍵區(qū)右手工作量為4 791 085,左手工作量為1 656 131,兩者之比為2.89,比值過(guò)大;
③ 右鍵區(qū)小指工作量為54 662,與相同鍵區(qū)的無(wú)名指工作量之比為1∶19.55,與左鍵區(qū)小指工作量之比為1∶38.36,比值過(guò)于懸殊;
④ 左鍵區(qū)小指工作量為2 097 153,大于所在鍵區(qū)其它任一手指的工作量;
⑤ 左鍵區(qū)中指工作量為1 792 673,大于食指工作量1 656 131。
舊鍵盤(pán)的靜態(tài)工作量中,其不合理之處與動(dòng)態(tài)工作量中的①,②,③,④相同。
(1) 右鍵區(qū)中,食指中指無(wú)名指小指負(fù)責(zé)的鍵位數(shù)分別是6,2,2,1,因此它們理論上的最大工作量比值為:
max(食指∶中指)=3∶1
max(無(wú)名指∶中指)=1∶1
max(無(wú)名指∶小指)=2∶1
左鍵區(qū)中,食指中指無(wú)名指小指負(fù)責(zé)的鍵位數(shù)分別是6,3,3,3,因此它們理論上的最大工作量比值為:
max(食指∶中指)=2∶1
max(無(wú)名指∶中指)=1∶1
max(小指∶無(wú)名指)=1∶1
從上述分析及前文數(shù)據(jù)可知,新鍵盤(pán)符合上述條件,而舊鍵盤(pán)則不完全符合。
(2) 由于食指所能承受的負(fù)荷大于中指的負(fù)荷,則對(duì)于總工作量來(lái)說(shuō),食指大于中指是合理的,但我們以上計(jì)算的只是各手指的顯式工作量,并未計(jì)算手指在各鍵位之間頻繁移動(dòng)所產(chǎn)生的隱式工作量,而食指由于移動(dòng)范圍大,其隱式工作量是大于其余各手指的隱式工作量的,因此,右手食指與中指的最大顯式工作量之比max(食指∶中指)應(yīng)遠(yuǎn)小于3∶1,同樣,無(wú)名指與小指最大顯式工作量之比max(無(wú)名指∶小指)也應(yīng)小于2∶1,而中指所能承受的的負(fù)荷大于無(wú)名指的負(fù)荷,則中指與無(wú)名指最大顯式工作量之比max(中指∶無(wú)名指)應(yīng)大于1∶1。
對(duì)于左手,食指與中指最大顯式工作量之比也應(yīng)小于2∶1,其余手指之間最大顯式工作量之比約為1∶1即為合理。
從上述分析及前文數(shù)據(jù)可知,新鍵盤(pán)符合性較舊鍵盤(pán)好。
(3) 根據(jù)前文數(shù)據(jù),得出新舊鍵盤(pán)工作量對(duì)比圖,見(jiàn)圖6和圖7。
圖6 新舊鍵盤(pán)靜態(tài)工作量對(duì)比圖
圖7 新舊鍵盤(pán)動(dòng)態(tài)工作量對(duì)比圖
從上述圖表分析可知,舊鍵盤(pán)各手指間的工作量與實(shí)際負(fù)荷偏差過(guò)大,而新鍵盤(pán)工作量與各手指實(shí)際負(fù)荷的符合性則相對(duì)較好。
(4) 雖然新鍵盤(pán)左右手都放寬條件下的交替率為:0.748 33,并未高于舊鍵盤(pán)的0.748 858,但舊鍵盤(pán)的字母排布具有隨機(jī)性,而這種隨機(jī)性使得字母在鍵盤(pán)上的分布更均勻,反而可能會(huì)使交替率更高。即便如此,新鍵盤(pán)左右手都放寬條件下的交替率已經(jīng)達(dá)到比較高的水平了。
從相關(guān)數(shù)據(jù)及圖表分析得知,現(xiàn)用鍵盤(pán)在靜態(tài)和動(dòng)態(tài)工作量方面都未能很好的符合各個(gè)手指的實(shí)際可承受負(fù)荷量,左右鍵區(qū)和一部分手指工作量之間的比值過(guò)大,而新鍵盤(pán)布局依食指、中指、無(wú)名指、小指呈線性遞減關(guān)系,較好地符合各手指實(shí)際可承受負(fù)荷量,并且左右手放寬條件下的交替率為0.748 33,已經(jīng)達(dá)到較高水平。
綜合以上數(shù)據(jù),我們可以確定新的鍵盤(pán)字母排布比舊的鍵盤(pán)字母排布在使用拼音輸入法輸入漢字方面更為合理。
[1] 盧亞軍.藏文計(jì)算機(jī)通用鍵盤(pán)布局與輸入法研究[J].中文信息學(xué)報(bào),2006, 20(2):78-86.
[2] 楊道沅,董小國(guó),董紅,陳丹.《自然碼》雙拼鍵盤(pán)設(shè)計(jì)合理的研究[J].中文信息學(xué)報(bào),1994, 8(1):1-14.
[3] 張澤全.漢光碼漢字輸入法的鍵盤(pán)分布研究[J].河南師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2001. 29(3):83-87.
[4] 湯步洲,王曉龍,王軒,張強(qiáng).語(yǔ)句級(jí)漢字拼音輸入技術(shù)評(píng)估方法的研究[J].中文信息學(xué)報(bào),2008, 22(5):52-55.
[5] 北京語(yǔ)言學(xué)院教學(xué)研究所.現(xiàn)代漢語(yǔ)頻率詞典[M].北京.北京語(yǔ)言學(xué)院出版社,1986.6.
[6] 國(guó)家語(yǔ)言文字工作委員會(huì)漢字處.現(xiàn)代漢語(yǔ)常用字表[M].北京. 語(yǔ)文出版社,1988.1.
[7] 楊道沅,李棣.漢字輸入鍵盤(pán)設(shè)計(jì)方法的研究——兼論標(biāo)準(zhǔn)漢字雙拼鍵盤(pán)的設(shè)計(jì)[J].中文信息學(xué)報(bào),1997, 11(3):1-12.
[8] 王永民.計(jì)算機(jī)漢字鍵盤(pán)設(shè)計(jì)“三原理”——論計(jì)算機(jī)中文鍵盤(pán)的設(shè)計(jì),計(jì)算機(jī)學(xué)報(bào),2005, 28(5):870-881.