劉志達
談判在進行。
一枝筆在陳肇雄手里慢慢地轉(zhuǎn)著,像是在一點點上緊發(fā)條。
對面,香港權(quán)智公司年輕的董事長譚偉豪認真地注視著這位年輕的書生。兩個人的目光輕輕地搭在一起。
譚偉豪的身子稍微動了一下,說:“陳先生,請告訴我購買這項技術(shù)的價格?!?/p>
“74萬?!?/p>
“可以?!弊T偉豪竟毫不猶豫。
片刻,筆在陳肇雄手里停止了轉(zhuǎn)動,但只是片刻,又慢慢轉(zhuǎn)了起來。他又說出兩個字:“美元?!?/p>
“當然?!弊T偉豪先生依然不加思索。
陳肇雄手里的筆沒有再停止轉(zhuǎn)動:“一年為期?!?/p>
譚偉豪點頭同意。
這時陳肇雄又加上一句:“只限于袖珍版系統(tǒng),不包括臺式和筆記本式?!?/p>
譚偉豪說:“好,我接受。我的條件是:兩個月拿出軟件?!?/p>
陳肇雄放下了手中的筆,笑了。譚偉豪也笑了。
兩個人的目光依然搭在一起。
一個是中國科學院計算機研究所優(yōu)秀的青年科學家。
一個是名列“香港十大杰出青年工業(yè)家”之榜的企業(yè)家。
在對方的眼睛中,他們分別看到了過人的智慧和氣魄。
兩個月后,陳肇雄從他那張舊三屜桌里,拿出幾張巴掌大的軟盤,這就是一年使用價值為74萬美元的袖珍版智能型英漢機器翻譯系統(tǒng)。
這是我國“863計劃”實施以來一次性出口創(chuàng)匯最高的技術(shù)成果。時為1991年底。
這就是知識的價值。
1 自從世界上有了人,就有了人的語言。
語言是人與人之間相互交流的工具,同時,也是人與人之間相互交流的障礙。人類社會不斷發(fā)展,人們享受語言這一工具帶來的實惠越來越多,同時,拆除語言障礙的急迫性也就越來越強烈。
于是就有了翻譯。
到整個農(nóng)業(yè)時代結(jié)束,人們滿足于越來越多的翻譯人員的出現(xiàn)。機器時代的到來,使人與人之間的交流比以前更加廣泛、復(fù)雜,因此,克服語言障礙的要求更加強烈。終于,有人把全面實現(xiàn)這一要求的希望的眼光瞄向了機器。
本世紀20年代,一個俄國人試圖用機械裝置自動將俄語翻譯為英語,但未能成功。40年代初,美國人發(fā)明了電子計算機,美國商用機器公司即嘗試用它進行自動翻譯,仍未成功。50年代,曙光初現(xiàn),第一個機器翻譯系統(tǒng)問世,但是與此同時,它那十分簡單的語詞規(guī)則、極慢的翻譯速度、很低的準確率、極高的翻譯成本,也使人們陷入了渺茫之中:由于人類多種自然語言的語法、語義構(gòu)造的不同和復(fù)雜,電子計算機能最終完成人腦尚需深入學習才可能實現(xiàn)的不同自然語言的轉(zhuǎn)換嗎?
70年代中期,人類進入了信息時代。人類的思想創(chuàng)造以各種不同的語言形式噴涌而出,人們用信息爆炸來形容這一個時代。因此,實現(xiàn)人類之間順利交流完全靠人工語言互譯顯然已是不可能的事,這時,人們再一次把希望的目光瞄向了計算機。
機器翻譯技術(shù)于是被列為21世紀世界十大科技難題的第一位。
差不多是同時,中國的一位電子計算機專家、中國科學院學部委員高慶獅教授平靜地對一個24歲的青年人說:“給我搞出機器翻譯來?!?/p>
這個青年人就是陳肇雄。
當時是1985年,他正在高慶獅教授門下攻讀博士學位。
2 福建莆田有座壺公山,山下有條木蘭溪。
1961年,陳肇雄出生在這里的青山綠水之間。
他的父親是一個普通的鄉(xiāng)村中學教師,母親是農(nóng)民,上有兩個姐姐,下有一個弟弟、三個妹妹。沉重的生活負擔,父母無法給他太多的照料,他的童年是在無拘無束的玩耍中度過的。一直到小學三年級,他整日貪玩,學習成績十分糟糕。
祖母的一次嚴厲教訓,使他童蒙初開。從此他開始了如饑似渴的學習。
陳肇雄學習起來不挑不揀,速度極快,課堂上的東西很快無法滿足他的求知欲望,而那時課外書又非常少,幾本《鐵道游擊隊》《紅旗譜》《水滸》《三國演義》被他反復(fù)讀來讀去。而父親給他找來的一套《西游記》更讓他如醉如癡,書中那似真似幻的仙山魔洞,奇妙多端的無窮變化,讓他小小的心靈激動不已,孫悟空便成了他那時癡迷羨慕的偶像。
當陳肇雄成為中國科學院研究員時,回憶起這段時光,依然充滿留戀之情。他說,我的自學能力就是在那時開始培養(yǎng)起來的,小學生讀小說,大人又沒有精力講解,全靠自己去讀懂那些大部頭的書,這就是一個自學的過程。特別是像《西游記》這樣的書,能引起我的豐富聯(lián)想,促使我去找新的知識。
陳肇雄似乎一旦起動,馬上就可以達到一種高速狀態(tài)。上中學后,當時不正規(guī)的教學更無法滿足他的求知欲望,他開始超過課堂進度自學數(shù)、理、化。1977年到公社中學讀高中,一些老師是從大城市“下放”來的,教學水平很高,加上他的自學,他開始準備參加“文革”后的第一次高考。他有充分的信心。
但他沒有考成。他的老師蔡贏洲對他說:“再等一年。你要考就考一流名牌大學,因為我教的學生就要贏過五大洲的學生!”
陳肇雄遵從了老師的教導,慢了下來。由此,陳肇雄開始了他特有的一種人生節(jié)奏。
他自己定下一個目標后,便急速前行,在即將到達時,總有種種原因讓他達不到這個目標,于是慢下來,而慢的結(jié)果,是他以更快的速度超過原定的目標。這種“快—慢—快”的節(jié)奏以后便一直伴隨著他的人生之路。
一年后,他以優(yōu)異的成績考入華東工學院。大學三年級時,他想報考研究生,又被老師勸止。又過了一年,他以總分最高的成績一舉考上我國當時僅有的兩位計算機專業(yè)的學部委員之一、與華羅庚等同列為中國科技十杰的高慶獅教授的研究生。陳肇雄又開始了他的高速前進,提前9個月完成了碩士研究生學業(yè)。
一般情況,獲得碩士學位后兩年就可以評為助理研究員,但由于名額有限,他沒有被評上。這似乎又慢了下來。但是當博士學位還沒有讀完,他已被提前評為副研究員,接著,他只用了3年時間,由于在學術(shù)上取得的重要成果,1992年10月,他成為中國科學院最年輕的研究員之一。時年31歲。
快——慢——快。
3 當高慶獅教授讓陳肇雄搞機器翻譯時,陳肇雄正在勁頭十足地作著智能計算機邏輯程序語言的研究。這是新一代計算機的核心技術(shù),陳肇雄是國內(nèi)最早從事這個課題研究的人之一。這時,他已發(fā)表了10多篇有影響的論文,提出了“基于替換的邏輯程序?qū)崿F(xiàn)技術(shù)”,其成果得到了北京、上海、沈陽、南京等地有關(guān)單位的推廣應(yīng)用。繼續(xù)下去,前景已經(jīng)十分樂觀。而要轉(zhuǎn)到差異很大的機器翻譯上來,風險卻很大:研究周期長,工程量大,而且在理論上尚未有突破,也許竭畢生精力都很難搞出像樣的成果。
陳肇雄的人生節(jié)奏又一次出現(xiàn)在“慢點”上。
他果斷放棄了原來的研究方向,直接踏上機譯研究這一世紀性的艱難之路。
退一步并沒有海闊天空,卻是山重水復(fù)。
世界上的發(fā)達國家不惜以黃金的堆積試圖叩開機譯之門。歐共體7國聯(lián)合投資3850萬歐洲貨幣單位進行研究;日本投資高達8億美元;美國僅在機譯一項子課題的理論研究方面,就投資1600萬美元。而陳肇雄的研究直到1988年被列入國家“863”高技術(shù)研究發(fā)展計劃,才獲得44萬人民幣的課題費。就是這44萬,已經(jīng)超過了“863”計劃智能計算機主題全年經(jīng)費的三分之一。
最大的困難,還在于課題本身的高難性。機譯研究是涉及語言學、計算語言學、計算機科學、認識科學等多學科的綜合性研究,而陳肇雄對這一課題的認識幾乎是一片空白。對于他來說,沒有別的辦法,只有再一次拿起他的看家法寶—自學。潛下心來,從頭開始讀書,慢,就讓他慢去吧。
這一讀就是3年。
陳肇雄邊讀邊想,這是他在小學讀《西游記》時練就的功夫。他首先根據(jù)計算機的特點設(shè)計了一套計算機可以接受并能從容運用的語法,他稱之為“SC文法”。接著,又為計算機編了一部特殊的詞典,他把這種詞典按語言、語意、常識、上下文相關(guān)等分為7個層次,形成“與sC文法相適應(yīng)的層次詞典結(jié)構(gòu)”。但是,各種知識紛紜復(fù)雜,人不可能把所有的知識都告訴計算機,計算機如果遇到不知道的知識怎么辦?能不能像人腦一樣根據(jù)已經(jīng)掌握的知識進行推理判斷?陳肇雄說:能??墒沁@一個“能”字,卻是他3年心血的結(jié)晶。3年后,陳肇雄終于提出了“基于不完備知識的機譯分析”的理論。簡單地解釋,比如我們要找一個人,并不需要知道這個人的所有參數(shù),比如找陳肇雄,到中科院計算所一問,搞機器翻譯研究的、青年、福建來的博士生,別人就會知道,這是陳肇雄,而他叫什么,身高體重,面貌特征等都可以不去過問。對于計算機來說,可否也能如此呢?于是他把各種單詞規(guī)定了300多種屬性特征,如這個詞的概念是精神的還是物質(zhì)的、固體的還是氣體的、在句子中是主語還是謂語、其所在的句子是在什么場合使用的等等,計算機根據(jù)這些特征,就可以準確地把這些詞組成的句子的含意翻譯出來。
當陳肇雄把這一切都想通了時,他實際上已完成了機器翻譯向現(xiàn)實轉(zhuǎn)化的理論建設(shè)。
1988年,陳肇雄在第12屆國際計算語言學大會上宣讀了關(guān)于“智能型機器翻譯系統(tǒng)”的論文。由于他突破了國際機譯界長期難以解決的復(fù)雜多義區(qū)分、上下文相關(guān)處理、多種知識交叉分析等一系列難題,引起各國專家的高度重視,大會主席興奮地稱陳肇雄“指出了一個雄心勃勃的新的發(fā)展方向”。
如果這時的陳肇雄繼續(xù)發(fā)表論文,著書立說,那么成為國際機譯界權(quán)威,只是一步之遙。他又一次走到了人生的“快點”上。
這時,高慶獅教授看著他的高徒,依然平靜地說:“論文暫時不要再發(fā)表了,不要讓關(guān)鍵技術(shù)流失,應(yīng)該盡快把技術(shù)成果轉(zhuǎn)化成產(chǎn)品,要讓成果在國內(nèi)實現(xiàn)產(chǎn)品化?!?/p>
中國人的精神智慧,要轉(zhuǎn)化為中國的物質(zhì)財富。
陳肇雄再一次“慢”了下來,重新走上了一條充滿荊棘的艱難之路。
4 又是一個3年。
陳肇雄組織了十幾位專家和一批大學畢業(yè)生,靠著“863計劃”撥給的44萬元有限的經(jīng)費,借來一臺SUN3/260工作站,便在一間簡陋的機房中干了起來。
3年困苦,3年磨礪。用什么樣的語言才可以讓人們體會到科學創(chuàng)造過程中的所有艱辛?在那僅僅是為設(shè)計語言規(guī)則而堆起達3米高的稿紙中,誰能說清浸透著多少心血?
這需要精神的支持。
陳肇雄那一屆畢業(yè)的計算所碩士生共36人,先后35人出國,只剩下一人,就是陳肇雄,而他是最先并且4次接到國外的邀請。
人各有志,但他不是圣人。一次,陳肇雄為各種麻煩—與科研無關(guān)卻又是科研障礙的麻煩—所苦惱,他感到累了,便隨手給德國的一所大學發(fā)去一份電傳,表示想去學習一段時間。僅僅4個小時,對方發(fā)回電傳:歡迎即來。
陳肇雄輕輕抖了抖電傳紙,便放在了一邊。
他的課題不能半途而廢。他說:“出國不是就不愛國,但我留在國內(nèi),卻實是有感情上的原因,能在國內(nèi)為我們的計算機事業(yè)發(fā)展出力,我感覺更實在,更有意義。”
終于,陳肇雄的人生又進入了一個新的“快點”之上。智能型英漢翻譯系統(tǒng)IMT/EC863于1992年通過了國家科委主持的鑒定:“應(yīng)用智能型機器翻譯理論體系所設(shè)計開發(fā)的IMT/EC863系統(tǒng),具有軟件獨立于具體文種、智能化程度高、翻譯速度快、占用空間小、準確率高、譯文可讀性好等特點。該系統(tǒng)在理論基礎(chǔ)、總體設(shè)計、系統(tǒng)實現(xiàn)和應(yīng)用效果等方面,總體上超過了國內(nèi)外同類系統(tǒng),處于國內(nèi)外領(lǐng)先的地位?!?/p>
此消息在《光明日報》上發(fā)表后,在國內(nèi)外機譯界引起強烈反響。權(quán)威人士評之為“在我國高性能英漢機譯系統(tǒng)的開發(fā)和把技術(shù)轉(zhuǎn)化為生產(chǎn)力方面作出了突出的貢獻”,“為中國機器翻譯技術(shù)打入國際市場開辟了廣闊的道路”。
同一年,陳肇雄組織人力,用了兩個月時間,完成了袖珍型電子翻譯機的軟件開發(fā),把數(shù)萬個基本詞匯、數(shù)十萬個對應(yīng)詞、數(shù)十萬個通用規(guī)則和特殊規(guī)則壓縮到100K字節(jié)以內(nèi),能在動態(tài)存貯空間下運行,而且能在袖珍機速度限制下幾秒鐘內(nèi)完成整句翻譯,即實現(xiàn)了實時翻譯。
香港權(quán)智公司以一年74萬美元的價格購買了這一軟件,生產(chǎn)出了世界上第一臺能夠完成整句翻譯的袖珍型電子翻譯機—快譯通EC—863A.
同樣年輕的譚偉豪深知這一成果的廣闊商業(yè)前景,所以在第一個合同尚未期滿時,又提出投資740萬美元組建合資公司共同開發(fā)生產(chǎn)。陳肇雄提出計算所的技術(shù)使用權(quán)折股也是740萬美元,占50%。這樣,按照合同規(guī)定,權(quán)智公司今后10年每年至少還要交付200萬美元的技術(shù)使用費,除去上交給合資雙方的利潤額外,不算產(chǎn)品銷售利潤,陳肇雄課題組每年至少可以拿到90多萬美元!
1992年10月,合資公司成立,陳肇雄擔任董事長兼總經(jīng)理。
同時,中科院計算所成立了機譯研究中心,陳肇雄任中心主任。
1993年,“智能型機譯系統(tǒng)IMT/EC—863”獲中國科學院科技進步一等獎。陳肇雄本人獲中國科學院第三屆青年科學家獎一等獎,被評為中央國家機關(guān)十大杰出青年和中國十大發(fā)明企業(yè)家之一。
那么,陳肇雄人生曲線的下一個“點”呢?
在中央電視臺的一次現(xiàn)場直播節(jié)目中,節(jié)目主持人請他演示“快譯通EC—863A”,他想了想,便迅速地輸入了一串英文:“Science and technologymust be combined with market.”幾秒鐘后,機器顯示并讀出“科學技術(shù)必須與市場相結(jié)合”的漢語字樣和讀音,奇妙的技術(shù)贏得了觀眾熱烈的掌聲。
可以想像,機譯之星下一個人生之點也許會出現(xiàn)在哪里。