本文是科大訊飛副總裁江濤口述實(shí)錄??拼笥嶏w的創(chuàng)業(yè)經(jīng)歷,是個典型的中國技術(shù)創(chuàng)業(yè)故事。從技術(shù)到商業(yè),從實(shí)驗室到市場……這個故事提供了一個路徑樣本,也是那 10 年本土技術(shù)商業(yè)史的一個側(cè)影。
訊飛前傳
訊飛的前傳離不開“人機(jī)語音通信實(shí)驗室”,這是中科大六系(也就是電子工程系)的實(shí)驗室,八幾年就成立了,導(dǎo)師叫王仁華,是中國語音界非常有名的泰斗級老教授。九十年代,國內(nèi)做語音都會首推“二王”,南邊是王仁華教授,北邊是清華大學(xué)的王作英教授。
我是1993年進(jìn)科大的,當(dāng)時科大的學(xué)生都管導(dǎo)師叫“老板”,因為他們都跟著老師在外邊接活做項目(注:時代背景為知識分子到校外私企的打工經(jīng)商潮)。
王老師跟其他的“老板”差別在什么地方呢?這個實(shí)驗室也在外面接活,也給大家發(fā)點(diǎn)小錢,但除了有一撥人接活掙點(diǎn)小錢之外,他還保留了一支相當(dāng)精銳的部隊,做國內(nèi)最前沿的基礎(chǔ)研究,就是語音合成、語音識別編解碼相關(guān)的研究;第二個不同是,他不像大部分的老板——論文出來了自己的名字寫在第一個,然后才是學(xué)生的。在王老師這里,這個模式如果是你先做的,就把你的名字寫在第一個,把年輕人推出去。
慶峰1990年進(jìn)科大,到大五已經(jīng)是非常強(qiáng)的主力骨干了。王老師把他的學(xué)生分成兩撥,一撥是掙錢的,一撥是搞研究的,劉慶峰就是搞研究的頭——雖然只是五年級的本科生。
1998年,在國家863比賽中,慶峰牽頭拿了第一名,當(dāng)時主要聚焦在語音合成技術(shù)。863對語音合成技術(shù)的評測標(biāo)準(zhǔn)是:播音員的標(biāo)準(zhǔn)是5分,普通人發(fā)音是4分,3分是可以接受不反感。當(dāng)時,在國家 863多少年的比賽中,第一次有了3.0分,就是科大的代表隊。當(dāng)時一起參賽的還有很多代表隊,比如清華、北大等等。
這個獎也給慶峰很大的鼓舞,覺得應(yīng)該做點(diǎn)什么,把這個研究成果進(jìn)一步產(chǎn)業(yè)化。當(dāng)時李開復(fù)在微軟中國擔(dān)任副總裁(注:1998年7月,李開復(fù)在中國創(chuàng)建并領(lǐng)導(dǎo)微軟中國研究院,現(xiàn)為微軟亞洲研究院),準(zhǔn)備把微軟獎學(xué)金給慶峰,但這個獎學(xué)金是有條件的,必須到微軟做一個月的研究。當(dāng)時慶峰已經(jīng)準(zhǔn)備創(chuàng)業(yè)了,就說沒法去一個月,后來微軟的條件一降再降,最后降到過來兩周也行,但他最后還是拒絕了。十幾年之后,一次訊飛語音云開發(fā)者大會,李開復(fù)也到了現(xiàn)場,我們邀請他的時候,他很感慨地說,慶鋒是這么多年來唯一拒絕過微軟獎學(xué)金的人。
當(dāng)時還有一個背景,國外IT巨頭紛紛開始涉足中文,1998年,IBM發(fā)布了語音系統(tǒng),翌年被評為科技界十件大事之一。第一次在電腦上不用鍵盤就可以輸入,大家都覺得這是一個很革命性的事情。在IBM影響下,英特爾、摩托羅拉、東芝等國外IT巨頭都建立了語音研發(fā)中心,當(dāng)時科大聲學(xué)所、語言所、清華等等一些學(xué)校語音專業(yè)的學(xué)生,一畢業(yè)就被挖去,這些國外公司基本上把中國語音市場瓜分了。
還有一個背景必須提,就是大學(xué)生創(chuàng)業(yè)潮。九八、九九年團(tuán)中央呼吁大學(xué)生創(chuàng)業(yè),CCTV2還專門在1999年春節(jié)前后拍了一期節(jié)目,請了很多大學(xué)生創(chuàng)業(yè)者去講他們的故事。這是九八、九九年那一撥創(chuàng)業(yè)潮,但是后來我們上市的時候,一百多家企業(yè)就剩兩三個了。
這就是九八、九九年劉慶峰的狀態(tài)——技術(shù)上很牛,研究生剛畢業(yè),拒絕了微軟,在大的語音產(chǎn)業(yè)第一次浪潮和大學(xué)生創(chuàng)業(yè)潮,以及國家863獎的激勵下開始創(chuàng)業(yè)。
“訊飛 Inside”
融到錢后,就可以大手筆干活了。我們開始追逐自己的夢想,第一次做了ToC(面向消費(fèi)市場)的產(chǎn)品——暢言軟件。這是一款針對PC的軟件,通過語音既可以有指令的操作,又可以有文本輸入,我們第一次把手寫輸入的隨意性和語音輸入的快速性無縫整合在一起。
這個軟件的“成功版”賣兩千塊錢一套,我們在全國十幾個省打廣告,然后招商。把代理商請到合肥來,跟他們講這個軟件有多好多好,我賣你一套一千塊錢,你賣兩千塊錢。這個代理看著覺得挺神奇的,就各自囤了一些貨,但后來很快退回來了,一是不好賣,二是很多盜版。第一年賣了一千多萬,但大部分都積壓在代理商那里,搞得代理商叫苦不迭。
這是我們第一次ToC的努力。當(dāng)時可以做事情的時候,我們就想改變?nèi)耸褂糜嬎銠C(jī)的習(xí)慣,現(xiàn)在看來,這顯然是超越我們的能力了。一方面,PC已經(jīng)比較好地解決了人機(jī)交互的問題,對語音的需求沒那么迫切,而且換一臺電腦就得重新訓(xùn)練;其次,商業(yè)環(huán)境也不成熟,那時候沒有電子商務(wù),得靠一級一級的代理,最后一級一級加價,價格就比較高;同時,盜版又大面積出現(xiàn)。從技術(shù)、需求、商業(yè)環(huán)境上,都還不太成熟,所以叫它蹣跚的起步。訊飛的成長中,我們犯了無數(shù)的錯誤,這是其中之一。
訊飛商業(yè)模式第一次形成叫“iFLY Inside”,2000年,我們在深圳參加高交會,華為的工作人員看到了我們的語音合成系統(tǒng),覺得比他們的好,就把我們帶到蛇口的那個樓里,十幾個研發(fā)人員圍著問了一個下午。后來,華為就決定跟我們簽約了。
簽約后,華為開始測試我們的語音合成系統(tǒng)。我們在家里測覺得挺好的,結(jié)果到華為一跑,只能撐幾分鐘。華為給了我們很大的壓力,在陳濤副總裁的帶隊下,我們最核心、最骨干的一些研發(fā)人員接近二十幾天吃睡都在華為,餓了就吃點(diǎn)東西,困了就在地上鋪個東西睡會兒。我們那個時候才知道電信級穩(wěn)定性的要求。
修改、優(yōu)化后提交還是不夠,華為在現(xiàn)場又發(fā)現(xiàn)了問題,需要反復(fù)的修改,這個過程算是“脫了一層皮”。從實(shí)驗室狀態(tài)的產(chǎn)品,在穩(wěn)定性、工程化上面,如何滿足真正大規(guī)模商用的要求,也是我們第一次面對。
但是這一層皮脫掉了以后,以后再有誰測我們的系統(tǒng),我們從來就沒倒過。除了華為,當(dāng)時的中興、神州數(shù)碼等等國內(nèi)做智能網(wǎng)、呼叫中心、業(yè)務(wù)系統(tǒng)的,需要用到語音引擎都買訊飛。
我們把語音的核心能力提供給合作伙伴,他來做具體的應(yīng)用,這是“iFLY Inside”模式的確立。
彎曲的直線endprint
訊飛犯過無數(shù)的錯誤,走過無數(shù)彎路,后來我們把它叫做“彎曲的直線”。
現(xiàn)在訊飛有兩個事業(yè)部,通信增值和移動互聯(lián)。當(dāng)年有一個叫“有聲Email”的項目,我是總負(fù)責(zé)人,跟上海電信合作,在上海熱線的郵箱系統(tǒng)第一次實(shí)現(xiàn),當(dāng)時覺得自己還挺了不起的。
那個時候移動互聯(lián)網(wǎng)還沒起來,電話用戶比互聯(lián)網(wǎng)用戶多得多,“有聲Email”就是用電話來訪問,讓用戶聽互聯(lián)網(wǎng)上的信息。這個還真賣了一套,但就是沒人用。在做這些產(chǎn)品的過程中,我們也慢慢的知道了該如何做產(chǎn)品,如何做工程,如何研究用戶需求。
還有個項目叫“老師家長一線通”,希望通過智能的電話語音系統(tǒng),解決老師和家長之間的溝通問題,現(xiàn)在有很多 App 也做這個,包括校訊通,但當(dāng)時產(chǎn)品出來同樣沒市場。不過,這支團(tuán)隊后來進(jìn)一步延伸出了通信增值事業(yè)部。
2005年,彩鈴從韓國引入中國,迅速火了起來。當(dāng)時運(yùn)營商最困擾的是,電話熱線里面只能提供“1”到“9”的9首彩鈴讓用戶來選。他們就找我們問,能不能用語音選彩鈴。
我們就做了“聲動彩鈴”這個系統(tǒng),在安徽一試點(diǎn)成果非常好。當(dāng)時,安徽的運(yùn)營商就給我們推薦了幾個單位,后來聯(lián)通總部看到這個系統(tǒng)的成果,就進(jìn)一步下文,說這個產(chǎn)品應(yīng)該怎么用。這樣,我們終于有了第一個能夠覆蓋全國的業(yè)務(wù)。
它逐漸在全國形成了規(guī)模效應(yīng),后來中國電信得到了C網(wǎng),開始做彩鈴的時候,也是全面用我們的系統(tǒng)。中國移動也是。
基于音樂和彩鈴相關(guān)的語音業(yè)務(wù)平臺,很多都是由訊飛來做?;谟嶏w的語音核心技術(shù)之外,我們把音樂方向的應(yīng)用真正做起來了。
這幾年,我們的通信增值事業(yè)部在原來音樂語音搜索上又進(jìn)一步做了很多東西,比如個性化彩鈴、基于特色的語音合成技術(shù),可以讓彩鈴隨時的更換。還有愛吼網(wǎng)(一個在線K歌的平臺)。
移動互聯(lián)方面,包括輸入法,我們的基礎(chǔ)團(tuán)隊也是從這邊延伸出來的。2002年到2005年,我們把它叫做“彎曲的直線”,走了無數(shù)的彎路。
“彎曲的直線”的另外一面是教育產(chǎn)品。我們教育產(chǎn)品線已經(jīng)很長了,早期做的產(chǎn)品叫“會說話的書”,這是 2002 年開始做的重要項目,我們當(dāng)時對它抱了很大的期望。在書底下有一個存儲裝置,包含語音合成芯片,可以把書的內(nèi)容讀出來,適合小孩。
語音合成怎么用?當(dāng)時想的就是大家除了看書以外,還有聽的需求。這兩款產(chǎn)品費(fèi)了牛勁,因為是我們第一次做硬件產(chǎn)品?,F(xiàn)在看來,這兩款產(chǎn)品巨土,工業(yè)設(shè)計水平都比較低,包括用戶體驗也都不太好。
但是,這次項目之后保留下來的教育產(chǎn)品條線,現(xiàn)在已經(jīng)有幾百號人、幾億的銷售額,可能到未來會有幾十億。要是當(dāng)時沒做現(xiàn)在看來很瘋狂的傻事,就沒有今天的發(fā)展。endprint