国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

科大訊飛:探尋人工智能的實(shí)現(xiàn)路徑

2018-09-02 21:10梅新蕾李偉
清華管理評論 2018年12期
關(guān)鍵詞:語音人工智能

梅新蕾 李偉

在A股市場的人工智能板塊,科大訊飛(深交所:002230)可能是公認(rèn)的執(zhí)牛耳者。自1999年走出中國科技大學(xué)“人機(jī)語音通信實(shí)驗(yàn)室”起,科大訊飛以自主研發(fā)的中文語音合成技術(shù)為突破口切入智能語音產(chǎn)業(yè),成長為國內(nèi)唯一一家以語音識別為核心優(yōu)勢技術(shù),并基于“深度學(xué)習(xí)”算法進(jìn)行人工智能底層技術(shù)研究的“產(chǎn)學(xué)研”企業(yè)。

1992年,科大訊飛創(chuàng)始人、董事長劉慶峰加入中國科技大學(xué)電子工程系“人機(jī)語音通訊實(shí)驗(yàn)室”,在博導(dǎo)王仁華教授的鼓勵(lì)下,開始牽頭自主研發(fā)語音合成系統(tǒng)。1998年,劉慶峰負(fù)責(zé)的語音合成系統(tǒng)獲得“863計(jì)劃”成果比賽獲得第一,并獲得“863”專家組“語音合成技術(shù)初步達(dá)到實(shí)用化水平”的評定。彼時(shí),正值90年代末大學(xué)生創(chuàng)業(yè)潮,劉慶峰萌生了將這項(xiàng)技術(shù)產(chǎn)業(yè)化的想法。1999年6月,26歲的劉慶峰帶領(lǐng)同實(shí)驗(yàn)室的十幾位同學(xué),在中科大校園租下了一間三室一廳的民房開始創(chuàng)業(yè),科大訊飛的雛形由此誕生。

2000年,科大訊飛在關(guān)鍵戰(zhàn)略會議——巢湖“半湯會議”上定下《訊飛產(chǎn)業(yè)規(guī)劃》,堅(jiān)定將語音交互技術(shù)的自主研發(fā)和產(chǎn)業(yè)化落地作為訊飛核心戰(zhàn)略方向。此后,訊飛的核心語音業(yè)務(wù)從語音合成、口語測評起步,向語音識別、語義識別、自然語言處理方向演進(jìn),通過語音芯片、語音引擎和語音云平臺,向各行業(yè)B端企業(yè)用戶、行業(yè)應(yīng)用開發(fā)商提供語音技術(shù)開發(fā)及服務(wù)能力,截至2017年已經(jīng)占有中文語音技術(shù)市場60%以上市場份額,其中語音合成產(chǎn)品在電信、金融、電力、社保等行業(yè)的份額超過80%。

2014年起,科大訊飛基于深度學(xué)習(xí)算法,啟動了針對人工智能的重大攻關(guān)項(xiàng)目“訊飛超腦計(jì)劃”,旨在研發(fā)具有深層語言理解、邏輯聯(lián)想推理、自主學(xué)習(xí)等能力的人工智能系統(tǒng),并依托訊飛人工智能開放平臺“AIUI”構(gòu)建以訊飛為核心的人工智能生態(tài)系統(tǒng),主要面向B端用戶,以“技術(shù)賦能者”的角色探索人工智能技術(shù)在教育、醫(yī)療、司法、智慧城市等行業(yè)賽道的商業(yè)化落地;此外,面向C端用戶,科大訊飛亦集成其智能語音、人工智能技術(shù)能力,推出移動端訊飛輸入法、AI助手應(yīng)用“咪咕靈犀”等軟件產(chǎn)品,以及訊飛“曉譯”翻譯機(jī)、智能音箱“叮咚音箱”等硬件產(chǎn)品,試圖拓寬業(yè)務(wù)范圍和潛在市場空間。

在財(cái)務(wù)數(shù)據(jù)上,一方面,科大訊飛在營收規(guī)模和市值上實(shí)現(xiàn)了跨越式的發(fā)展:2008年科大訊飛成功赴深交所上市,在上市后十年的時(shí)間,其營業(yè)收入年均復(fù)合增長率達(dá)40%, 10年累計(jì)增長了21倍,市值累計(jì)增長了約25倍。在人工智能風(fēng)口下,鑒于其行業(yè)領(lǐng)先的技術(shù)水平、商業(yè)模式的逐漸完善、主營規(guī)模的迅速增長,市場有觀點(diǎn)認(rèn)為科大訊飛是 “智能語音技術(shù)行業(yè)的龍頭企業(yè)”、“A股市場人工智能第一股”。

然而,僅從客觀數(shù)據(jù)上看,科大訊飛作為一家上市公司,近年來在業(yè)務(wù)范圍快速擴(kuò)張、持續(xù)加碼人工智能前瞻性布局的同時(shí),也面臨著增收不增利、投資回報(bào)率走低等壓力。業(yè)內(nèi)亦有聲音質(zhì)疑其究竟“是否撐得起千億市值夢”?

應(yīng)該如何理解科大訊飛?對科大訊飛這樣一家不斷挑戰(zhàn)前沿技術(shù)浪潮的“科研型”企業(yè)進(jìn)行價(jià)值評斷,不僅應(yīng)著眼于傳統(tǒng)的企業(yè)財(cái)務(wù)指標(biāo),同時(shí)應(yīng)關(guān)注企業(yè)所在的行業(yè)環(huán)境和產(chǎn)業(yè)前景,以及企業(yè)能否正確“卡位”并占據(jù)一定的行業(yè)優(yōu)勢地位——前者體現(xiàn)了蛋糕可以做多大,往往是由宏觀環(huán)境和行業(yè)特點(diǎn)決定的;后者決定了企業(yè)可以分走多少蛋糕,需要由企業(yè)通過筑建“護(hù)城河”來爭取。為此,本文試圖從以下四個(gè)維度呈現(xiàn)更多細(xì)節(jié):

首先,在智能語音技術(shù)和人工智能產(chǎn)業(yè),科大訊飛面臨怎樣的大環(huán)境?

其次,“科研型”企業(yè)的成長往往是由“源頭創(chuàng)新”和“創(chuàng)新應(yīng)用”雙輪推動的,訊飛如何在源頭技術(shù)層面構(gòu)建競爭壁壘?

再次,科大訊飛如何探尋技術(shù)產(chǎn)業(yè)化落地的路徑,其在2B和2C領(lǐng)域各有何嘗試?

最后,在國內(nèi)外科技巨頭和互聯(lián)網(wǎng)企業(yè)紛紛布局AI賽道的競爭環(huán)境下,科大訊飛的挑戰(zhàn)和機(jī)會可能在哪里?

構(gòu)建源頭技術(shù)壁壘

劉慶峰認(rèn)為:“微軟把圖形做到了極致,蘋果把觸摸做到了極致”,“作為最自然的交互方式,下一輪變革就在語音領(lǐng)域”?!叭祟?0%的信息輸入依靠視覺,90%的信息輸出依靠聲音和語言”。相比于觸覺交互,語音交互更加符合人類向外界輸出信息的自然方式,且可以有效滿足“人機(jī)分離”場景下的遠(yuǎn)場交互需求。隨著移動互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算技術(shù)的進(jìn)步,語音交互技術(shù)有望成為物聯(lián)網(wǎng)時(shí)代的入口級技術(shù),從而具有良好的增長前景;此外,語音交互技術(shù)(語音合成、語音識別、自然語言處理)與人工智能技術(shù)深度結(jié)合的領(lǐng)域,亦有著有著廣闊的市場空間。

相比于國際科技巨頭,科大訊飛作為在智能語音乃至人工智能領(lǐng)域擁有源頭創(chuàng)新能力的本土企業(yè),劉慶峰團(tuán)隊(duì)認(rèn)為,智能語音乃至人工智能產(chǎn)業(yè)均是典型的技術(shù)先導(dǎo)型產(chǎn)業(yè),具有較為顯著的“馬太效應(yīng)”——技術(shù)領(lǐng)先型企業(yè)可以通過創(chuàng)新性產(chǎn)品引導(dǎo)市場需求,在占據(jù)市場先機(jī)后,將會通過行業(yè)實(shí)踐經(jīng)驗(yàn)、數(shù)據(jù)資源、人才資源的積累,在后繼技術(shù)競爭中表現(xiàn)出更大優(yōu)勢,從而樹立起后來者短期內(nèi)較難趕超的“護(hù)城河”。為此,科大訊飛把研發(fā)放在戰(zhàn)略高度,堅(jiān)持以市場為導(dǎo)向進(jìn)行核心技術(shù)的創(chuàng)新和迭代。

科大訊飛構(gòu)建源頭技術(shù)壁壘,首先的表現(xiàn)形式是持續(xù)、高強(qiáng)度的研發(fā)投入。自2010年以來,科大訊飛年度研發(fā)投入強(qiáng)度(也即R&D投入占當(dāng)年?duì)I業(yè)收入比例)始終保持在20%以上,2018年上半年高達(dá)25%,遠(yuǎn)超國家標(biāo)準(zhǔn)界定的高新技術(shù)企業(yè)3%的水平;相比BAT以及國際主流科技巨頭,訊飛受制于體量規(guī)模,在R&D投入絕對值上不占優(yōu)勢,但研發(fā)投入強(qiáng)度仍處于前列。從研發(fā)投入轉(zhuǎn)化效率上看,科大訊飛每年研發(fā)投入達(dá)到可資本化標(biāo)準(zhǔn)的比例維持在30%以上,在語音合成、語音識別、認(rèn)知智能技術(shù)領(lǐng)域均達(dá)到國際領(lǐng)先水平。

智能語音和人工智能技術(shù)研發(fā)難度大、進(jìn)入壁壘高,高額的研發(fā)投入只是企業(yè)取得源頭技術(shù)突破的“必要不充分條件”,企業(yè)致勝的關(guān)鍵在于能否構(gòu)建并維持一支專家型團(tuán)隊(duì)進(jìn)行長期攻關(guān),并配套以高效的研究成果轉(zhuǎn)化機(jī)制。為此,科大訊飛一方面圍繞其三大研究院構(gòu)建企業(yè)自身的核心研發(fā)平臺,另一方面從源頭整合外部行業(yè)研發(fā)資源,通過與高校及科研機(jī)構(gòu)、政府機(jī)構(gòu)及企事業(yè)單位、行業(yè)企業(yè)、獨(dú)立科研團(tuán)隊(duì)以共建聯(lián)合實(shí)驗(yàn)室等形式展開合作,構(gòu)建出了一套特殊的“衛(wèi)星型”研發(fā)體系。

核心研發(fā)平臺是科大訊飛研發(fā)體系的內(nèi)核,重點(diǎn)針對與訊飛業(yè)務(wù)發(fā)展緊密相連的核心能力進(jìn)行底層研發(fā)。核心研發(fā)平臺下屬三大研究院,分別是人工智能研究院(AI)、大數(shù)據(jù)研究院(Big Data)和云計(jì)算研究院(Cloud Computing),這三個(gè)研究院均是基于語音交互技術(shù)這一重點(diǎn)領(lǐng)域發(fā)展出來的。

技術(shù)中心是連接后臺研究院的底層研究成果與前臺各產(chǎn)品部門需求的中間層。相對于研究院:技術(shù)中心的研發(fā)更靠近應(yīng)用層面,目標(biāo)是將底層科研成果轉(zhuǎn)化為可以產(chǎn)業(yè)化落地的應(yīng)用技術(shù);技術(shù)中心的人員也更靠近前端客戶,針對客戶需求做定制化開發(fā),為前臺各事業(yè)部、事業(yè)群服務(wù)客戶提供技術(shù)支持。從團(tuán)隊(duì)規(guī)模上看,在訊飛當(dāng)前8000多人的總體員工團(tuán)隊(duì)中,研發(fā)團(tuán)隊(duì)占比66.28%——其中,訊飛三大研究院約1000人,技術(shù)與開發(fā)人員人數(shù)超過5000人。

值得指出的是,訊飛從戰(zhàn)略穩(wěn)定性、機(jī)制和文化設(shè)計(jì)上,為其研發(fā)人員提供了良好的科研環(huán)境——這既是激勵(lì)、孵化源頭技術(shù)創(chuàng)新的溫床,也是留住優(yōu)秀科研人才的重要條件。

首先,科大訊飛的創(chuàng)始團(tuán)隊(duì)(也即當(dāng)下的核心高層團(tuán)隊(duì))是基于中科大組建的、成建制的核心研究團(tuán)隊(duì),這一團(tuán)隊(duì)均是科研背景出身,對源頭技術(shù)研發(fā)工作本身的特點(diǎn)、規(guī)律及人才所需的環(huán)境有著切身理解,在核心語音技術(shù)、人工智能技術(shù)領(lǐng)域有專業(yè)積累和行業(yè)洞察能力,且自企業(yè)創(chuàng)立以來高度穩(wěn)定——這保證了科大訊飛在研發(fā)層面的戰(zhàn)略穩(wěn)定性。

此外, 科大訊飛在企業(yè)文化層面,強(qiáng)調(diào)研究院科學(xué)家和研發(fā)人員在企業(yè)內(nèi)部的核心地位,并再配合以多期股權(quán)激勵(lì)等經(jīng)濟(jì)激勵(lì)手段;在機(jī)制設(shè)計(jì)上,對研發(fā)項(xiàng)目“允許試錯(cuò)”,不對專注基礎(chǔ)研究的科學(xué)家設(shè)定與銷售或者成果轉(zhuǎn)化掛鉤的硬性KPI,但要求其對“失敗”項(xiàng)目及時(shí)復(fù)盤、找到原因。

“科大訊飛的基因是做研究的基因,研究人員在這里很容易找到歸屬感和成就感。從價(jià)值觀上看,我們是登山型的公司,相信遠(yuǎn)處有一個(gè)喜馬拉雅山,而我們要用很多年不斷的逼近;而多數(shù)互聯(lián)網(wǎng)公司是沖浪型公司,(行業(yè))今天有一個(gè)什么熱點(diǎn),就立刻組織一撥“部隊(duì)”、高薪挖一撥人就開始做,干得好給獎(jiǎng)金,干不好這個(gè)部門就砍掉了,就非常狼性的,對研究來說是不利的?!?/p>

——科大訊飛高級副總裁,江濤

“在科大訊飛工作群,如果有人說,‘哇,我今天拿下一個(gè)億的單子,沒人吱聲;但如果有人說,‘嗨,我把語音輸入的準(zhǔn)確率提高了1%,那群里頓時(shí)就炸開了?!?/p>

——科大訊飛某員工

核心語音技術(shù)的產(chǎn)業(yè)化

“在做科研的時(shí)候,主要考驗(yàn)一個(gè)人研究的能力,但當(dāng)要去真正創(chuàng)辦一個(gè)企業(yè)的時(shí)候,技術(shù)的轉(zhuǎn)變和能力的轉(zhuǎn)變是解決從實(shí)驗(yàn)室到產(chǎn)業(yè)化的“最后一公里”最關(guān)鍵的問題?!?/p>

——胡郁,科大訊飛聯(lián)合創(chuàng)始人、輪值總裁

源頭技術(shù)壁壘只是“產(chǎn)學(xué)研”企業(yè)立足市場的根本要素之一,科大訊飛面臨的更大的挑戰(zhàn)在于如何找到適應(yīng)企業(yè)不同發(fā)展階段的產(chǎn)業(yè)化落地路徑,實(shí)現(xiàn)從“技術(shù)高地”向“企業(yè)價(jià)值高地”的跨越??梢园l(fā)現(xiàn),基于技術(shù)成熟度、市場環(huán)境的不同,科大訊飛進(jìn)行產(chǎn)業(yè)化落地的方式也在演進(jìn)。

如何將自主語音技術(shù)推向市場?創(chuàng)業(yè)初期,劉慶峰對科大訊飛的定位是直接面向大眾消費(fèi)市場銷售智能語音產(chǎn)品。2000年訊飛推出一款針對PC的智能語音軟件“暢言2000”,試圖在PC端將語音輸入與傳統(tǒng)鍵盤文本輸入結(jié)合起來,軟件定價(jià)在2000元人民幣/套,同時(shí)在全國十余個(gè)省份推進(jìn)廣告投放和對外招商。然而,由于彼時(shí)國內(nèi)軟件市場盜版猖獗,且PC普及率較低、C端用戶的教育和售后服務(wù)成本高,訊飛直接切入2C市場的嘗試失敗了,訊飛資金鏈也因此承受了極大壓力。

科大訊飛最初成型的商業(yè)模式——“iFLY-inside”。類似于“Intel-inside”,是2B模式的一種,科大訊飛并不直接面向終端應(yīng)用市場,而是基于其掌握的核心技術(shù),向開發(fā)商提供語音支持軟件服務(wù)。

在此背景下,劉慶峰嘗試轉(zhuǎn)戰(zhàn)2B市場,第一步的嘗試是尋求與中國電信合作,將訊飛的自主語音合成技術(shù)應(yīng)用在168聲訊系統(tǒng)。但問題是,大型企業(yè)客戶十分強(qiáng)調(diào)產(chǎn)品的技術(shù)成熟度以及與之相關(guān)的用戶使用體驗(yàn),且一旦選定系統(tǒng)開發(fā)商則后期轉(zhuǎn)換成本極高,故而中國電信并不愿意將這筆價(jià)值上億的訂單交給訊飛十幾人的創(chuàng)業(yè)團(tuán)隊(duì),而是希望尋找具備成熟的系統(tǒng)集成能力和企業(yè)綜合實(shí)力的大型行業(yè)系統(tǒng)開發(fā)商。

轉(zhuǎn)機(jī)發(fā)生在2000年的深圳高交會,科大訊飛的語音合成系統(tǒng)引起了華為公司的注意,彼時(shí)華為正在開發(fā)智能網(wǎng)、呼叫中心這一類電信級產(chǎn)品,劉慶峰有機(jī)會將訊飛的語音技術(shù)“嵌入”到華為的產(chǎn)品系統(tǒng)中,再借由華為推向市場。2000年前后,任正非對語音技術(shù)高度重視,對科大訊飛的語音合成系統(tǒng)進(jìn)行了極為嚴(yán)格的技術(shù)測試。為此,科大訊飛最核心、最骨干的研發(fā)團(tuán)隊(duì)直接入駐華為現(xiàn)場,通過不斷的測試、修改,將訊飛仍處于實(shí)驗(yàn)室狀態(tài)的產(chǎn)品,在穩(wěn)定性、工程化方面,優(yōu)化至可以滿足真正大規(guī)模商用的標(biāo)準(zhǔn),從而贏得了華為的長期訂單。

經(jīng)歷了創(chuàng)業(yè)前期的試錯(cuò)以及華為合作模式的成功,劉慶峰意識到,訊飛的技術(shù)沒有問題,出問題的是商業(yè)模式:“科大訊飛這個(gè)初創(chuàng)的團(tuán)隊(duì)不知道怎么做市場、怎么做產(chǎn)品,我們(暫時(shí))只有技術(shù)”,因而無論是直接做消費(fèi)市場,還是面向大企業(yè)客戶直接銷售產(chǎn)品,“都有些理想化”,需要重新調(diào)整思路——“我們可以把核心技術(shù)和別人去‘拼盤,讓有渠道、有市場、有技術(shù)的大公司去把產(chǎn)品做好、賣向應(yīng)用市場,從而實(shí)現(xiàn)訊飛技術(shù)的初步價(jià)值。”

由此,科大訊飛發(fā)展出最初成型的商業(yè)模式——“iFLY-inside”。具體而言,“iFLY-inside”類似于“Intel-inside”,是2B模式的一種,也即科大訊飛并不直接面向終端應(yīng)用市場,而是基于其掌握的核心技術(shù),向開發(fā)商提供語音支持軟件服務(wù)。與華為的成功案例幫助科大訊飛迅速推動上述商業(yè)模式落地:其一,面向華為、中興、東軟等行業(yè)應(yīng)用系統(tǒng)開發(fā)商,提供電信級語音軟件;其二,面向聯(lián)想、方正、日立等數(shù)碼終端產(chǎn)品開發(fā)商,提供嵌入式語音軟件。

然而,科大訊飛高級副總裁江濤表示,“iFLY-inside”模式限定了科大訊飛僅僅是出售核心技術(shù)的“賦能者”,從而帶來兩方面“短板”:第一,科大訊飛只能在行業(yè)價(jià)值鏈中占據(jù)很小的一個(gè)環(huán)節(jié),利潤空間有限——例如,“華為的一套應(yīng)用系統(tǒng)售價(jià)大幾千萬,但科大訊飛從中收取的License費(fèi)用可能只有二三十萬”;第二,科大訊飛在將核心技術(shù)交付給開發(fā)商后,在終端用戶環(huán)節(jié)面臨“黑匣子”——也即科大訊飛既不能根據(jù)終端用戶的使用反饋對其技術(shù)進(jìn)行優(yōu)化和迭代,也無法積累終端用戶數(shù)據(jù)。

2004年扭虧為盈后,隨著公司在產(chǎn)品能力、市場能力、團(tuán)隊(duì)規(guī)模上的成長,科大訊飛開始直接面向行業(yè)終端用戶,嘗試開發(fā)應(yīng)用系統(tǒng)。在行業(yè)選擇上,科大訊飛瞄準(zhǔn)的均是集中度、壟斷性較高行業(yè),包括:在教育行業(yè)承接國家語委“計(jì)算機(jī)口語測評”需求,推出普通話、英語口語測評產(chǎn)品;向中國聯(lián)通、中國移動等電信運(yùn)營商提供語音搜索增值業(yè)務(wù),代表產(chǎn)品為基于語音搜索的電話彩鈴/炫鈴系統(tǒng);向政府、電信、公安、煙草等行業(yè)客戶銷售具有語音特色的信息服務(wù)與管理系統(tǒng)。

科大訊飛在上述行業(yè)應(yīng)用領(lǐng)域的起步,往往得益于其在一個(gè)由政府機(jī)構(gòu)或企事業(yè)單位主導(dǎo)的行業(yè)取得了先發(fā)優(yōu)勢,從而積累了基礎(chǔ)數(shù)據(jù)資源和行業(yè)成功案例。

以教育業(yè)務(wù)為例:科大訊飛依靠其自主研發(fā)的語音測評技術(shù)切入教育業(yè)務(wù)板塊。2006年,科大訊飛的計(jì)算機(jī)口語測評技術(shù)經(jīng)國家語委鑒定達(dá)到實(shí)用化水平,并開始在國家語委和教育部語用司、語信司的指導(dǎo)下進(jìn)行應(yīng)用產(chǎn)品開發(fā);同年10月,科大訊飛正式發(fā)布普通話口語測評產(chǎn)品,并在國家語委在上海主辦的“普通話水平測試與規(guī)范創(chuàng)新論壇”上向全國各地語委專家開放試用,截至2008年訊飛IPO時(shí)已在安徽、上海、江蘇、遼寧和重慶五省市完成落地。

在上述兩種2B模式下,科大訊飛基本確定了在其核心語言技術(shù)的商業(yè)模式和產(chǎn)業(yè)鏈地位,并根據(jù)技術(shù)特點(diǎn)和商用環(huán)境不同形成了三類盈利模式:其一,電信級語音平臺和嵌入式語音軟件采用授權(quán)許可的模式,按用戶的使用數(shù)量收費(fèi);其二,一般行業(yè)應(yīng)用軟件采用軟件系統(tǒng)銷售的模式,通常是一次性銷售;其三,行業(yè)應(yīng)用軟件中的語音增值業(yè)務(wù)則采用合作運(yùn)營收入分成的模式,從運(yùn)營收益中獲得分成收入。

科大訊飛的AI落地路徑

在核心語音業(yè)務(wù)逐漸發(fā)展成型的同時(shí),劉慶峰團(tuán)隊(duì)再次感知到了外界技術(shù)環(huán)境的變化。

在傳統(tǒng)的模式識別框架下,語音識別技術(shù)需要人為地對數(shù)據(jù)進(jìn)行特征提取和分類歸納,進(jìn)化速度較慢,機(jī)器語音識別準(zhǔn)確率在2000年后的10年內(nèi)長期停留在70%-80%,限制了行業(yè)應(yīng)用場景的拓展;然而,2006年AI領(lǐng)域巨擘杰弗里·欣頓(Geoffrey Hinton)在《科學(xué)》(Science)雜志發(fā)表了《利用神經(jīng)網(wǎng)絡(luò)刻畫數(shù)據(jù)維度》(Reducing the dimensionality of data with neutral networks)一文,奠定了深度學(xué)習(xí)的理論框架;2009年,前微軟人工智能首席科學(xué)家鄧力與杰弗里·欣頓(Geoffrey Hinton)在上述文章基礎(chǔ)上發(fā)表《語音識別的深度學(xué)習(xí)及其應(yīng)用》(Deep Learning for Speech Recognition and Related Applications),成為深度學(xué)習(xí)在語音識別方面的經(jīng)典研究。上述深度學(xué)習(xí)理論框架的出現(xiàn)免除了人為歸納、提煉特征的環(huán)節(jié),從而明顯加速了語音識別技術(shù)的進(jìn)化速度——據(jù)江濤介紹,“基于深度學(xué)習(xí)理論框架,在美國由Google公司做出了一套英文語音識別技術(shù),在中國則是科大訊飛做出了一套中文語音識別技術(shù)?!?/p>

而在研發(fā)上述語音識別技術(shù)的同時(shí),科大訊飛研究院的科學(xué)家團(tuán)隊(duì)發(fā)現(xiàn),深度學(xué)習(xí)理論框架不僅適用于語言識別、圖像識別等感知智能領(lǐng)域,還可以擴(kuò)展至自然語言處理、機(jī)器翻譯、邏輯推理等認(rèn)知智能領(lǐng)域,從而幫助機(jī)器從“能聽會說”真正邁向“能理解、會思考”。

在此背景下,科大訊飛于2012年起開始醞釀從感知智能向認(rèn)知智能的跨越,并于2014年正式啟動“訊飛超腦”人工智能計(jì)劃,目標(biāo)在于“研發(fā)具有深層語言理解、全面知識表示、邏輯推理聯(lián)想、自主學(xué)習(xí)進(jìn)化等能力的人工智能系統(tǒng)”。然而,人工智能技術(shù)規(guī)?;涞氐穆窂皆诤畏??

在認(rèn)知智能領(lǐng)域,人工智能技術(shù)在不同應(yīng)用層面的成熟度不同:“在專才層面,利用人工智能學(xué)習(xí)行業(yè)專家知識和經(jīng)驗(yàn),進(jìn)而解決有規(guī)律可循、有標(biāo)準(zhǔn)答案的問題,是目前AI業(yè)界內(nèi)廣泛認(rèn)為已經(jīng)可行的;在通才領(lǐng)域,利用人工智能解決一般性問題,例如回答高考試卷(特點(diǎn)是雖然問題有較為統(tǒng)一的答案,但學(xué)科覆蓋面很廣),目前全球沒有團(tuán)隊(duì)解決這一問題;而上升到常識領(lǐng)域,讓人工智能發(fā)展出適用于消費(fèi)者日常生活場景的常識推理能力,目前技術(shù)還處在‘六齡童的水平?!?/p>

科大訊飛從單一的核心技術(shù)提供商模式向基于云端的開放型平臺思維的轉(zhuǎn)變,始于2007年逐漸興起的互聯(lián)網(wǎng)熱潮。伴隨著大數(shù)據(jù)和云計(jì)算的快速發(fā)展,百度、搜狗等互聯(lián)網(wǎng)公司紛紛入局智能語音賽道,互聯(lián)網(wǎng)思維下的技術(shù)免費(fèi)模式對科大訊飛的傳統(tǒng)2B模式形成潛在挑戰(zhàn)。劉慶峰表示:“隨著互聯(lián)網(wǎng)應(yīng)用逐漸興起,我們陸續(xù)收到了來自中小企業(yè)和開發(fā)者的很多反饋,他們很想使用訊飛的技術(shù),但我們的客戶主要定位在大中型企業(yè),因?yàn)橛嶏w提供的技術(shù)往往有較高門檻,企業(yè)需要先花費(fèi)高額資金購買訊飛的技術(shù),才能再去開發(fā)自己的應(yīng)用,這對于中小企業(yè)和個(gè)人開發(fā)者來說,過于昂貴。”劉慶峰由此萌生了平臺思路:“用戶擰開水龍頭,就可以接到水,但他不見得非要自己建個(gè)小型自來水廠。”

猜你喜歡
語音人工智能
微信語音恐懼癥
SCHMID語音交換系統(tǒng)維護(hù)與維修案例淺析
魔力語音
Magic Phonetics魔力語音
人工智能之父
2019:人工智能
對方正在輸入……
人工智能與就業(yè)
數(shù)讀人工智能
微軟語音識別錯(cuò)誤率行業(yè)最低
余干县| 伊宁市| 安远县| 驻马店市| 会同县| 新干县| 铜川市| 濮阳县| 贡嘎县| 邹平县| 温宿县| 锡林浩特市| 镇原县| 乌鲁木齐县| 台东县| 曲靖市| 黄龙县| 班玛县| 佛坪县| 汉寿县| 通榆县| 塔城市| 盐池县| 简阳市| 利川市| 射阳县| 柏乡县| 都匀市| 青神县| 开化县| 荔波县| 泰兴市| 新津县| 平顺县| 屯昌县| 汾西县| 社旗县| 日照市| 南召县| 南丰县| 稷山县|