劉巖
如果你在百度、必應等搜索引擎中輸入“明晚從上海到廣州的航班,東航”等類似問題,得到的答案往往是航班時刻表鏈接等模糊答案,甚至是各種風馬牛不相及的答案。最終還需要進一步搜索,通過多步操作才能找到想要的航班信息。
“出門問問”語音助手則能幫用戶找到想要的信息。這款語音工具能從出發(fā)地、目的地、去程日期、返程時間、價格、航空公司等多個維度幫助用戶查詢,答案還能一步到位,而且精準度非常高。它還能聰明地解析出口語中常用的“東航”即為“東方航空”等各種復雜的詢問信息。除了查詢航班信息外,出門問問還能查詢火車票和酒店、餐館、藥店、銀行等各種周邊生活信息。目前,他們首選微信公眾平臺進行推廣。
怎么想到做這個方向的?
這是一個靠技術驅(qū)動的創(chuàng)業(yè)團隊。2012年底,出門問問創(chuàng)始人李志飛拿到天使投資后回國創(chuàng)業(yè)。早在2000年之前,他已經(jīng)開始從事移動互聯(lián)網(wǎng)相關工作,一直想在移動互聯(lián)網(wǎng)領域成就一番作為,之后在約翰霍普斯金大學攻讀博士期間的研究方向為智能機器人翻譯,當時他寫了很多相關領域的學術論文,他曾開發(fā)的一個開源機器翻譯軟件已經(jīng)成為世界學術界兩大主流機器翻譯軟件之一,斯坦福、麻省理工大學等都會使用。畢業(yè)之后,李志飛加入谷歌總部擔任科學家,從事機器翻譯的研究和開發(fā)工作。
隨著移動互聯(lián)網(wǎng)的需求放量,李志飛認為計算能力的提高、大數(shù)據(jù)量的存在等各方面已經(jīng)取得突破。語音識別、機器翻譯等技術在經(jīng)歷幾波熱潮之后,他感覺是時候加入創(chuàng)業(yè)大軍中來了。
跟同類產(chǎn)品的差異是什么?
目前市場上有智能360、小i機器人、搜狗語音助手、訊飛等各種Siri跟隨者。就產(chǎn)品形態(tài)來看,他們多是以打電話、發(fā)短消息、信息查找等形式展開查詢,強調(diào)上下文對話時語義的解析功能。
出門問問弱化了對話功能,不存在上下文對話解析,即不允許用戶進行先問“上海明天的天氣如何”再問“那北京呢”這種提問方式。出門問問更突出信息搜索功能。這樣做的好處是避免了“所問非所答”現(xiàn)象的出現(xiàn)。之所以不做上下文解析和多對話解析的原因在于,李志飛認為目前這種技術實現(xiàn)難度比較高。目前,出門問問跟定位于國外市場的Google Now產(chǎn)品形態(tài)更為相似。
特色在哪里?
出門問問的工作原理分為三部分:第一步,語音識別,即將聲音轉(zhuǎn)化成文字;第二步,語義分析,將時間、地點等關鍵字轉(zhuǎn)化成表格;第三步,應用對接,即所謂垂直領域的搜索。出門問問最擅長、最核心的是第二步:語義分析。
拿機票查詢案例說明。出門問問會將出發(fā)地、目的地、時間、價位、班次等多維度查詢參數(shù)轉(zhuǎn)化成表格。解析時,能判斷“下星期二是幾號”,即使句式顛倒也不影響查詢效果。哪怕輸入“魔都”去“帝都”的飛機班次,也能識別出來。
在李志飛看來,要做好任何一種機器學習系統(tǒng)必須具備三大元素:核心算法、系統(tǒng)架構、基礎數(shù)據(jù)量。具備一定的數(shù)據(jù)量和核心算法之后,是否具備圍繞核心算法的輔助性工具非常關鍵。于是,李志飛團隊用六個多月時間搭建了一套系統(tǒng),系統(tǒng)的亮點在于實現(xiàn)了模塊化、工具化。這就是他們的核心競爭力之所在。
因此,即使不懂編程的員工也能在系統(tǒng)中添加數(shù)據(jù)。這意味著出門問問的可擴展性比較強,若他們想轉(zhuǎn)向生活消費類外的其他細分領域,只需要非技術性人員花兩三天時間就能完成一套垂直領域類語義分析系統(tǒng)的搭建。這套通用性、自動化系統(tǒng)搭建成型之后,出門問問以后的工作是不斷優(yōu)化系統(tǒng),繼續(xù)提高系統(tǒng)查詢精準度。