程俊濤 李健博
摘 要 智能問答系統(tǒng)發(fā)展至今經(jīng)歷了三個階段:基于結(jié)構(gòu)化數(shù)據(jù)的發(fā)展階段,基于自由文本數(shù)據(jù)的發(fā)展階段,基于問題答案對數(shù)據(jù)的發(fā)展階段。而第一個階段又分為人工智能階段和計算機語言學階段。無論是日常生活中的查閱資料,還是在科學研究、商業(yè)金融等領域的應用都有智能問答的參與,所以智能問答的發(fā)展與管理將是人們不可忽視的研究方向。
關鍵詞 智能問答;自然語言處理;知識庫;金融領域;sector
1 智能問答的發(fā)展歷史
智能問答的歷史可以追溯到70年前,計算機科學之父阿蘭·圖靈早在1950年就指出了一種驗證機器是否具有智能的方法——圖靈測試。在此之后的20年里,這項研究沒有取得任何進展。
后來計算機科學家開始用計算機算法描述自然語言的語法規(guī)則。但是人類的語言十分復雜,而且人類的語言不一定符合語法,所以科學家不可能描述所有的語法規(guī)則。而且自然語言中存在著大量的一詞多義以及常識性問題,計算機無法處理。例如計算機科學家明斯基曾經(jīng)指出的兩個句子,“The pen is in the box.”和“the box is in the pen.”。因為人們有常識,盒子不可能在鋼筆里面,所以很容易理解第一個pen指的是鋼筆,第二個pen指的是圍欄。然而這會讓計算機很“困惑”。
20世紀70年代后,計算機科學家首次用數(shù)學和統(tǒng)計的方法研究自然語言,取得了巨大進步。簡單來說用統(tǒng)計語言模型判斷一個句子是否合理,就是判斷其出現(xiàn)的可能性大小。顯然統(tǒng)計全世界每句話出現(xiàn)的概論是不可能實現(xiàn)的,所以俄國數(shù)學家馬爾科夫提出了馬爾科夫假設,后人將其完善稱為N-1階馬爾科夫假設。簡單來說文中某個詞出現(xiàn)的概論只與其前N-1個詞有關,這樣既簡化了實際問題,使計算每個詞出現(xiàn)的概論成為可能,又保證了模型的準確度[1]。
20世紀90年代,隨著計算機運算速度的提升和獲取大量數(shù)據(jù)的便捷性,又誕生了基于機器學習的自然語言處理,這是一種不依賴于規(guī)則設計的數(shù)據(jù)學習算法,通過數(shù)據(jù)學習構(gòu)建分析系統(tǒng),不依賴明確的構(gòu)建規(guī)則。機器學習事先不給出任何假設,一個預測模型中假設越少,預測效果越好。
2 智能問答系統(tǒng)的成果
如今智能問答系統(tǒng)蓬勃發(fā)展,取得了很大的突破,普遍應用于人們的日常生活之中。市場上的智能問答的產(chǎn)品大致分成三類:第一類是以各大電商為首的智能客服機器人,主要用于回答顧客購買商品相關疑問,解決普遍的問題。第二類主要是以完成用戶指令,輔助用戶完成任務為目的的產(chǎn)品,用戶可以命令它們打開應用程序,為自己設置日程提醒,查詢天氣等。第三類是像微軟小冰這樣的產(chǎn)品,微軟賦予它自我學習能力,賦予了人工智能創(chuàng)造的能力。
第一類問答系統(tǒng)并不具有智能,完全依靠大量的人力去維護它,更新它的知識庫才能使用。第二類智能問答系統(tǒng)基于機器學習和人工智能,專注于完成用戶的命令,有一定的學習能力,但是在理解人類語言,與人類友好交互的方面存在不足。第三類智能問答系統(tǒng)的優(yōu)勢正是有好的交互性,以微軟小冰為例,恰好是與人類聊天,進行情感交流,使對話進行下去而不是盡快結(jié)束對話。
3 智能問答在金融領域的應用
在金融領域,投資者往往想最快速度的捕獲信息,并進行信息的提取和分析,而且投資決策往往是非常復雜的,把金融解釋成“速度的游戲”其實也不為過,所以金融領域的智能問答更偏向于投資顧問+智能問答這兩者的結(jié)合,這是一種對于企業(yè)基礎業(yè)務的分析,提取觀點,挖掘知識,從而輔助決策。更加具體地說就是把智能問答作為基礎,在這個基礎上加以框架和數(shù)據(jù)進行智能分析與解答。所以總的來看在技術層面就包括了兩個部分,第一個是對于知識數(shù)據(jù)庫的搭建,由于現(xiàn)在互聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)達,信息量大,所以對于有效信息的知識數(shù)據(jù)庫的構(gòu)建就顯得尤為重要,搭建知識數(shù)據(jù)庫,可以在相關材料收集之后的基礎上進行整合。第二個部分就是用戶如何能夠使用智能問答系統(tǒng),首先就是對問題的解析,然后根據(jù)系統(tǒng)的分析給出想要的結(jié)果。這種方式不僅可以給用戶節(jié)約大量的收集信息的時間,而且還能提供系統(tǒng)分析的數(shù)據(jù)供用戶參考。
在金融領域,智能問答的發(fā)展可以說是相當迅速的,在如今這個大數(shù)據(jù)時代,大量數(shù)據(jù)所帶來的也可以是巨大的知識庫,這就為問答技術提供了數(shù)據(jù)知識基礎,與其說是新的技術,也可以解釋成一種新的產(chǎn)業(yè),所以當今的智能問答,不止于此。
4 結(jié)束語
在互聯(lián)網(wǎng)產(chǎn)業(yè)飛速增長和數(shù)據(jù)爆發(fā)的大背景下,當我們想讓大量數(shù)據(jù)快速轉(zhuǎn)換成有用信息的時候,我們往往需要一種智能的模式來滿足我們的需求,而對于乘著互聯(lián)網(wǎng)浪潮的智能問答系統(tǒng),正是用戶所需要的。與其說智能問答是一種技術,不如說是一種模式,給用戶更好的體驗,讓繁雜的數(shù)據(jù)變成有效的信息,進一步轉(zhuǎn)化成智慧,正是智能問答所能夠完成的,也是我們所期待的智能系統(tǒng)。
參考文獻
[1] 吳軍.數(shù)學之美.第2版[M].北京:人民郵電出版社,2014:207.
作者簡介
程俊濤(1998-),男,河南人;首都經(jīng)濟貿(mào)易大學信息學院16級信管。
李健博(1998-),男,北京人;首都經(jīng)濟貿(mào)易大學信息學院16級信管。