文/本刊記者 陳 杰
籌備8個月,初、復賽鏖戰(zhàn)3個月,千支隊伍角逐,首屆中文NL2SQL挑戰(zhàn)賽結果揭曉。
10月12日下午,由追一科技主辦、南京大學計算機軟件新技術國家重點實驗室協(xié)辦的“首屆中文NL2SQL挑戰(zhàn)賽”總決賽答辯暨頒獎典禮在南京大學舉行。經過最終決賽的5強選手隊伍精彩分享、答辯和現(xiàn)場評委考評,決出最終名次。來自國防科技大學的選手團隊“不上90不改名字”奪得冠軍,國雙科技選手團隊“BugCreater”獲得亞軍,觀安信息與妙盈科技選手聯(lián)合團隊“Model S”獲得季軍,來自華南理工大學與佛羅里達大學的選手隊伍“大佬帶我飛”,以及浙江大學的團隊“老哥們不放假嗎”則獲得優(yōu)勝獎。
首次舉辦、首次發(fā)布中文數(shù)據(jù)集,短短幾個月,選手們的成績,已經超過了國外WikiSQL,直奔“九十分”,讓眾多評委感覺“驚喜”。最終的現(xiàn)場答辯對決,讓之前的短暫排名,再生懸念。
由眾多人工智能大咖組成的專家評委團,包括中國移動研究院首席科學家馮俊蘭、復旦大學教授肖仰華、新加坡南洋理工大學副教授毛可智、南京大學教授俞揚、追一科技CTO劉云峰等產學研多方代表,在決賽現(xiàn)場對選手們的技術方案,進行了專業(yè)精彩的分析點評,從而產生最終結果。從AI與數(shù)據(jù)庫交互,到更廣闊的創(chuàng)新空間,自然語言處理的“技術大年”味道越來越濃。
“此次挑戰(zhàn)賽參與規(guī)模、選手表現(xiàn)遠超預期,顯示出NL2SQL在學術和產業(yè)應用上的潛力,數(shù)據(jù)庫的交互創(chuàng)新,正在受到越來越多關注。”追一科技聯(lián)合創(chuàng)始人兼CTO劉云峰博士表示,追一科技將與更多院校、企業(yè)界同仁攜手,共同推動中文NLP研究與應用突破。
NL2SQL(自然語言轉結構化查詢語句)作為新興的研究領域,在國外由SalesForce耶魯大學等發(fā)布了WikiSQL和Spider數(shù)據(jù)集,但在國內市場,目前還處于起步階段。
此次NL2SQL挑戰(zhàn)賽是國內首次舉辦,期間,追一科技發(fā)布了業(yè)內首個大規(guī)模的中文數(shù)據(jù)集,包括4870張表格數(shù)據(jù)、近50000條標注數(shù)據(jù)以及相應的SQL語句,并獲得很多學界專家、產業(yè)界伙伴的支持,通過“產學研”等多方聯(lián)動,希望提供一個平臺,來推動NL2SQL的研究和應用。
“直接用自然語言訪問關系型數(shù)據(jù)庫一直是業(yè)界夢想”,嘉賓評委代表肖仰華表示,隨著對大數(shù)據(jù)價值的重視,這一愿望更變得日益迫切。此次比賽的發(fā)起和中文數(shù)據(jù)集的公布,在短短的時間里,加速了NL2SQL研究設想的實現(xiàn),“最終選手的成績,完全超出了我們對于比賽的預期?!?/p>
經過選手的不斷努力與探索,比賽任務短期內就達到與英文數(shù)據(jù)集上相當水平的分數(shù),并持續(xù)刷新記錄。比賽初期,準確率尚為60%多,至8月份初賽結束時,榜上頭部分數(shù)已經達到89%,接近WikiSQL成績。復賽結束時,選手最高成績達到92%,并且,最終晉級決賽的5支隊伍,個個都在“90分”以上。
據(jù)了解,本次1457支參賽隊伍中,院校和企業(yè)參與者各占“半壁江山”。其中,學生及科研人員占比48%,企業(yè)技術員工占比52%。學生參賽隊伍來自眾多知名院校,如北京大學、清華大學、復旦大學、上海交通大學、南京大學、浙江大學、中國科學技術大學、哈爾濱工業(yè)大學、西安交通大學等。
雖然本次比賽的數(shù)據(jù)內容是中文形式,但仍然吸引了美國、英國、新加坡、日本、澳大利亞、加拿大等海外頂級院校參與,包括卡內基梅隆、墨爾本大學、新加坡國立大學、南安普頓大學、新南威爾士大學、布里斯托大學、昆士蘭大學等。
作為新興NLP研究任務,NL2SQL在專業(yè)難度上,也對選手提出較高要求。據(jù)了解,本次參賽選手中,碩士及以上學歷占比57%,其中,博士學歷占比6%;而專業(yè)分布上,計算機科學專業(yè)背景的選手則屬于參賽主力。
在如火如荼的比賽背后,NL2SQL應用潛力,也受到了越來越多的矚目。來自中國移動、平安集團、搜狗、達闥科技、中興通訊、網宿科技、國雙科技、捷通華聲等眾多企業(yè)的技術人員,也成為參賽隊伍的重要力量。
“此次挑戰(zhàn)賽參與規(guī)模遠超預期,顯示出NL2SQL在學術和產業(yè)應用上的潛力,數(shù)據(jù)庫的交互創(chuàng)新,正在受到越來越多關注?!眲⒃品宀┦勘硎?,中文NLP研究與應用突破需要產學研界的同共努力。