劭浩
當(dāng)前,科技的發(fā)展使得數(shù)據(jù)量呈指數(shù)增長,更新速度也越來越快,有研究表明,過去3年間產(chǎn)生的數(shù)據(jù)量已經(jīng)超過人類歷史以往數(shù)據(jù)的總和。在大數(shù)據(jù)時(shí)代,通過人工閱讀資料、處理數(shù)據(jù)變得愈發(fā)困難,這也就導(dǎo)致了大量數(shù)據(jù)的堆積而不能有效發(fā)揮其應(yīng)有的作用。人們逐漸意識(shí)到可以利用先進(jìn)的數(shù)據(jù)挖掘方法從中找出大量有價(jià)值的信息,更好地理解和領(lǐng)會(huì)海量數(shù)據(jù)中隱含的知識(shí),加速學(xué)習(xí)過程,從而“喚醒沉睡的價(jià)值”。
在WTO,每年都會(huì)產(chǎn)生大量的文本資料,包括各種會(huì)議記錄、法規(guī)條文、貿(mào)易協(xié)定文本以及爭端解決案等等。這些文檔的涵蓋內(nèi)容之多,范圍之廣,跨度之大,已經(jīng)超出了在短時(shí)間內(nèi)用人工進(jìn)行翻譯、理解、歸納和分析的范圍。如何使得專家能夠在有限的時(shí)間內(nèi)掌握更多的信息,從而在談判中掌握主動(dòng)權(quán)和優(yōu)勢(shì)?大數(shù)據(jù)挖掘給我們提供了一種新的思路。針對(duì)貿(mào)易政策審議報(bào)告(Trade Policy Review,TPR)而言,通過文本挖掘,可以找出其涵蓋的全部貿(mào)易議題,分析出政策和議題的變化趨勢(shì),并從文字中挖掘出政府和機(jī)構(gòu)對(duì)于某個(gè)議題的態(tài)度,從而輔助專家進(jìn)行文本的閱讀和理解,大幅提高其工作效率。
貿(mào)易政策審議機(jī)制是WTO在總結(jié)GATT運(yùn)行四十余年的經(jīng)驗(yàn)基礎(chǔ)上,在烏拉圭回合中期評(píng)審中通過并發(fā)展起來的。它是WTO的重要監(jiān)督機(jī)制,由貿(mào)易政策審議機(jī)構(gòu)負(fù)責(zé),定期對(duì)所有成員進(jìn)行審議。貿(mào)易政策審議機(jī)制協(xié)議第A條明確闡述了其主要目標(biāo)是“通過提高各成員貿(mào)易政策和做法的透明度并使之得到更好的理解,有助于所有成員更好地遵守多邊協(xié)定和使用的諸邊貿(mào)易協(xié)定的規(guī)則、紀(jì)律和在各協(xié)定下所作的承諾,從而有助于多邊貿(mào)易體制更加平穩(wěn)地運(yùn)行”。通過對(duì)貿(mào)易政策審議報(bào)告的分析,就能夠大體理解貿(mào)易的趨勢(shì)和走向,掌握不同國家參與國際經(jīng)貿(mào)治理的程度,具有重要的理論和實(shí)際意義。
大數(shù)據(jù)透視TPR
對(duì)貿(mào)易政策審議文本的分析,主要為了解決專家的三類需求:第一是通過數(shù)據(jù)挖掘方法快速瀏覽全部文本資料,歸納出文本的主要觀點(diǎn)和內(nèi)容以及對(duì)不同國家的評(píng)論態(tài)度進(jìn)行分類等。第二是通過主題挖掘模型,分析不同主題的分布和變化趨勢(shì),并歸納出文檔中不同主題的重要程度。第三是在搜集資料的基礎(chǔ)上建立檢索數(shù)據(jù)庫,對(duì)于專家給出的議題,能夠迅速抽取出相關(guān)資料并根據(jù)需要分析出相應(yīng)結(jié)果。
分析的手段包括對(duì)同一國家不同年份的報(bào)告進(jìn)行分析,對(duì)不同國家的相同議題的比較以及對(duì)會(huì)議提問的評(píng)論態(tài)度進(jìn)行分類等。上文中提到的關(guān)于中國G264報(bào)告中知識(shí)產(chǎn)權(quán)議題,如果對(duì)秘書處報(bào)告S264進(jìn)行相同的分析,就可以得到不同的結(jié)果。例如,在G264中,知識(shí)產(chǎn)權(quán)的重要程度為0.021,而在S264中的數(shù)值為0.046,這樣的信息需要引起專家的思考,在貿(mào)易政策審議會(huì)議的時(shí)候要特別注意其他國家針對(duì)知識(shí)產(chǎn)權(quán)方面的提問。又如對(duì)美國S275報(bào)告進(jìn)行比較可以發(fā)現(xiàn),對(duì)知識(shí)產(chǎn)權(quán)的關(guān)注度只有0.039,這在一方面說明了美國在知識(shí)產(chǎn)權(quán)領(lǐng)域已經(jīng)比較成熟,而另一方面也說明中國正逐步完善知識(shí)產(chǎn)權(quán)保護(hù),因此也得到了更多的關(guān)注。同時(shí),我們也可以通過情感分析得出不同國家對(duì)中國的評(píng)論態(tài)度有何不同。
而如果對(duì)同一個(gè)國家(區(qū)域)進(jìn)行不同年份的趨勢(shì)分析,也可以得到一些有價(jià)值的信息。例如對(duì)歐盟9年度的貿(mào)易政策審議報(bào)告進(jìn)行主題挖掘,我們可以得到針對(duì)特定議題的關(guān)注度的變化趨勢(shì)。舉例來說,對(duì)農(nóng)業(yè)補(bǔ)貼的關(guān)注程度從1995年到2013年呈現(xiàn)出先上升后下降的趨勢(shì)。這是因?yàn)闉榱诉m應(yīng)WTO談判達(dá)成的有關(guān)《農(nóng)業(yè)協(xié)定》及新一輪談判的要求,1999年歐盟委員會(huì)通過了《歐盟2000年議程》,強(qiáng)調(diào)對(duì)農(nóng)業(yè)政策進(jìn)行徹底改革,其主要內(nèi)容是確定將2000-2006年的農(nóng)業(yè)預(yù)算支出凍結(jié)在每年405億歐元的水平上,同時(shí),分步驟、分階段地消減對(duì)主要農(nóng)產(chǎn)品的價(jià)格補(bǔ)貼,通過提供直接收入補(bǔ)貼的方式補(bǔ)償農(nóng)民因此造成的損失。因此,在2000到2006年中的關(guān)注程度就有了明顯的上升。
大數(shù)據(jù)助力WTO人才培養(yǎng)
數(shù)據(jù)就是財(cái)富,隨著數(shù)據(jù)挖掘技術(shù)的進(jìn)步,文本挖掘方法已經(jīng)可以在一定程度上挖掘出海量文本中有價(jià)值的信息。通過主題挖掘模型,可以分析WTO各個(gè)國家貿(mào)易政策審議報(bào)告文本,歸納出文本的主題并按照重要程度排序,提供檢索,并為談判專家提供指導(dǎo)性意見和建議。研究方法和模型也可以進(jìn)一步擴(kuò)展到其他類型的文本資料,例如分析WTO的貿(mào)易爭端案中不同國家和組織對(duì)某一特定案例的觀點(diǎn)和態(tài)度等。
中國在2001年加入WTO,至今已有十余年,但相對(duì)于關(guān)稅及貿(mào)易總協(xié)定(GATT)到WTO幾十年的歷史,仍是一個(gè)缺乏實(shí)踐經(jīng)驗(yàn)的成員。因此,中國有必要培養(yǎng)更多的專業(yè)人士來通過國際規(guī)則尋求國家利益。然而,人才培養(yǎng)和經(jīng)驗(yàn)積累都是長期的過程,這些專業(yè)人士必須了解大量的相關(guān)資料,具有良好的外語技能并且具備國際談判的實(shí)踐經(jīng)驗(yàn),不可能一蹴而就。大數(shù)據(jù)的挖掘技術(shù)可以在一定程度上加速人才培養(yǎng)的過程,加強(qiáng)談判專家對(duì)規(guī)則的理解和掌握,提升研究水平,并輔助進(jìn)行決策,使得中國在國際舞臺(tái)上擁有更強(qiáng)的主動(dòng)權(quán)和話語權(quán)。(作者邵浩為上海對(duì)外經(jīng)貿(mào)大學(xué)WTO學(xué)院講師,研究方向?yàn)閿?shù)據(jù)挖掘和機(jī)器學(xué)習(xí)。本文受上海高校智庫上海對(duì)外經(jīng)貿(mào)大學(xué)國際經(jīng)貿(mào)治理與中國改革開放聯(lián)合研究中心資助)
編輯|趙麗芳 lifang.zhao@wtoguide.net