立足金融科技賦能證券公司高質(zhì)量發(fā)展的時(shí)代背景,以ChatGPT為代表的新一代人工智能技術(shù)將深刻沖擊證券行業(yè)現(xiàn)有的行業(yè)格局和發(fā)展態(tài)勢(shì),引領(lǐng)新一輪數(shù)字化轉(zhuǎn)型進(jìn)程。本文系統(tǒng)研究了ChatGPT技術(shù)在證券公司的落地場(chǎng)景,通過(guò)深入剖析技術(shù)應(yīng)用過(guò)程中的痛點(diǎn)和堵點(diǎn),提出了人工智能驅(qū)動(dòng)下證券公司的轉(zhuǎn)型戰(zhàn)略和發(fā)展建議。
2022年11月30日,由Open AI公司開發(fā)的新一代人工智能聊天機(jī)器人ChatGPT(Chat Generative Pre-trained Transformer,對(duì)話生成式預(yù)訓(xùn)練變換模型)正式開放公眾使用。該產(chǎn)品甫經(jīng)推出便迅速引爆互聯(lián)網(wǎng),一躍成為2023年的開年“現(xiàn)象級(jí)”“賽道級(jí)”產(chǎn)品。作為人類歷史上月活躍用戶數(shù)最快突破1億人的消費(fèi)級(jí)應(yīng)用,ChatGPT將對(duì)現(xiàn)代科技的諸多細(xì)分領(lǐng)域產(chǎn)生顛覆性的影響。基于金融科技賦能證券公司高質(zhì)量發(fā)展的時(shí)代背景,以ChatGPT為代表的新一代人工智能技術(shù)將有望引領(lǐng)新一輪數(shù)字化轉(zhuǎn)型進(jìn)程,成為實(shí)現(xiàn)產(chǎn)業(yè)升級(jí)的有力抓手。
審慎認(rèn)知以ChatGPT為代表的新一代人工智能產(chǎn)品
ChatGPT的概念與核心特征
2018年,Open AI公司推出GPT-1.0大語(yǔ)言模型,利用“預(yù)訓(xùn)練+微調(diào)范式”實(shí)現(xiàn)了大規(guī)模無(wú)標(biāo)注語(yǔ)料庫(kù)的知識(shí)學(xué)習(xí)與泛化遷移任務(wù)。歷經(jīng)多年迭代,通過(guò)續(xù)躍進(jìn)式提升參數(shù)數(shù)量(1.17億至1750億)和訓(xùn)練數(shù)據(jù)量[5GB(吉字節(jié))至45TB(太字節(jié))],在GPT-3.5代大語(yǔ)言模型基礎(chǔ)上加入人類反饋強(qiáng)化學(xué)習(xí)、指令學(xué)習(xí)、有監(jiān)督精調(diào)等技術(shù),商用化的ChatGPT應(yīng)運(yùn)而生。2023年3月15日,可以處理文本與圖像兩種輸入信息的多模態(tài)大語(yǔ)言模型GPT-4.0發(fā)布,進(jìn)一步擴(kuò)展了其商業(yè)應(yīng)用的可能性。
作為GPT大語(yǔ)言模型家族的衍生分支,ChatGPT具有大訓(xùn)練、高算力、寬語(yǔ)料和人智化的主要特點(diǎn)。一方面,為實(shí)現(xiàn)自然語(yǔ)言閱讀、分析、推理能力,ChatGPT使用海量數(shù)據(jù)擬合模型參數(shù):訓(xùn)練階段總算力消耗約為3640 PF-days(每秒一千萬(wàn)億次計(jì)算,運(yùn)行3640個(gè)整日),需要約1萬(wàn)片圖形處理器(Graphics Processing Unit,簡(jiǎn)稱GPU)和25.8萬(wàn)片中央處理器(Central Processing Unit,簡(jiǎn)稱CPU)方能支撐運(yùn)行。另一方面,ChatGPT調(diào)用了規(guī)模龐大的語(yǔ)料庫(kù),可以精準(zhǔn)地在多輪次連續(xù)會(huì)話過(guò)程中有效識(shí)別人類意圖,更可以質(zhì)疑不正確問(wèn)題、主動(dòng)承認(rèn)錯(cuò)誤并優(yōu)化答案。在GPT-4.0時(shí)代,ChatGPT具有的圖像閱讀理解能力進(jìn)一步賦予其高級(jí)別的人智化特性,能夠更可靠且富有創(chuàng)造力地執(zhí)行長(zhǎng)形式的邏輯推理和內(nèi)容創(chuàng)建工作,輔助用戶更好地生成、編輯、迭代創(chuàng)意和技術(shù)性任務(wù)。
新一代人工智能技術(shù)的宏觀影響
目前,ChatGPT已開放多種API(Application Programming Interface,應(yīng)用程序編程界面)接口,企業(yè)和個(gè)人開發(fā)者僅需單行指令便能將ChatGPT引入應(yīng)用當(dāng)中。由此,基于人工智能的云端生態(tài)系統(tǒng)已初步形成,并將在宏觀層面產(chǎn)生全方位、多維度的影響。具體地,一是開發(fā)層面的技術(shù)壟斷:算力與數(shù)據(jù)的作用將超越算法,成為左右ChatGPT產(chǎn)品開發(fā)的主要決定性因素,當(dāng)前僅有具備強(qiáng)大算力儲(chǔ)備與數(shù)據(jù)基礎(chǔ)的頭部互聯(lián)網(wǎng)企業(yè)、計(jì)算機(jī)硬件企業(yè)和大型資本公司才能承擔(dān)急速擴(kuò)張的大數(shù)據(jù)訓(xùn)練需求和調(diào)試費(fèi)用。二是應(yīng)用層面的先手制勝:ChatGPT與自身業(yè)務(wù)的融合是企業(yè)實(shí)現(xiàn)降本增效、解決服務(wù)同質(zhì)化問(wèn)題的有力手段,開展ChatGPT落地應(yīng)用的時(shí)效性將決定企業(yè)在人工智能時(shí)代的先發(fā)優(yōu)勢(shì)。三是發(fā)展層面的通用化趨勢(shì):ChatGPT突破了聊天機(jī)器人范疇,更適合定義為一項(xiàng)基于大語(yǔ)言模型框架并具備人機(jī)智能交互能力的寬域應(yīng)用技術(shù)或應(yīng)用范式;ChatGPT技術(shù)開啟了“通用人工智能”時(shí)代,未來(lái)將深刻重塑科技行業(yè)的發(fā)展邏輯與發(fā)展態(tài)勢(shì),并在各個(gè)應(yīng)用維度帶來(lái)全新契機(jī)與挑戰(zhàn)。
ChatGPT技術(shù)在證券公司的落地應(yīng)用場(chǎng)景
實(shí)現(xiàn)業(yè)務(wù)流程“扁平化+貫通化”,打造“輕量型+科技型”中后臺(tái)
ChatGPT技術(shù)作為當(dāng)前人工智能領(lǐng)域的最新科技迭代成果,能夠有效推動(dòng)證券公司中后臺(tái)業(yè)務(wù)流程的優(yōu)化與創(chuàng)新。利用自然語(yǔ)言處理能力帶來(lái)的先進(jìn)人機(jī)交互能力、文本與數(shù)字孿生創(chuàng)作能力、圖片與視(音)頻合成能力,ChatGPT技術(shù)的表層應(yīng)用即可高效助力常規(guī)性、程序性的語(yǔ)料整理和信息發(fā)布等行政工作,有力釋放管理人員工作潛力。進(jìn)一步地,通過(guò)將ChatGPT 技術(shù)以插件形式嵌入公司辦公自動(dòng)化系統(tǒng)并打通業(yè)務(wù)流程相關(guān)的知識(shí)圖譜、云服務(wù)、大數(shù)據(jù)系統(tǒng),行政命令的起草、修改、傳達(dá),產(chǎn)品的合規(guī)與風(fēng)控管理,數(shù)據(jù)的傳輸、存儲(chǔ)、更新,均將以更加智能化的形式高效完成,全面賦能證券公司中后臺(tái)數(shù)字化轉(zhuǎn)型所急需的大數(shù)據(jù)治理、合規(guī)與審計(jì)管理、產(chǎn)品自動(dòng)化風(fēng)控等子系統(tǒng)平臺(tái)建設(shè)。
在此基礎(chǔ)上,ChatGPT技術(shù)的深層次應(yīng)用在于能夠有力改善各子系統(tǒng)之間“煙囪林立”的現(xiàn)狀,處理業(yè)務(wù)與數(shù)據(jù)“孤島化”等問(wèn)題。一方面,當(dāng)前證券公司中后臺(tái)各部門雖均已達(dá)成數(shù)字化轉(zhuǎn)型共識(shí),但各自的發(fā)展戰(zhàn)略和執(zhí)行稟賦卻不盡相同;各子平臺(tái)建設(shè)成果呈現(xiàn)“長(zhǎng)板長(zhǎng)”“短板短”的現(xiàn)象。另一方面,證券公司中后臺(tái)子系統(tǒng)群的協(xié)作體制機(jī)制仍處于初級(jí)階段:“點(diǎn)狀建設(shè)”突出、“線面建設(shè)”不足;系統(tǒng)間通信能力、模塊間橫向數(shù)據(jù)共享、業(yè)務(wù)端到端閉環(huán)支持均有待完善。ChatGPT技術(shù)作為寬域化、通用化人工智能系統(tǒng)集大成者,可協(xié)助中后臺(tái)子系統(tǒng)完成從被賦能到整合、歸一的建設(shè)流程,實(shí)現(xiàn)員工使用自然語(yǔ)言“提需求”,系統(tǒng)自動(dòng) “調(diào)模塊”“通數(shù)據(jù)”“助協(xié)作”“成文稿”的閉環(huán)。從ChatGPT技術(shù)融入證券公司中后臺(tái),到證券公司中后臺(tái)融入自有大語(yǔ)言模型綜合管理平臺(tái),可有力剪除公司運(yùn)維冗余、打通橫向主干流程、提升跨部門協(xié)作水平,最終實(shí)現(xiàn)證券公司中后臺(tái)智能化轉(zhuǎn)型,落實(shí)降本增效。
實(shí)現(xiàn)業(yè)務(wù)條線“精準(zhǔn)化+差異化”,形成“全場(chǎng)景+全天候”的前臺(tái)運(yùn)營(yíng)體系
在前臺(tái)業(yè)務(wù)條線服務(wù)端,ChatGPT技術(shù)主要通過(guò)發(fā)揮自然語(yǔ)言理解、分析、連續(xù)會(huì)話功能,完成對(duì)當(dāng)前紛繁的智能客服系統(tǒng)、智能投顧系統(tǒng)、財(cái)富管理系統(tǒng)等服務(wù)平臺(tái)的升級(jí)與整合,實(shí)現(xiàn)客戶與客服人員體驗(yàn)“雙提升”。在客戶角度,通過(guò)間斷或連續(xù)會(huì)話形式輸入投資場(chǎng)景、期望收益與風(fēng)險(xiǎn)約束、資金運(yùn)營(yíng)周期和規(guī)劃,基于GPT技術(shù)的人工智能前臺(tái)會(huì)在考慮宏觀政策、市場(chǎng)供需、產(chǎn)品庫(kù)與項(xiàng)目庫(kù)等內(nèi)外部數(shù)據(jù)資源的基礎(chǔ)上展開產(chǎn)品適配、估值與收益分析、項(xiàng)目評(píng)估等工作,迅速初步響應(yīng)客戶“投什么”“怎么投”“如何融資”等一系列核心需求。在客服人員角度,ChatGPT技術(shù)不僅能夠通過(guò)自動(dòng)識(shí)別客戶對(duì)話并檢測(cè)問(wèn)題、生成摘要、草擬個(gè)性化回復(fù)來(lái)實(shí)現(xiàn)“千人千面”的精準(zhǔn)營(yíng)銷,還可以協(xié)助建立客戶信息與業(yè)務(wù)關(guān)系的知識(shí)圖譜,在客戶觸達(dá)、調(diào)研、分流等核心模塊進(jìn)行集約化處置,實(shí)現(xiàn)客戶關(guān)系管理的精準(zhǔn)化、全面化。
在前臺(tái)業(yè)務(wù)條線生產(chǎn)端,ChatGPT技術(shù)在自然語(yǔ)言處理能力基礎(chǔ)上通過(guò)數(shù)據(jù)匯總比對(duì)、程序編寫修改、數(shù)理計(jì)算推導(dǎo)等邏輯功能,完成投研系統(tǒng)、資管系統(tǒng)、自營(yíng)系統(tǒng)、投行系統(tǒng)等生產(chǎn)平臺(tái)的迭代與整合。在證券研究角度,通過(guò)對(duì)行業(yè)與公司層面的數(shù)據(jù)、指標(biāo)、分析框架進(jìn)行深度學(xué)習(xí),重點(diǎn)依托結(jié)構(gòu)化與半結(jié)構(gòu)化的研究報(bào)告、研究主題、研究熱點(diǎn)等內(nèi)容進(jìn)行訓(xùn)練,ChatGPT技術(shù)可以全天候快速響應(yīng)研究人員在信息檢索、模型構(gòu)建、投資組合分析、報(bào)告生成等核心領(lǐng)域的現(xiàn)實(shí)需求。在投資管理角度,ChatGPT技術(shù)不僅能自動(dòng)提取產(chǎn)品關(guān)鍵信息與關(guān)鍵指標(biāo),通過(guò)對(duì)行業(yè)與公司同類型產(chǎn)品進(jìn)行深入比對(duì),多口徑、全流程地助力合規(guī)與風(fēng)控管理;還可以結(jié)合服務(wù)條線用戶反饋數(shù)據(jù),針對(duì)客戶畫像生成定向投放意見與建議,并進(jìn)一步生成產(chǎn)品可行性報(bào)告。在投資評(píng)價(jià)角度,ChatGPT技術(shù)可以完成行業(yè)評(píng)價(jià)體系與公司個(gè)性化評(píng)價(jià)體系的學(xué)習(xí)與應(yīng)用,按需從定性與定量方面生成結(jié)構(gòu)化或半結(jié)構(gòu)化的投行項(xiàng)目質(zhì)量報(bào)告、債券與基金產(chǎn)品評(píng)價(jià)報(bào)告、基金經(jīng)理評(píng)價(jià)報(bào)告等內(nèi)容,深化產(chǎn)品與人員的管理閉環(huán)。
證券公司應(yīng)用ChatGPT技術(shù)過(guò)程中存在的痛點(diǎn)和堵點(diǎn)
參與成本與應(yīng)用收益的矛盾
中國(guó)證券業(yè)協(xié)會(huì)發(fā)布的證券公司2022年度經(jīng)營(yíng)數(shù)據(jù)顯示,全行業(yè)140家證券公司受多重超預(yù)期因素沖擊導(dǎo)致經(jīng)營(yíng)業(yè)績(jī)短期承壓,行業(yè)營(yíng)業(yè)收入和凈利潤(rùn)較2021年分別下滑21.02%與25.11%。與之相對(duì)的,2023年作為新一代人工智能技術(shù)發(fā)展初期,芯片端CPU和GPU采購(gòu)成本、算力端云計(jì)算體系搭建成本、算法端商用自然語(yǔ)言處理技術(shù)部署成本高昂。國(guó)盛證券研究顯示:以當(dāng)前最具成本效益的英偉達(dá)A100服務(wù)器為算力基礎(chǔ),按2500萬(wàn)日度搜索量計(jì)算,ChatGPT初始算力投入約為8億美元、單次訓(xùn)練投入高達(dá)140萬(wàn)美元。以技術(shù)儲(chǔ)備和算力儲(chǔ)備而言,我國(guó)單一證券公司無(wú)論體量大小均無(wú)法獨(dú)立承建“證券+GPT”系統(tǒng)。何如在控制成本情況下深度跟進(jìn)ChatGPT技術(shù)并迅速實(shí)現(xiàn)落地化應(yīng)用,不僅是當(dāng)前證券公司實(shí)現(xiàn)差異化競(jìng)爭(zhēng)的有力抓手,也是我國(guó)證券行業(yè)亟需思考的重要問(wèn)題。
數(shù)據(jù)治理與智能失權(quán)的矛盾
數(shù)據(jù)是證券行業(yè)最重要的護(hù)城河,同時(shí)也是人工智能的主要燃料與驅(qū)動(dòng)力來(lái)源。一方面,行業(yè)數(shù)據(jù)、私有數(shù)據(jù)以及在此基礎(chǔ)上衍生的研究服務(wù)和投資決策是證券公司的核心競(jìng)爭(zhēng)力;證券公司為維持自身行業(yè)優(yōu)勢(shì),核心數(shù)據(jù)的保密與保護(hù)是當(dāng)下的必然選擇。另一方面,以大語(yǔ)言模型治理大數(shù)據(jù)平臺(tái),數(shù)據(jù)深度開放是維持?jǐn)?shù)據(jù)治理體量、質(zhì)量和價(jià)值的關(guān)鍵步驟。在ChatGPT技術(shù)沖擊下,證券公司不僅面臨數(shù)據(jù)開放與否的抉擇,還面臨由引入第三方人工智能服務(wù)而產(chǎn)生的數(shù)據(jù)外溢等問(wèn)題。鑒于行業(yè)的高價(jià)值特征,2022年捕獲的數(shù)據(jù)泄露事件中金融領(lǐng)域占比高達(dá)36%,金融細(xì)分領(lǐng)域中證券行業(yè)占比達(dá)11%。在人工智能時(shí)代,盡管大語(yǔ)言模型可以有效打破“數(shù)據(jù)孤島”困境,然而數(shù)據(jù)邊界的逐漸模糊和逐漸融合對(duì)證券公司數(shù)據(jù)治理提出了全新考驗(yàn)。此外,隨著大語(yǔ)言模型參數(shù)數(shù)目和訓(xùn)練數(shù)據(jù)體量的提升,投資者未來(lái)可以通過(guò)自然語(yǔ)言形式利用第三方模型獲取廉價(jià)而有效的服務(wù),證券公司專業(yè)性的可維持度同樣經(jīng)受重大威脅,數(shù)據(jù)失權(quán)問(wèn)題不容小覷。
模型黑箱與監(jiān)督監(jiān)管的矛盾
人工智能黑箱問(wèn)題意指人類在知識(shí)、技術(shù)限制下僅能獲取模型運(yùn)算結(jié)果,然而無(wú)法逐步精確識(shí)別模型算法決策過(guò)程的弊端。證券公司應(yīng)用ChatGPT技術(shù),結(jié)果產(chǎn)出過(guò)程的不可解釋性,首先催生了主體責(zé)任缺失問(wèn)題。面臨由人工智能造成的金融事故,是證券公司還是人工智能技術(shù)提供方承擔(dān)責(zé)任,需要進(jìn)行復(fù)雜的界定。黑箱問(wèn)題不僅無(wú)法令監(jiān)管機(jī)構(gòu)通過(guò)程序代碼界定雙方行為,反而給予了雙方淡化、稀釋責(zé)任的緩沖空間。其次,ChatGPT技術(shù)的大訓(xùn)練、寬語(yǔ)料特征令投資者的個(gè)人信息保護(hù)成為行業(yè)痛點(diǎn)。投資者問(wèn)詢過(guò)程也是數(shù)據(jù)生產(chǎn)過(guò)程,問(wèn)詢內(nèi)容經(jīng)過(guò)模型訓(xùn)練又反過(guò)來(lái)為客戶本身乃至投研、資管、自營(yíng)等部門的決策提供參考。然而,模型輸出結(jié)果不僅無(wú)法確定是否來(lái)自其他隱私數(shù)據(jù),也無(wú)法說(shuō)明數(shù)據(jù)處理過(guò)程,給投資者信息保護(hù)帶來(lái)了技術(shù)困境。最后,由模型黑箱問(wèn)題衍生的模型歧視與模型偏見同樣值得引起關(guān)注。數(shù)據(jù)的觀點(diǎn)、立場(chǎng)、意識(shí)形態(tài)會(huì)隱性影響GPT模型的輸出結(jié)果,而千億級(jí)參數(shù)規(guī)模下模型的“合規(guī)性”管理是技術(shù)難題。更具體地,當(dāng)前不同人工智能技術(shù)提供方對(duì)同一證券相關(guān)問(wèn)題不僅會(huì)產(chǎn)出不同回答,而且并無(wú)證券合規(guī)性角度的具體考量。數(shù)據(jù)與模型的“爭(zhēng)議性”引發(fā)了輸出結(jié)果的“正義性”界定難題,亟須證券行業(yè)厘清風(fēng)控口徑、監(jiān)管口徑與價(jià)值標(biāo)準(zhǔn)。
應(yīng)用能力與技術(shù)局限的矛盾
證券公司應(yīng)用ChatGPT技術(shù)仍存在著兩方面局限。一是技術(shù)本身的局限性,即目前新一代人工智能產(chǎn)品人智化特征尚不完善,推理與邏輯能力仍須進(jìn)一步迭代。語(yǔ)言功能及其背后的語(yǔ)料關(guān)聯(lián)性建模方法是ChatGPT技術(shù)的核心,然而在對(duì)基礎(chǔ)數(shù)據(jù)進(jìn)行雜糅整合過(guò)程中,ChatGPT技術(shù)尚未能做到批判性吸收,提供的觀點(diǎn)更偏向于中庸化與常規(guī)化。在邏輯運(yùn)算方面,面對(duì)復(fù)雜經(jīng)濟(jì)、金融問(wèn)題的推導(dǎo)、推理問(wèn)題,模型輸出的回答盡管語(yǔ)句通暢但具有誤導(dǎo)性,用戶體驗(yàn)尚待改進(jìn)。二是我國(guó)目前尚無(wú)具有自主知識(shí)產(chǎn)權(quán)的成熟商用化類ChatGPT產(chǎn)品。在算力角度,我國(guó)仍須獨(dú)立自主研發(fā)芯片以實(shí)現(xiàn)產(chǎn)品訓(xùn)練需求;在算法角度,百度文心一言、科大訊飛AI(人工智能)學(xué)習(xí)機(jī)、京東ChatJD以及騰訊混元助手均在研發(fā)與測(cè)試當(dāng)中,實(shí)現(xiàn)證券API應(yīng)用接口還需時(shí)日,但當(dāng)在不遠(yuǎn)。
ChatGPT沖擊下證券公司的對(duì)策建議
凝聚行業(yè)共識(shí),統(tǒng)籌發(fā)展戰(zhàn)略
一是盡快籌建證券行業(yè)GPT發(fā)展研究中心,統(tǒng)籌體制機(jī)制,全面部署“證券+GPT”戰(zhàn)略。通過(guò)深入研判大語(yǔ)言模型的發(fā)展脈絡(luò)與發(fā)展趨勢(shì),組織制定行業(yè)共建頂層規(guī)劃,自上而下地明確證券行業(yè)應(yīng)用大語(yǔ)言模型的目標(biāo)和愿景。二是按照參與角色厘清行業(yè)、企業(yè)、部門的分工與責(zé)任,根據(jù)時(shí)間節(jié)點(diǎn)制定“證券+GPT”實(shí)施路線圖。建議從論證期、啟動(dòng)期、建設(shè)期、應(yīng)用期、創(chuàng)新期等階段進(jìn)行劃分,細(xì)化每期重點(diǎn)工作計(jì)劃與工作任務(wù)、完善工作流程。三是要強(qiáng)化組織保障,建立長(zhǎng)效機(jī)制。將“證券+GPT”建設(shè)工作納入證券公司數(shù)字化轉(zhuǎn)型評(píng)價(jià)機(jī)制并賦予應(yīng)有權(quán)重,推進(jìn)新一代人工智能技術(shù)在證券公司長(zhǎng)期應(yīng)用并迭代。證券公司業(yè)務(wù)和管理部門、第三方人工智能服務(wù)供應(yīng)商、證券行業(yè)管理機(jī)構(gòu)要進(jìn)一步加強(qiáng)聯(lián)動(dòng),增進(jìn)協(xié)作對(duì)接與信息共享,形成共建合力。
強(qiáng)化數(shù)據(jù)治理,厘清數(shù)據(jù)邊界
預(yù)訓(xùn)練數(shù)據(jù)的治理與維護(hù)是“證券+GPT”體系建設(shè)的核心抓手,也是維持證券行業(yè)競(jìng)爭(zhēng)優(yōu)勢(shì)、避免智能失權(quán)的首要途徑。在證券公司層面,要建立大語(yǔ)言模型預(yù)訓(xùn)練數(shù)據(jù)質(zhì)量管理體系,進(jìn)一步釋放數(shù)據(jù)價(jià)值。在當(dāng)前數(shù)據(jù)治理平臺(tái)基礎(chǔ)上,針對(duì)大語(yǔ)言模型訓(xùn)練需求,加強(qiáng)數(shù)據(jù)分類、分層、過(guò)濾工作,提升數(shù)據(jù)的標(biāo)準(zhǔn)化和體系化。針對(duì)證券公司金融數(shù)據(jù)的多源異構(gòu)特性,在生成、采集、歸類、存儲(chǔ)階段細(xì)化標(biāo)簽標(biāo)注工作,提升模型訓(xùn)練效率。針對(duì)數(shù)據(jù)權(quán)限與數(shù)據(jù)脫敏機(jī)制,加強(qiáng)大語(yǔ)言模型預(yù)訓(xùn)練數(shù)據(jù)安全管理規(guī)范。秉持“內(nèi)源開放、外源脫敏、信息隔離”原則,在未來(lái)自建大語(yǔ)言模型上充分開放數(shù)據(jù)進(jìn)行參數(shù)訓(xùn)練、在外部人工智能API接口上嚴(yán)控核心數(shù)據(jù)外溢、在公司內(nèi)部應(yīng)用層面充分厘清接口權(quán)限,有效維護(hù)數(shù)據(jù)的“護(hù)城河”功能。
在行業(yè)層面,要探索建立“證券+GPT”預(yù)訓(xùn)練數(shù)據(jù)交易市場(chǎng),豐富數(shù)據(jù)體量和數(shù)據(jù)維度。當(dāng)前,超千億級(jí)參數(shù)擬合所需要的幾十甚至上百TB高質(zhì)量數(shù)據(jù)的收集、清洗等預(yù)處理過(guò)程成本高昂、時(shí)效性較差。業(yè)內(nèi)各證券公司應(yīng)在完善自身數(shù)據(jù)質(zhì)量與安全管理基礎(chǔ)上,通過(guò)探索數(shù)據(jù)交易的質(zhì)量標(biāo)準(zhǔn)、價(jià)值界定和交易規(guī)則來(lái)建設(shè)“證券+GPT”預(yù)訓(xùn)練數(shù)據(jù)交易市場(chǎng),進(jìn)一步強(qiáng)化數(shù)據(jù)價(jià)值發(fā)現(xiàn),力求避免數(shù)據(jù)重復(fù)治理,形成數(shù)據(jù)資產(chǎn)充分整合、聚力共建的行業(yè)格局。
布局梯度建設(shè),突破成本約束
在參與成本制約下部署“證券+GPT”戰(zhàn)略需落實(shí)梯度化原則。證券公司應(yīng)首先開展開源復(fù)現(xiàn)工作,充分利用GitHub等開源社區(qū)的現(xiàn)有工程代碼來(lái)低成本體驗(yàn)、學(xué)習(xí)、跟進(jìn)大語(yǔ)言模型技術(shù),充分開展數(shù)據(jù)安全的驗(yàn)證工作,積累底層經(jīng)驗(yàn)。以完整基于PyTorch的Colossal-AI方案為例,通過(guò)優(yōu)化顯存管理技術(shù)可以提供單機(jī)單卡、多機(jī)單卡、1750億參數(shù)等多個(gè)版本的大語(yǔ)言模型;其最小演示訓(xùn)練流程僅需消耗1.62GB顯存,可顯著降低復(fù)現(xiàn)成本。在此基礎(chǔ)上,證券公司應(yīng)深度參與國(guó)內(nèi)大語(yǔ)言模型服務(wù)供應(yīng)商“證券API”接口的共建工作,充分把握以行業(yè)脫敏數(shù)據(jù)為模型訓(xùn)練底層、以自有數(shù)據(jù)為模型本地化精調(diào)中層原則,盡快開展“證券+GPT”落地應(yīng)用,搶占差異化服務(wù)先機(jī)。最后,在未來(lái)硬件成本充分降低的背景下證券公司應(yīng)獨(dú)立搭建“證券+GPT”大語(yǔ)言模型,真正實(shí)現(xiàn)知識(shí)產(chǎn)權(quán)自主化、數(shù)據(jù)本地化、服務(wù)差異化。
健全應(yīng)用監(jiān)管,落實(shí)信息保護(hù)
一方面,要提高大語(yǔ)言模型的可解釋性與透明度,厘清責(zé)任主體。在“證券+GPT”服務(wù)面世之前引入代碼詳細(xì)注釋、偏差檢測(cè)測(cè)試、代碼與試運(yùn)行結(jié)果備案等機(jī)制,便于監(jiān)管部門、證券公司和客戶能更加清晰地記錄、理解模型決策過(guò)程,提前發(fā)現(xiàn)安全隱患。鑒于人工智能侵權(quán)責(zé)任認(rèn)定的相關(guān)法律法規(guī)尚不健全,在采用供應(yīng)商以API接口形式提供生成式人工智能服務(wù)前,證券公司應(yīng)與之簽訂詳盡的責(zé)任認(rèn)定書,明確雙方責(zé)任條款。另一方面,要切實(shí)加強(qiáng)模型安全,嚴(yán)格落實(shí)投資者信息保護(hù)。在預(yù)訓(xùn)練數(shù)據(jù)中應(yīng)采用脫敏、加密、差分隱私等技術(shù)手段,確保投資者信息“去標(biāo)志化”。與之相對(duì)的,在服務(wù)提供過(guò)程中應(yīng)加強(qiáng)攻擊行為的鑒別與對(duì)抗,防止會(huì)話數(shù)據(jù)引發(fā)模型參數(shù)偏置與漂移,切實(shí)維持模型安全性與數(shù)據(jù)純凈度。通過(guò)全面引入合規(guī)與風(fēng)控機(jī)制,不定期、隨機(jī)抽查模型輸出結(jié)果,建立模型價(jià)值觀偏離度指標(biāo)評(píng)價(jià)體系,形成預(yù)警機(jī)制并建立溯源機(jī)制,杜絕模型歧視與模型偏見等問(wèn)題。
注重人才培養(yǎng),推進(jìn)人機(jī)耦合
一是推進(jìn)“算法+證券”跨領(lǐng)域人才引進(jìn)和培養(yǎng),提升證券公司自主研發(fā)能力。ChatGPT技術(shù)作為“通用人工智能”開端,證券公司僅需通過(guò)單一或組合調(diào)度相關(guān)API接口便可有效提升數(shù)字化轉(zhuǎn)型效果。盡管ChatGPT技術(shù)可以全面助力證券公司降本增效,然而從業(yè)人員更應(yīng)清醒地看到新技術(shù)革命對(duì)傳統(tǒng)行業(yè)的顛覆性影響。因此,證券公司一方面應(yīng)通過(guò)設(shè)立證券大語(yǔ)言模型實(shí)驗(yàn)室等研究機(jī)構(gòu)、組織或承辦證券大語(yǔ)言模型論壇、開展或參與證券大語(yǔ)言模型技術(shù)培訓(xùn)等形式加強(qiáng)“算法+證券”復(fù)合人才的培養(yǎng)工作;另一方面應(yīng)著力引進(jìn)算法和數(shù)據(jù)科學(xué)等領(lǐng)域的高端管理人才與技術(shù)人才,有力維持公司與行業(yè)的競(jìng)爭(zhēng)力。
二是布局Prompt(提示)工程師人才體系建設(shè),激發(fā)人機(jī)耦合潛力。Prompt工程師通過(guò)將需求分解、提煉為有限數(shù)量的提示詞來(lái)引導(dǎo)生成式人工智能更好地回答問(wèn)題。不論是客戶應(yīng)用模型會(huì)話功能咨詢投融資建議等證券公司的服務(wù)端業(yè)務(wù),還是員工應(yīng)用模型邏輯功能開展研究、投資等核心生產(chǎn)端任務(wù),均需要獲取穩(wěn)定、有效的回答。證券公司應(yīng)布局建設(shè)熟知客戶需求、掌握公司知識(shí)圖譜,了解業(yè)務(wù)流程,明確公司合規(guī)風(fēng)控體系的專業(yè)Prompt工程師體系,提升人機(jī)自然語(yǔ)言對(duì)話“含金量”,深化人機(jī)耦合。
(張?zhí)靷悶橹刑┳C券股份有限公司博士后科研工作站與清華大學(xué)五道口金融學(xué)院聯(lián)合培養(yǎng)博士后,金濤為清華大學(xué)五道口金融學(xué)院副教授、清華大學(xué)恒隆房地產(chǎn)研究中心貨幣與財(cái)政政策研究室主任。本文編輯/孫世選)