張曉旭,高振濤,吳 磊,李 鑫,盧明靜
(1.建信金融科技有限責(zé)任公司 上海 浦東新區(qū) 200120;2.四川元匠科技有限公司 成都 611730)
近年來,隨著計(jì)算機(jī)計(jì)算能力的提升及各行業(yè)應(yīng)用大數(shù)據(jù)的積累,深度學(xué)習(xí)得到迅速發(fā)展。憑借人工神經(jīng)網(wǎng)絡(luò)自動(dòng)提取特征的特點(diǎn),深度學(xué)習(xí)在眾多應(yīng)用場(chǎng)景中展現(xiàn)了巨大應(yīng)用價(jià)值,尤其在圖像識(shí)別、自然語言處理、棋牌游戲等方面甚至超過了人類。量化投資作為金融領(lǐng)域中最依賴大數(shù)據(jù)的部分,天然契合人工智能技術(shù)的應(yīng)用場(chǎng)景[1-2]。
股票市場(chǎng)預(yù)測(cè)一直是一個(gè)經(jīng)典而又富有挑戰(zhàn)性的問題,同時(shí)受到經(jīng)濟(jì)學(xué)家和計(jì)算機(jī)科學(xué)家的關(guān)注。但股票價(jià)格數(shù)據(jù)仍然很難預(yù)測(cè),市場(chǎng)受到投資者基于情感和認(rèn)知因素的影響,會(huì)產(chǎn)生如短期投機(jī)行為、恐慌性拋售和非理性繁榮等現(xiàn)象,直接催生了價(jià)格泡沫這類高噪聲數(shù)據(jù)。所以從總體上看,大盤的股價(jià)數(shù)據(jù)是非線性、非平穩(wěn)、非結(jié)構(gòu)和高噪聲的。得益于中國(guó)金融市場(chǎng)的逐步完善,有效的金融數(shù)據(jù)得到大量積累,深度學(xué)習(xí)在量化投資中的運(yùn)用在國(guó)內(nèi)也得以快速發(fā)展。最近用于預(yù)測(cè)股價(jià)數(shù)據(jù)的熱門方法之一就是深度學(xué)習(xí)[3]。本文成功地訓(xùn)練了一個(gè)24 維特征的深度神經(jīng)網(wǎng)絡(luò)(deep neural network,DNN),實(shí)現(xiàn)了對(duì)每日股價(jià)漲跌的二分類預(yù)測(cè)。
盡管深度學(xué)習(xí)在解決各方面問題時(shí)有很好的表現(xiàn),但深度學(xué)習(xí)必須使用大量數(shù)據(jù)進(jìn)行訓(xùn)練,否則這種方法將經(jīng)歷過擬合。因此,為了提取海量大數(shù)據(jù)的特征,包含上億權(quán)重參數(shù)的神經(jīng)網(wǎng)絡(luò)被廣泛地采用,其對(duì)經(jīng)典計(jì)算機(jī)的運(yùn)算能力提出越來越高的要求。然而隨著摩爾定律的失效,集成電路上晶體管密度接近工藝制造的物理極限,導(dǎo)致經(jīng)典算力的瓶頸到來,人工智能需要尋找新型算力平臺(tái)[4]。量子計(jì)算作為全新的計(jì)算模式,比起經(jīng)典計(jì)算,在一些特定算法上有著指數(shù)加速的能力,有望給深度學(xué)習(xí)提供足夠的計(jì)算能力。開發(fā)適用于量子計(jì)算機(jī)的量子神經(jīng)網(wǎng)絡(luò),使得更復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型得以訓(xùn)練,并加速模型的訓(xùn)練速度[5],這些潛在的量子優(yōu)勢(shì)使得量子人工智能成為了一個(gè)活躍的研究領(lǐng)域[6-8]。
本文針對(duì)量子計(jì)算的特性,充分利用量子比特的疊加性和糾纏性,搭建了混合量子?經(jīng)典神經(jīng)網(wǎng)絡(luò)模型(hybrid quantum-classical neural network),然后在量子線路學(xué)習(xí)(quantum circuit learning,QCL)框架下,對(duì)股價(jià)特征數(shù)據(jù)進(jìn)行監(jiān)督學(xué)習(xí)(supervised learning)。訓(xùn)練后的量子神經(jīng)網(wǎng)絡(luò)可以對(duì)輸入的股票特征進(jìn)行準(zhǔn)確分類,給出漲跌標(biāo)簽。其中,量子神經(jīng)網(wǎng)絡(luò)(quantum neural network,QNN)僅指在量子計(jì)算機(jī)上執(zhí)行的參數(shù)化量子線路(parameterized quantum circuit,PQC)。
此外,本文證明了量子神經(jīng)網(wǎng)絡(luò)對(duì)股票數(shù)據(jù)具有良好的表達(dá)性,能夠?qū)崿F(xiàn)與經(jīng)典深度神經(jīng)網(wǎng)絡(luò)類似的分類能力。量子神經(jīng)網(wǎng)絡(luò)成功地對(duì)股票數(shù)據(jù)進(jìn)行擬合,證明了量子金融領(lǐng)域的巨大潛力。
股票分析常用的手段有基本面分析(fundamental analysis)和技術(shù)面分析(technical analysis)[9]?;久娣治鍪菑暮暧^上評(píng)估企業(yè)價(jià)值或預(yù)測(cè)股票價(jià)值的走勢(shì),考慮因素一般為政府政治決策、企業(yè)負(fù)面輿情、國(guó)家宏觀經(jīng)濟(jì)指數(shù)發(fā)布、產(chǎn)業(yè)分析、自然災(zāi)害、恐怖襲擊等不可抗力。技術(shù)面分析是利用金融量化模型和擬合工具,依靠股票市場(chǎng)歷史上的交易價(jià)格(price)和成交量(volume)及其衍生出的一系列指標(biāo)(indicators)來定量分析預(yù)測(cè)股票價(jià)格。
量化模型是研究股票價(jià)格波動(dòng)的數(shù)學(xué)原理,建立股票價(jià)格S與時(shí)間t之間的數(shù)量關(guān)系。金融學(xué)中用于描述股價(jià)變化的模型是幾何布朗運(yùn)動(dòng)(geometric Brownian motion,GBM),即式(1)中的Wt項(xiàng)。根據(jù)隨機(jī)波動(dòng)假設(shè)下S(t)連續(xù)但不可導(dǎo)的性質(zhì),應(yīng)用伊藤引理后可以得到描述股價(jià)的隨機(jī)偏微分方程。隨機(jī)波動(dòng)模型需要市場(chǎng)波動(dòng)率σ 和收益率α 兩個(gè)重要參數(shù),但真實(shí)市場(chǎng)中σ(t,St)和α(t,St)也是時(shí)間與股價(jià)的函數(shù),所以股票方程只是理論模型,實(shí)際預(yù)測(cè)能力有限。
一般來說,金融工程是一門專業(yè)性很強(qiáng)的學(xué)科,傳統(tǒng)量化模型中要求專業(yè)人員提出合理解釋市場(chǎng)的特征因子,這需要很強(qiáng)的證券投資知識(shí)的儲(chǔ)備。但量?jī)r(jià)時(shí)間序列數(shù)據(jù)具有非線性、非平穩(wěn)、非結(jié)構(gòu)和高噪聲的特點(diǎn),大部分公共事件,如輿論、政策,甚至天氣、群體心理等都會(huì)通過大家的逐利行為反映到一個(gè)單一的變量,即股價(jià)上面。因此需要量化分析專家深刻理解金融數(shù)學(xué)模型的原理和數(shù)據(jù)分析應(yīng)用場(chǎng)合,他們的先驗(yàn)經(jīng)驗(yàn)是非常重要的。
但是深度學(xué)習(xí)幾乎不需要處理原始數(shù)據(jù),深度神經(jīng)網(wǎng)絡(luò)模型有良好的非線性擬合能力,能自動(dòng)學(xué)習(xí)最有預(yù)測(cè)性的特征,這使得數(shù)據(jù)分析師在基本了解證券市場(chǎng)知識(shí)的情況下,也能像金融工程專家一樣尋找證券市場(chǎng)波動(dòng)背后的規(guī)律。同時(shí),深度神經(jīng)網(wǎng)絡(luò)模型還具有強(qiáng)大的表達(dá)能力和泛化能力。應(yīng)用深度學(xué)習(xí)方法尋找股市規(guī)律正逐漸受到業(yè)界重視。
具體來說,如果目標(biāo)是預(yù)測(cè)股票的具體價(jià)值,這屬于回歸問題(regression);如果目標(biāo)是預(yù)測(cè)價(jià)格的運(yùn)動(dòng)方向,如上升或下降,這屬于分類問題(classification)。設(shè)第k組數(shù)據(jù)中的特征(feature)為一個(gè)向量X{k},對(duì)應(yīng)的標(biāo)簽(label)為標(biāo)量y{k}∈{0,1}。輸入M個(gè)訓(xùn)練樣本 [X{k},y{k}],k=0,1,···,M?1,得到訓(xùn)練后的神經(jīng)網(wǎng)絡(luò),再輸入訓(xùn)練集外任意一天的股市特征X{h},都能輸出漲跌的預(yù)測(cè)標(biāo)簽y{h}。
由于股民的短期投機(jī)行為會(huì)引起層出不窮的價(jià)格波動(dòng),所以金融數(shù)據(jù)樣本越小則噪音越大,必須基于較長(zhǎng)時(shí)間段的多維度特征向量才能訓(xùn)練出表達(dá)性強(qiáng)、準(zhǔn)確率高的神經(jīng)網(wǎng)絡(luò)。
當(dāng)前市場(chǎng)中的證券數(shù)目是相當(dāng)大的,A 股市場(chǎng)的股票數(shù)目現(xiàn)在有3 000 多只,如果再加上期貨、基金可能會(huì)有上萬種投資標(biāo)的?;诖蟊P數(shù)據(jù)就可以充分利用深度神經(jīng)網(wǎng)絡(luò)對(duì)高維大數(shù)據(jù)進(jìn)行擬合或分類。本章以滬深300 股指期貨為例,選取一段時(shí)間內(nèi)的日K 線數(shù)據(jù)進(jìn)行訓(xùn)練,根據(jù)預(yù)測(cè)結(jié)果,設(shè)定每日交易策略:1) 看漲,今日繼續(xù)持有,明日買入;2) 看跌,今日賣出,明日買回;3) 趨勢(shì)不明,保存現(xiàn)金,股票不操作。
神經(jīng)網(wǎng)絡(luò)模型是深度學(xué)習(xí)算法的核心,神經(jīng)網(wǎng)絡(luò)最簡(jiǎn)單的形式是一種兩層神經(jīng)網(wǎng)絡(luò),也叫感知機(jī)(perceptron),它有若干個(gè)輸入值和一個(gè)輸出值,最早在1957 年由R.Rosenblatt 提出,其結(jié)構(gòu)如圖1 所示。輸入值向量先經(jīng)過仿射變換Z變?yōu)橐粋€(gè)標(biāo)量,然后由激活函數(shù)a做非線性映射,完成特征提取。
圖1 感知機(jī)模型
多層感知機(jī)構(gòu)成了神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)層可分為3 類,即輸入層、隱藏層和輸出層。而DNN 就是有多個(gè)隱藏層的神經(jīng)網(wǎng)絡(luò),它可以提取更復(fù)雜的數(shù)據(jù)特征。整個(gè)DNN 中的信息是朝著一個(gè)方向傳播的,第l層感知機(jī)把處理的結(jié)果傳遞給第l+1 層,并且每層感知機(jī)都包含自己的仿射變換Z和激活函數(shù)a,形如:a{0}→Z{1}→a{1}→···→Z{L}→a{L}。一般化的DNN 可以用一個(gè)有向圖來表示,如圖2 所示。
圖2 神經(jīng)網(wǎng)絡(luò)隱藏層間的連接映射過程
通過簡(jiǎn)單非線性函數(shù)的多次復(fù)合,實(shí)現(xiàn)輸入空間到輸出空間的復(fù)雜映射,映射過程可由式(2)計(jì)算。容易看出,各層神經(jīng)網(wǎng)絡(luò)的權(quán)重矩陣W{l}和偏置向量b{l}就是待訓(xùn)練的神經(jīng)網(wǎng)絡(luò)參數(shù)[10]。
此外,還需要用損失函數(shù)來衡量神經(jīng)網(wǎng)絡(luò)參數(shù)是否合理。損失函數(shù)可以定量描述由神經(jīng)網(wǎng)絡(luò)前向傳播得到的結(jié)果與真實(shí)值之間的差距,擬合常用均方誤差(mean squared error,MSE),分類常用交叉熵(cross entropy)。
訓(xùn)練過程就是不斷修正神經(jīng)網(wǎng)絡(luò)參數(shù)使得損失函數(shù)越來越小的過程,這需要高效的誤差反向傳播算法來進(jìn)行參數(shù)調(diào)整,一般這是一個(gè)迭代收斂的過程。訓(xùn)練前饋神經(jīng)網(wǎng)絡(luò)最著名的方法是梯度下降法(gradient descent),通?;赥ensorFlow、PyTorch、Jax 等高效可靠的可微編程工具[11]。
首先是數(shù)據(jù)集的準(zhǔn)備,包括訓(xùn)練集(training)、測(cè)試集(testing)、特征(features)和標(biāo)簽(labels)。數(shù)據(jù)來源為滬深300 股指從2019 年1 月2 日?2021 年7 月6 日的所有K 線量?jī)r(jià)指標(biāo),取前400 天數(shù)據(jù)為訓(xùn)練數(shù)據(jù),剩下為測(cè)試數(shù)據(jù)。
如圖3 所示,日K 線原始數(shù)據(jù)包括5 個(gè)量?jī)r(jià)指標(biāo),即開盤價(jià)O、收盤價(jià)C、當(dāng)日最高價(jià)H、當(dāng)日最低價(jià)L和總量V。標(biāo)簽y的取值只有兩個(gè){0,1},連續(xù)兩個(gè)交易日的收盤價(jià)C[k+1]>C[k],則y[k]=1,表示上漲;若C[k+1] 圖3 漲跌K 線圖 具體因子包括X=[O_log,C_log,H_log,L_log,V_log_1,V_log_2,V_log_3,V_log_4,V_log_5,PPC_1,PPC_2,PPC_3,PPC_4,PPC_5,CO_gap_1,CO_gap_2,CO_gap_3,CO_gap_4,CO_gap_5,HL_gap_1,HL_gap_2,HL_gap_3,HL_gap_4,HL_gap_5]。這24 個(gè)因子定義如下:O_log 開盤價(jià)取對(duì)數(shù);C_log 收盤價(jià)取對(duì)數(shù);H_log 當(dāng)日最高價(jià)取對(duì)數(shù),高點(diǎn)也叫阻力位;L_log 當(dāng)日最低價(jià)取對(duì)數(shù),低點(diǎn)也叫支撐位;V_log_5 是日交易量取對(duì)數(shù)的5日滑動(dòng)平均值,其余V_log_1-4 含義類似;PPC_5 是5 日價(jià)格變動(dòng)百分比的滑動(dòng)平均值,其余PPC_1-4含義類似;CO_gap_5 是收盤價(jià)減去開盤價(jià)的5 日滑動(dòng)平均值,其余CO_gap _1-4 含義類似,這也是著名的動(dòng)量特征;HL_gap_5 是單日震蕩幅度的5 日滑動(dòng)平均值,其余HL_gap _1-4 含義類似。 取對(duì)數(shù)是為了保證特征因子的大小在同一數(shù)量級(jí),避免梯度下降過程中損失函數(shù)進(jìn)入振蕩。針對(duì)特別大和特別小的數(shù)據(jù)要進(jìn)行恰當(dāng)?shù)目s放,如成交量是遠(yuǎn)大于股價(jià)的。綜上所述,用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練與測(cè)試的數(shù)據(jù)集如表1 所示。 表1 大盤數(shù)據(jù)預(yù)處理生成數(shù)據(jù)集 本文用DNN 算法模型進(jìn)行股價(jià)預(yù)測(cè)器的訓(xùn)練。如圖4 所示,訓(xùn)練的DNN 總共有4 層:輸入層有24 個(gè)神經(jīng)元,激活函數(shù)ReLU;隱藏層1 有12 個(gè)神經(jīng)元,激活函數(shù)ReLU;隱藏層2 有12 個(gè)神經(jīng)元,激活函數(shù)ReLU;隱藏層3 有6 個(gè)神經(jīng)元,激活函數(shù)ReLU;輸出層有兩個(gè)神經(jīng)元,經(jīng)過激活函數(shù)Sigmoid 以后給出漲的概率P(raise ≡ 1)和跌P(fall ≡ 0)的概率。 圖4 深度神經(jīng)網(wǎng)絡(luò)股價(jià)分類結(jié)構(gòu) 神經(jīng)網(wǎng)絡(luò)的輸出經(jīng)過sigmoid 函數(shù)的轉(zhuǎn)換,可以將數(shù)值壓縮到(0,1)之間,如神經(jīng)網(wǎng)絡(luò)以概率P[k]把第k日的標(biāo)簽y{k}歸類于1,以概率P[k+1]把第k+1 日的標(biāo)簽y{k}歸類于0。 但P是連續(xù)的,不能簡(jiǎn)單認(rèn)為P>0.5 就看漲,而是要在可能性很大的情況下才看漲。根據(jù)多次實(shí)驗(yàn)結(jié)果,本文的策略是對(duì)神經(jīng)網(wǎng)絡(luò)輸出結(jié)果進(jìn)行修剪,設(shè)定P>0.95 看漲,P<0.05 看跌,其余區(qū)間屬于趨勢(shì)不明,這樣最終得到了3 個(gè)標(biāo)簽,恰好可以指導(dǎo)3 種操作策略。 預(yù)測(cè)股價(jià)上漲則做多,即明日開盤買入,記作do=1。預(yù)測(cè)股價(jià)下跌則做空,記作do=?1,即明日開盤賣出,套現(xiàn)開盤的高價(jià)股價(jià)。無法預(yù)測(cè)則選擇不操作,即保持現(xiàn)金,既不把現(xiàn)金換成股票,也不把股票換成現(xiàn)金,記作do=0。 把3 類預(yù)測(cè)結(jié)果y轉(zhuǎn)化為對(duì)應(yīng)的投資策略do以后就能進(jìn)行評(píng)估分析了。這里采用了回測(cè)法,在訓(xùn)練集的真實(shí)市場(chǎng)數(shù)據(jù)上檢驗(yàn)本文投資策略盈利情況。不同于衡量擬合器性能的回測(cè)曲線,針對(duì)分類器的性能指標(biāo)是累積收益(cumulative return)。設(shè)定首日累積收益率CR[0]=1,第k日的累計(jì)收益率為CR[k],股價(jià)為S[k],那么k+1 日的累計(jì)收益率計(jì)算為: 當(dāng)策略do 與真實(shí)市場(chǎng)漲跌相同時(shí),累積收益率就持續(xù)增長(zhǎng)。如股價(jià)今日100 元,神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)明日會(huì)跌,即do=?1,但是實(shí)際第二天股價(jià)漲到110 元了,錯(cuò)誤的決策就導(dǎo)致第二天的累積收益率降低10%。 訓(xùn)練集上檢測(cè)的投資結(jié)果如圖5 所示??梢钥闯鲈?020 年9 月1 日?2021 年7 月6 日測(cè)試時(shí)間段內(nèi),大部分時(shí)間都是持續(xù)盈利的,最高收益在2021 年2 月底出現(xiàn),達(dá)到了25%。這證明了該神經(jīng)網(wǎng)絡(luò)分類器的準(zhǔn)確性較高,表現(xiàn)穩(wěn)定。 圖5 投資策略的累積收益率結(jié)果測(cè)試 當(dāng)前的量子算法研究者已經(jīng)不是為完美的大規(guī)模量子計(jì)算設(shè)備設(shè)計(jì)算法,而是充分利用短期內(nèi)的含噪聲小規(guī)模的量子計(jì)算設(shè)備,為計(jì)算過程提供局部加速的混合量子?經(jīng)典計(jì)算模型[14]?;旌狭孔?經(jīng)典計(jì)算概念的發(fā)展引出一系列新算法,如量子近似優(yōu)化算法 (quantum approximate optimization algorithm,QAOA)[15]、變分量子本征求解器(variational quantum eigensolver,VQE)[16]、量子分類器[17]、量子生成對(duì)抗網(wǎng)絡(luò)(quantum generative adversarial networks,QGANs)[18-19]和量子神經(jīng)網(wǎng)絡(luò)(QNN)[20]。量子神經(jīng)網(wǎng)絡(luò)既可以作為一種啟發(fā)式算法,利用量子信息原理把輸入特征映射到輸出分類上[21-22];也可以在真實(shí)量子硬件平臺(tái)上運(yùn)行,如光量子平臺(tái)[23]和鉆石NV 色心平臺(tái)[24]。 如圖6 所示,混合量子?經(jīng)典算法模型包括量子信息處理部分和經(jīng)典信息處理部分,用一個(gè)經(jīng)典優(yōu)化器來訓(xùn)練一個(gè)含參量子線路(parameterized quantum circuit,PQC)。 圖6 混合量子?經(jīng)典方案 與經(jīng)典神經(jīng)網(wǎng)絡(luò)類似,量子神經(jīng)網(wǎng)絡(luò)是由多層量子感知機(jī)(quantum perceptron,QP)組合而成。每個(gè)QP 都包括了前處理和后處理參數(shù)化量子門,分別對(duì)照仿射變換中的特征向量X與權(quán)重向量W。 圖7 為一個(gè)量子感知機(jī)的實(shí)現(xiàn)方案,對(duì)比圖1的經(jīng)典感知機(jī)結(jié)構(gòu),它充分利用量子計(jì)算的兩個(gè)特點(diǎn)來實(shí)現(xiàn)感知機(jī)的功能:1) 計(jì)算是可逆的。經(jīng)典感知機(jī)把m維特征向量X通過仿射變換得到1 維標(biāo)量z,而量子計(jì)算的酉變換需要輸入量子比特?cái)?shù)等于輸出量子比特?cái)?shù),這里引入輔助量子比特(ancilla qubits)來寄存仿射變換結(jié)果,這里的量子比特?cái)?shù)為ceil(log2m)+1;2) 量子邏輯門是酉矩陣的線性變換,而測(cè)量算符是埃米爾特矩陣(Hermitian matrix)的非線性變換。經(jīng)過測(cè)量就會(huì)引入非線性,起到激活函數(shù)的作用。 圖7 混合量子?經(jīng)典感知機(jī)的部署方案,量子線路的多個(gè)輸入態(tài)經(jīng)過酉變換后,測(cè)量得到經(jīng)典輸出信息。虛線框內(nèi)是等效的感知機(jī)原理圖。 量子感知機(jī)完成仿射變換的原理如圖8 所示。在N個(gè)量子比特張開的m=2N高維希爾伯特空間(Hilbert space)中,攜帶特征向量X的量子態(tài)|ψX〉向攜帶權(quán)重向量W的量子態(tài)|ψW〉上進(jìn)行投影,就得到了仿射變換結(jié)果z=〈ψX|ψW〉。然后通過參數(shù)化量子線路U(θW),把z編碼到任意計(jì)算基底|j〉上,這里0 圖8 把仿射變換結(jié)果編碼到| 11···11〉基底上 式(5)表示把投影結(jié)果〈ψX|ψW〉編碼到基底|11···11〉=|m?1〉上,即態(tài)矢U(θW)|ψX〉與基矢|11···11〉共線,那么參數(shù)化量子線路的酉矩陣只要保證最后一行為WT就可以了。 在經(jīng)典的神經(jīng)元模型中,仿射變換后還需要經(jīng)過一個(gè)激活函數(shù)為神經(jīng)元的輸出提供非線性,保證了多層網(wǎng)絡(luò)的表達(dá)能力不會(huì)退化成單層線性網(wǎng)絡(luò)。一個(gè)適當(dāng)?shù)募せ詈瘮?shù)可以大大增加分類任務(wù)的準(zhǔn)確性,但由于量子線路內(nèi)部是一系列酉矩陣相乘構(gòu)成的,矩陣相乘必然不存在非線性,所以在量子感知機(jī)中,要通過變基底測(cè)量(computational basis changed measurement)產(chǎn)生不可逆的非線性映射[25-26]。如圖8中的酉矩陣U(θW)起到了旋轉(zhuǎn)量子態(tài)|ψW〉到計(jì)算基底|j〉的作用,也等價(jià)于坐標(biāo)系基底的旋轉(zhuǎn)。 通過多個(gè)糾纏量子門把前N個(gè)量子比特與輔助比特相連,就能把cm?1制備到輔助比特上。 根據(jù)式(5)發(fā)現(xiàn),參數(shù)化酉矩陣U(θW)的設(shè)計(jì)不是唯一的,一個(gè)表達(dá)能力強(qiáng)的U(θW)搭配合適的泡利測(cè)量P就構(gòu)造出了一個(gè)包含一些先驗(yàn)知識(shí)的假設(shè)線路(ansatz circuit)。如何根據(jù)目標(biāo)構(gòu)造有效的ansatz 是量子人工智能的重點(diǎn)研究方向,通常由一些單比特量子旋轉(zhuǎn)門和多比特受控旋轉(zhuǎn)門組合。 如圖9 所示,每層量子神經(jīng)網(wǎng)絡(luò)包括多個(gè)量子感知機(jī),多層量子神經(jīng)網(wǎng)絡(luò)構(gòu)成了前饋神經(jīng)網(wǎng)絡(luò)(feedforward neural networks,ffNN)[26]。注意,雖然量子計(jì)算的線路模型中有延遲測(cè)量(deferred measurement)的技巧,但每個(gè)量子感知機(jī)的輔助量子比特的量子態(tài)必須立馬測(cè)量[27],不能延遲到整個(gè)量子線路的末端,否則無法提供中間層的非線性激活[28],再多層的量子神經(jīng)網(wǎng)絡(luò)都只相當(dāng)于一層。 圖9 用量子感知機(jī)組成量子神經(jīng)網(wǎng)絡(luò),測(cè)量后的經(jīng)典信息通過量子控制操作加載到量子態(tài)上 量子編碼是一個(gè)將經(jīng)典信息轉(zhuǎn)化為量子態(tài)的過程。在使用量子算法解決經(jīng)典問題的過程中,量子編碼是非常重要的一步。在量子神經(jīng)網(wǎng)絡(luò)中,第一步就是將經(jīng)典信息編碼到量子態(tài)中。大多數(shù)量子編碼的方法都可以看作是作用在初始化|0〉N態(tài)上的參數(shù)化線路U(θX),并且參數(shù)化電路中的參數(shù)是由經(jīng)典信息X決定的。 由于量子比特天然的疊加性,對(duì)m維經(jīng)典數(shù)組能以ceil(log2m)個(gè)量子比特的空間復(fù)雜度進(jìn)行存儲(chǔ)計(jì)算,這里ceil 指向上取整。本次股價(jià)預(yù)測(cè)的特征因子X{k}=[x0{k},x1{k},···,x23{k}]的長(zhǎng)度達(dá)到24,用振幅編碼的方法需要5 位量子比特就能編碼。 在Pennylane 量子計(jì)算框架中,把經(jīng)典特征數(shù)據(jù)編碼到量子態(tài)中的過程叫作嵌入(embedding),本文采用embeddings 類的AmplitudeEmbedding 方法加載經(jīng)典特征向量X{k}。 參數(shù)化量子電路PQC 被認(rèn)為是在量子計(jì)算中的一種神經(jīng)網(wǎng)絡(luò)的新范式,不同于經(jīng)典神經(jīng)網(wǎng)絡(luò)的權(quán)重矩陣,PQC 是以量子門中的相位θ 作為訓(xùn)練參數(shù),從而將量子初態(tài)變到期望的量子末態(tài)上。經(jīng)過參數(shù)化量子變分線路的酉變換U(θ)輸出了一個(gè)可觀測(cè)量的期望值f(θ)。和經(jīng)典神經(jīng)網(wǎng)絡(luò)相同,在訓(xùn)練PQC 時(shí)研究者同樣希望找到其相位的梯度,從而使量子神經(jīng)網(wǎng)絡(luò)的損失函數(shù)(cost function)收斂。 首先需要定義損失函數(shù)。對(duì)于分類器,經(jīng)典數(shù)據(jù)集{[X{k},y{k}]}的標(biāo)簽y{k}對(duì)應(yīng)一個(gè)量子可觀測(cè)量Y。經(jīng)過編碼量子線路后得到量子態(tài)|ψX〉,再經(jīng)過ansatz 參數(shù)化量子線路,對(duì)Y的期望f(θ)進(jìn)行觀測(cè),測(cè)量結(jié)果 然后要用量子線路計(jì)算出梯度?;诹孔泳€路的梯度計(jì)算與經(jīng)典計(jì)算有很大的區(qū)別,要求PQC滿足一個(gè)重要的性質(zhì),參數(shù)θ={θ1,θ2,···,θL}全部是泡利旋轉(zhuǎn)矩陣的旋轉(zhuǎn)角,如式(7)所示。這里σ 代表泡利矩陣。 這樣的一塊參數(shù)化量子線路U(θ)在計(jì)算測(cè)量期望值f(θ)的梯度時(shí)有獨(dú)特的優(yōu)勢(shì)。結(jié)合式(6)和式(7),本文得到梯度如式(8)所示: 這樣,同一個(gè)參數(shù)線路U(θ)不僅可以計(jì)算f(θ),還能計(jì)算梯度 ?θf,線路結(jié)構(gòu)不變,僅僅是線路參數(shù)θk不一樣[29-30],這就是量子變分線路梯度計(jì)算的parameter-shift 方法。 神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程就是沿梯度進(jìn)行參數(shù)調(diào)整的過程。量子線路輸出梯度后,經(jīng)過經(jīng)典優(yōu)化算法對(duì)量子參數(shù)θ 進(jìn)行調(diào)整改善,再把新參數(shù)返回到量子線路,循環(huán)迭代,直到損失函數(shù)收斂到一定值?;谑?8)的梯度計(jì)算,可以應(yīng)用很多經(jīng)典的梯度下降算法,尤其是考慮到量子測(cè)量本身的隨機(jī)性,自然地適用隨機(jī)梯度下降法(stochastic gradient descent,SGD)。用變學(xué)習(xí)率的SGD 方法訓(xùn)練股價(jià)預(yù)測(cè)器量子神經(jīng)網(wǎng)絡(luò)的收斂過程如圖10 所示。 圖10 量子神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)過程中損失函數(shù)的收斂 本文針對(duì)運(yùn)行時(shí)間和最高累計(jì)回報(bào)率兩項(xiàng)指標(biāo),對(duì)比經(jīng)典深度神經(jīng)網(wǎng)絡(luò)DNN 與混合量子?經(jīng)典神經(jīng)網(wǎng)絡(luò)HQCNN 的表現(xiàn)。每種算法模型訓(xùn)練10 次,取平均值,得到DNN 運(yùn)行235.3 s,最大回報(bào)率25%,HQCNN 運(yùn)行217.1 s,最大回報(bào)率28%。結(jié)果發(fā)現(xiàn)量子算法的運(yùn)行時(shí)間比經(jīng)典算法少了7.7%,且預(yù)測(cè)準(zhǔn)確率更高導(dǎo)致回報(bào)率高出3%。證明了量子算法的表達(dá)力強(qiáng)、魯棒性高。 股市預(yù)測(cè)擁有海量數(shù)據(jù),是深度學(xué)習(xí)大展身手的應(yīng)用場(chǎng)景。用復(fù)雜的神經(jīng)網(wǎng)絡(luò)對(duì)大量的股價(jià)樣本進(jìn)行訓(xùn)練是行之有效的,但非常消耗算力資源。量子神經(jīng)網(wǎng)絡(luò)旨在利用量子信息處理過程,把輸入特征映射到輸出分類上,在完成經(jīng)典神經(jīng)網(wǎng)絡(luò)模型的任務(wù)同時(shí),發(fā)揮量子優(yōu)勢(shì),開發(fā)更高效準(zhǔn)確的算法,設(shè)計(jì)能利用量子并行性和量子糾纏等量子效應(yīng)的量子算法。 后續(xù)量子金融方法的改進(jìn),需要加入更復(fù)雜的交易策略模型,考慮更具體精細(xì)的指標(biāo),如收益曲線的最大回撤率等。同時(shí)針對(duì)量子神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,尋找更具表達(dá)能力的ansatz。更重要的一點(diǎn)是量子變分線路的梯度大小隨著量子比特?cái)?shù)目的增長(zhǎng)而指數(shù)衰減,使得模型失去可訓(xùn)練性,這是量子人工智能領(lǐng)域急需解決的問題。2.3 預(yù)測(cè)器的盈利能力檢測(cè)
3 混合量子?經(jīng)典神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)器
3.1 量子感知器
3.2 振幅編碼
3.3 量子神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法
4 結(jié)束語