国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種面向中醫(yī)文本的實(shí)體關(guān)系深度學(xué)習(xí)聯(lián)合抽取方法

2023-04-07 03:04:34楊延云杜建強(qiáng)羅計(jì)根
關(guān)鍵詞:三元組流水線方劑

楊延云 杜建強(qiáng) 聶 斌 羅計(jì)根 賀 佳

(江西中醫(yī)藥大學(xué)計(jì)算機(jī)學(xué)院 江西 南昌 330004)

0 引 言

為推進(jìn)國家中醫(yī)藥信息化的發(fā)展,各種中醫(yī)藥信息化平臺(tái)的建設(shè)接踵而至,例如,中醫(yī)輔助診療系統(tǒng)、中醫(yī)智能問答系統(tǒng)、中醫(yī)電子病歷系統(tǒng)等。中醫(yī)文獻(xiàn)作為中醫(yī)傳承載體,記錄了證型、方劑、中藥、病因、病機(jī)和治則治法等數(shù)據(jù),且存在著大量實(shí)體重疊的問題。而實(shí)體和關(guān)系抽取作為底層最基礎(chǔ)的任務(wù),能夠快速地從半結(jié)構(gòu)化、非結(jié)構(gòu)化的中醫(yī)文本中提取出實(shí)體以及它們之間的語義關(guān)系,對(duì)中醫(yī)文獻(xiàn)數(shù)據(jù)的有效利用和中醫(yī)藥的信息化研究具有促進(jìn)作用和重要意義。

1 相關(guān)研究

1.1 流水線方法研究

實(shí)體關(guān)系抽取作為信息抽取的重要子任務(wù)[1],處理該任務(wù)的方法主要可以分為流水線方法和實(shí)體關(guān)系聯(lián)合抽取方法兩類。流水線方法即將實(shí)體關(guān)系抽取任務(wù)分為命名實(shí)體識(shí)別[2](Named Entity Recognition,NER)和關(guān)系抽取[3](Relation Extraction,RE)兩個(gè)子任務(wù),即給定一段半結(jié)構(gòu)化或非結(jié)構(gòu)化文本,首先通過命名實(shí)體識(shí)別提取出文本中的實(shí)體,然后對(duì)每個(gè)候選實(shí)體對(duì)進(jìn)行關(guān)系分類。

典型的命名實(shí)體識(shí)別方法主要分為三類:基于規(guī)則的方法;基于統(tǒng)計(jì)學(xué)習(xí)的方法和基于深度學(xué)習(xí)的方法。其中,基于規(guī)則的方法大多是利用語言學(xué)知識(shí),通過語言規(guī)則識(shí)別實(shí)體;基于統(tǒng)計(jì)學(xué)習(xí)的方法主要有隱馬爾可夫模型(Hidden Markov Models,HMM)[4]、最大熵模型(Maximum Entropy Model,MEM)、支持向量機(jī)(Support Vector Machine,SVM)[5]和條件隨機(jī)場(chǎng)[6]等,該方法依賴復(fù)雜的特征工程。近幾年,循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)、長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory)等神經(jīng)網(wǎng)絡(luò)模型被應(yīng)用于實(shí)體識(shí)別任務(wù),并展現(xiàn)出強(qiáng)大的優(yōu)勢(shì)。

關(guān)系抽取方法主要可以分為經(jīng)典的關(guān)系抽取方法和基于深度學(xué)習(xí)的抽取方法。經(jīng)典的關(guān)系抽取方法主要包括有監(jiān)督、半監(jiān)督、弱監(jiān)督和無監(jiān)督4種[7],這幾種方法存在特征提取誤差傳播的問題,很大程度上影響最終關(guān)系抽取的結(jié)果。基于深度學(xué)習(xí)的方法避免了人工特征提取,Zeng等[8]于2014年首次使用CNN進(jìn)行關(guān)系分類。Vu等[9]采用深度循環(huán)神經(jīng)網(wǎng)絡(luò)(Deep Recurrent Neural Networks,DRNN)進(jìn)行關(guān)系抽取。

流水線方法雖然在模型選擇和實(shí)驗(yàn)操作比較靈活、簡單,但是這種方法存在以下幾個(gè)問題:① 導(dǎo)致錯(cuò)誤累積;② 忽略了兩個(gè)子任務(wù)間的相關(guān)性;③ 產(chǎn)生大量冗余信息。例如文本:“方劑麻杏石甘湯是由麻黃、杏仁等多味中藥組成”,采用流水線方法的具體流程如圖1所示。假如在命名實(shí)體識(shí)別階段模型沒有識(shí)別出實(shí)體“麻杏石甘湯”,由于關(guān)系抽取完全依賴實(shí)體識(shí)別的結(jié)果,則所有包含“麻杏石甘湯”的三元組皆無法得到,因此導(dǎo)致錯(cuò)誤累積;已知文本中存在“方劑/中藥”這一關(guān)系,可以推理第一個(gè)實(shí)體的類別是“方劑”類,第二個(gè)實(shí)體的類型是“中藥”類,而采用流水線方法無法利用該信息進(jìn)行推理;關(guān)系抽取是對(duì)每個(gè)候選實(shí)體對(duì)進(jìn)行關(guān)系分類,不屬于預(yù)定義關(guān)系的實(shí)體組合就是冗余信息,如(麻黃,None,杏仁)。

圖1 流水線方法流程

1.2 聯(lián)合抽取方法研究

針對(duì)以上流水線方法存在的問題,實(shí)體關(guān)系聯(lián)合抽取直接抽取給定文本中含有的實(shí)體和實(shí)體間語義關(guān)系的三元組(Entity1,Relation,Entity2),不僅能夠充分考慮二者的相關(guān)性,將二者聯(lián)合學(xué)習(xí),還使兩個(gè)子任務(wù)的性能得到了不同程度的提升。

Ren等[10]提出CoType框架。Miwa等[11]使用填表方法,將實(shí)體識(shí)別和關(guān)系抽取進(jìn)行聯(lián)合學(xué)習(xí),但是都基于人工提取特征,依賴于復(fù)雜的特征工程,還需使用各種自然語言處理工具包。隨著深度學(xué)習(xí)方法的興起,Miwa等[12]使用BiLSTM實(shí)現(xiàn)實(shí)體識(shí)別,通過共享輸入層和LSTM編碼層的參數(shù),連用Bi-TreeLSTM結(jié)構(gòu)實(shí)現(xiàn)關(guān)系抽取。Katiyar等[13]針對(duì)Miwa等[12]利用依存樹結(jié)構(gòu)的缺點(diǎn)提出融合注意力機(jī)制的RNN方法實(shí)現(xiàn)實(shí)體關(guān)系聯(lián)合抽取。Zheng等[14]采用BiLSTM對(duì)輸入層進(jìn)行編碼,選用LSTM進(jìn)行解碼,實(shí)現(xiàn)實(shí)體識(shí)別;通過共享BiLSTM編碼器參數(shù),利用CNN模塊對(duì)編碼層結(jié)果進(jìn)行關(guān)系分類。文獻(xiàn)[15]通過引入互反饋機(jī)制,反饋更新共享層的參數(shù)來提升聯(lián)合抽取的效果。基于參數(shù)共享的實(shí)體和關(guān)系聯(lián)合抽取方法增強(qiáng)了實(shí)體識(shí)別和關(guān)系抽取兩個(gè)子任務(wù)的相關(guān)性,改善了傳統(tǒng)流水線方法錯(cuò)誤累積的不足。但是由于該方法都是利用共享底層模型參數(shù)來增強(qiáng)兩者的相關(guān)性,實(shí)質(zhì)上仍是先進(jìn)行NER,再利用NER的結(jié)果進(jìn)行RE,因此仍會(huì)產(chǎn)生不存在關(guān)系的實(shí)體對(duì)冗余信息,也存在錯(cuò)誤傳遞。

Zheng等[16]首次將實(shí)體關(guān)系聯(lián)合抽取轉(zhuǎn)化為序列標(biāo)注問題,還設(shè)計(jì)了帶有偏置損失函數(shù)的端到端模型,實(shí)現(xiàn)了真正意義上的實(shí)體關(guān)系聯(lián)合抽取。但在最終三元組的抽取時(shí)采用就近距離策略,且規(guī)定一個(gè)實(shí)體只能存在一個(gè)三元組中,導(dǎo)致大量關(guān)系數(shù)據(jù)丟失,無法解決實(shí)體重疊問題。曹明宇等[17]借鑒Zheng等[16]的方法,改進(jìn)標(biāo)注策略,采用BiLSTM-CRF模型有效緩解了同一實(shí)體參與多個(gè)關(guān)系的重疊問題,在生物醫(yī)學(xué)領(lǐng)域的藥物實(shí)體關(guān)系數(shù)據(jù)集上取得了較好的效果。

鑒于傳統(tǒng)流水線方法的不足和中醫(yī)文本中存在大量實(shí)體重疊的問題,本文提出一種基于字詞向量拼接的中醫(yī)實(shí)體關(guān)系聯(lián)合抽取方法。首先將字詞向量拼接作為輸入,再采用改進(jìn)的序列標(biāo)注策略在BiLSTM-CRF(Bi-directional Long Short-Term Memory Conditional Random Fields,BiLSTM-CRF)模型上對(duì)中醫(yī)文本進(jìn)行標(biāo)注,最后通過自定義的抽取規(guī)則進(jìn)行關(guān)系三元組提取。

2 中醫(yī)實(shí)體及關(guān)系聯(lián)合抽取方法

該方法使用改進(jìn)的序列標(biāo)注策略,將中醫(yī)的實(shí)體關(guān)系聯(lián)合抽取轉(zhuǎn)換成序列標(biāo)注任務(wù),詞向量與字符向量并聯(lián)拼接作為雙向LSTM-CRF輸入,利用雙向LSTM神經(jīng)網(wǎng)絡(luò)強(qiáng)大的特征提取能力,以及CRF在序列標(biāo)注上的突出優(yōu)勢(shì),結(jié)合優(yōu)化的抽取規(guī)則完成中醫(yī)實(shí)體關(guān)系聯(lián)合抽取。整體方法流程如圖2所示。

圖2 方法流程

該方法的整體流程為:

1) 對(duì)輸入的文本句子利用Word2vec進(jìn)行向量轉(zhuǎn)化,分別生成字向量和詞向量;

2) 將生成的向量以字為基本語義單元進(jìn)行字詞向量并聯(lián)拼接;

3) 采用改進(jìn)的標(biāo)注策略,通過BiLSTM-CRF模型對(duì)每個(gè)句子進(jìn)行序列標(biāo)注;

4) 根據(jù)序列標(biāo)注結(jié)果,結(jié)合自定義的抽取規(guī)則來抽取關(guān)系三元組。

2.1 模型輸入

One-hot編碼得到的是稀疏向量,向量的維度完全取決于語料庫的大小,且每個(gè)詞的向量之間都是獨(dú)立的,相近意思的詞語也沒有關(guān)聯(lián)關(guān)系。相較于One-hot編碼,Word2vec得到的詞向量降低了向量的維度,且語義相近的詞語被映射在相近的位置。

本文訓(xùn)練向量所用語料來源于《中醫(yī)證候鑒別診斷學(xué)》《中醫(yī)150證候辨證論治輯要(何曉暉)》和《中醫(yī)藥學(xué)概論》三本中醫(yī)相關(guān)書籍。而采用分詞工具得到的中文分詞結(jié)果并非完全正確,且單獨(dú)用詞作為語義單元也忽略了詞內(nèi)字間的聯(lián)系;單獨(dú)用字作為語義單元,又不能準(zhǔn)確地表達(dá)當(dāng)前的語境,因此本文采用了字詞向量并聯(lián)拼接作為模型輸入,將字和詞的信息有效地結(jié)合起來。中醫(yī)語料利用jieba分詞工具,并加載自定義的中醫(yī)領(lǐng)域自定義詞典進(jìn)行分詞,自定義詞典主要包含大量的證型、方劑等信息,通過Word2vec訓(xùn)練得到100維詞向量。中醫(yī)語料使用Word2vec訓(xùn)練得到100維字向量。最終,本文采用以字向量為基本語義單元與該字所在詞的詞向量進(jìn)行并聯(lián)拼接得到200維字向量作為模型的輸入,字詞向量并聯(lián)拼接豐富了詞的語義信息,提取有效特征,如圖3所示。例如文本:“四逆散中重用柴胡為君藥”,則該句中作為模型輸入“胡”的向量由“胡”的字向量與“胡”所在的詞“柴胡”的詞向量構(gòu)成。

圖3 字詞向量拼接

2.2 標(biāo)注策略

本文在Zheng等[16]提出的標(biāo)注策略和曹明宇等[17]的標(biāo)注策略基礎(chǔ)上進(jìn)行改進(jìn),將實(shí)體關(guān)系聯(lián)合抽取轉(zhuǎn)化為序列標(biāo)注的問題,對(duì)每個(gè)字符根據(jù)標(biāo)注策略進(jìn)行標(biāo)注。如圖4所示。

圖4 標(biāo)注實(shí)例

其中“O”表示該字不與其他字構(gòu)成實(shí)體,且在該句中與其他任何實(shí)體不存在預(yù)定義的關(guān)系;此外,每個(gè)標(biāo)簽共包含三部分的內(nèi)容:該字在實(shí)體中的位置、關(guān)系類別、實(shí)體在三元組中的位置。該字在實(shí)體中的位置采用“BIES”策略進(jìn)行表示,“B”代表實(shí)體開始,“I”代表實(shí)體中部,“E”代表實(shí)體末尾,“S”代表單個(gè)字構(gòu)成實(shí)體;關(guān)系類別是根據(jù)中醫(yī)語料預(yù)先定義好的,本文共涉及5種關(guān)系,分別為方劑/中藥、證型/方劑、證型/癥狀、病因/證型和M,M表示該實(shí)體與多個(gè)實(shí)體組成關(guān)系不同的三元組;實(shí)體在三元組中的位置有3種:1、2和P,其中P表示該實(shí)體與多個(gè)實(shí)體組成三元組且處于不同的位置。此種標(biāo)注策略有效緩解了實(shí)體重疊的問題。

2.3 BiLSTM-CRF

本文采用BiLSTM-CRF模型進(jìn)行中醫(yī)文本的序列標(biāo)注任務(wù),具體模型結(jié)構(gòu)如圖5所示。

LSTM網(wǎng)絡(luò)是RNN的一種變種[18],引入了細(xì)胞狀態(tài)概念,通過決定哪些信息需要被記憶,哪些需要被遺忘來解決RNN梯度爆炸和梯度消失的問題。LSTM主要通過遺忘門、輸入門和輸出門來達(dá)到信息傳遞目的。具體計(jì)算公式如下:

ft=sigmoid(Wf[ht-1,xt]+bf)

(1)

it=sigmoid(Wi[ht-1,xt]+bi)

(2)

ot=sigmoid(Wo[ht-1,xt]+bo)

(5)

ht=ot*tanh(Ct)

(6)

BiLSTM使用softmax進(jìn)行歸一化處理得到每個(gè)字對(duì)應(yīng)每個(gè)標(biāo)簽的概率,然而每個(gè)標(biāo)簽并非獨(dú)立存在,它們之間存在一定的約束,例如“E-方劑/中藥-1”之前一定是“I-方劑/中藥-1”,“B-方劑/中藥-1”之后一定是“I-方劑/中藥-1”。而CRF可以更好地學(xué)習(xí)各標(biāo)簽之間的依賴關(guān)系,進(jìn)行全局優(yōu)化,使標(biāo)注處理更加準(zhǔn)確和高效。

2.4 抽取規(guī)則

Zheng等[16]默認(rèn)一個(gè)實(shí)體只存在一個(gè)三元組中,關(guān)系抽取采取就近距離原則,這樣便損失了大量實(shí)體關(guān)系信息,而中醫(yī)文本中存在大量一個(gè)實(shí)體與多個(gè)實(shí)體構(gòu)成關(guān)系三元組的情況。曹明宇等[17]在此基礎(chǔ)上進(jìn)行改進(jìn),取得了較好的效果,但在匹配最近實(shí)體時(shí)設(shè)置了匹配方向而導(dǎo)致一些三元組丟失。

依據(jù)上述分析以及中醫(yī)文本的信息抽取需要,本文在采用就近原則抽取的基礎(chǔ)上,自定義了以下3條抽取規(guī)則:

規(guī)則1:對(duì)于命名實(shí)體識(shí)別任務(wù),當(dāng)實(shí)體標(biāo)簽的三個(gè)部分信息均正確時(shí)進(jìn)行抽取;對(duì)于聯(lián)合抽取任務(wù),當(dāng)組成三元組的實(shí)體1、實(shí)體2和關(guān)系類別均正確時(shí)進(jìn)行抽取。

規(guī)則2:組成三元組的關(guān)系類別約束。關(guān)系類別相同,或者其中一個(gè)或者兩個(gè)實(shí)體的關(guān)系類別為M,即本文預(yù)定義的4種關(guān)系類型可以與其相同的關(guān)系類型匹配也可以與M匹配。

規(guī)則3:組成三元組的實(shí)體位置約束:實(shí)體位置分別為1和2,或者其中一個(gè)或者兩個(gè)實(shí)體的實(shí)體位置為P,即1可以與2匹配,也可以與P匹配,2和P同理。如圖2樣例所示,麻黃湯可與麻黃組成關(guān)系三元組(麻黃湯,方劑/中藥,麻黃),與桂枝組成關(guān)系三元組(麻黃湯,方劑/中藥,桂枝),與風(fēng)寒表實(shí)證組成關(guān)系三元組(風(fēng)寒表實(shí)證,證型/方劑,麻黃湯)。

3 實(shí)驗(yàn)及結(jié)果分析

3.1 實(shí)驗(yàn)數(shù)據(jù)集

本文使用的語料源于中醫(yī)古籍、中醫(yī)相關(guān)教材等整理的2 968個(gè)句子,均經(jīng)人工按照本文的標(biāo)注策略進(jìn)行標(biāo)注。該中醫(yī)語料共包含方劑、中藥、證型、癥狀和病因5類實(shí)體,方劑/中藥、證型/方劑、證型/癥狀、病因/證型和M共5類關(guān)系,其中M表示該實(shí)體與多個(gè)實(shí)體組成關(guān)系不同的三元組。具體的占比見表1,按照7 ∶3的比例劃分訓(xùn)練集和測(cè)試集。

表1 各關(guān)系類型語料占比(%)

3.2 評(píng)價(jià)指標(biāo)

實(shí)驗(yàn)采用的評(píng)價(jià)指標(biāo)是準(zhǔn)確率(Precision,P)、召回率(Recall,R)、F1值。對(duì)于命名實(shí)體識(shí)別任務(wù),當(dāng)實(shí)體標(biāo)簽的三個(gè)部分信息均正確時(shí)認(rèn)為其正確;對(duì)于聯(lián)合抽取任務(wù),當(dāng)組成三元組的實(shí)體1、實(shí)體2和關(guān)系類別均正確時(shí)認(rèn)為其正確。具體三元組的P、R、F1的計(jì)算公式為:

式中:npredictright表示預(yù)測(cè)得到且正確三元組的數(shù)目;npredict表示預(yù)測(cè)得到三元組的數(shù)目;nright表示實(shí)際三元組的數(shù)目。

3.3 實(shí)驗(yàn)設(shè)置

向量輸入由Word2vec訓(xùn)練得到100維字向量和100維詞向量拼接而成200維字向量。模型訓(xùn)練涉及的主要超參數(shù):學(xué)習(xí)率設(shè)置為0.001;dropout設(shè)置為0.5;優(yōu)化器(optimizer)設(shè)置為Adam等。

3.3.1向量輸入對(duì)比實(shí)驗(yàn)

為了驗(yàn)證字詞向量拼接作為模型輸入的有效性,通過多組不同維度的單獨(dú)字向量作為輸入和字詞向量拼接作為輸入對(duì)比實(shí)驗(yàn)進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果見表2。

表2 輸入對(duì)比實(shí)驗(yàn)

其中char表示字向量,char_concat_word表示字詞向量拼接。由表2可知,字詞向量拼接作為輸入的效果均優(yōu)于單獨(dú)字向量作為輸入。本文最終目的是提取關(guān)系三元組,因此選用字向量100維和詞向量100維并聯(lián)拼接作為模型輸入。

如表2所示,與實(shí)體識(shí)別相比,三元組抽取具有更高的精確率,但其召回結(jié)果低于實(shí)體識(shí)別任務(wù),這意味著存在預(yù)測(cè)的實(shí)體并不能構(gòu)成實(shí)體對(duì),只找到了Entity1而沒有找到相應(yīng)的Entity2,或者Entity2而沒有找到相應(yīng)的Entity1。因此,實(shí)體對(duì)具有比單個(gè)實(shí)體更高的精度率和更低的召回率。

3.3.2模型對(duì)比實(shí)驗(yàn)

將本文方法與兩種流水線方法進(jìn)行對(duì)比實(shí)驗(yàn),方法一:BiLSTM-CRF序列標(biāo)注用于實(shí)體識(shí)別,在實(shí)體識(shí)別結(jié)果的基礎(chǔ)上使用SVM進(jìn)行關(guān)系抽取。方法二:BiLSTM-CRF序列標(biāo)注用于實(shí)體識(shí)別,在實(shí)體識(shí)別結(jié)果的基礎(chǔ)上利用LSTM進(jìn)行關(guān)系抽取。這兩種方法所用語料均為中醫(yī)語料,序列標(biāo)注時(shí)采用“實(shí)體中字的位置-實(shí)體類別”的標(biāo)注策略。

由表3實(shí)驗(yàn)結(jié)果可以得出,本文采用的聯(lián)合抽取方法較傳統(tǒng)的流水線方法F1值有較大的提升,較方法二(BiLSTM-CRF+LSTM)F1值提升4.49%,較方法一(BiLSTM-CRF+SVM)F1值提升接近10%,說明了本文方法的有效性。

表3 模型對(duì)比實(shí)驗(yàn)(%)

3.3.3抽取規(guī)則對(duì)比實(shí)驗(yàn)

采用本文提出的標(biāo)注策略,字詞向量拼接作為輸入,通過BiLSTM-CRF模型進(jìn)行序列標(biāo)注,分別采用Zheng等[16]、曹明宇等[17]和本文的抽取規(guī)則進(jìn)行三元組抽取對(duì)比實(shí)驗(yàn),如表4所示。

表4 抽取規(guī)則對(duì)比實(shí)驗(yàn)(%)

根據(jù)表4可知,使用本文的抽取規(guī)則實(shí)驗(yàn)效果整體更佳。前兩種方法P值偏高的原因如下:Zheng等[16]默認(rèn)一個(gè)實(shí)體只存在一個(gè)三元組,且在三元組抽取時(shí)采用就近原則;曹明宇等[17]在標(biāo)注策略中增加了實(shí)體類別的信息,且在三元組抽取時(shí)規(guī)定實(shí)體位置1只能向后匹配,實(shí)體位置2只能向前匹配。為了進(jìn)一步對(duì)比這3種方法的抽取結(jié)果,表5舉例進(jìn)行說明。

由表5可知:本文方法可以抽取到Zheng等[16]和曹明宇等[17]丟失的部分信息,改善了實(shí)體重疊的問題,但還是存在關(guān)系三元組損失的現(xiàn)象,仍需進(jìn)一步改進(jìn)。

4 結(jié) 語

本文使用改進(jìn)的序列標(biāo)注策略,將中醫(yī)的實(shí)體關(guān)系聯(lián)合抽取轉(zhuǎn)換成序列標(biāo)注任務(wù),詞向量與字符向量并聯(lián)拼接作為BiLSTM-CRF輸入,利用BiLSTM神經(jīng)網(wǎng)絡(luò)強(qiáng)大的特征提取能力,以及CRF在序列標(biāo)注上的突出優(yōu)勢(shì),結(jié)合優(yōu)化的抽取規(guī)則完成中醫(yī)實(shí)體關(guān)系聯(lián)合抽取,不僅克服了傳統(tǒng)流水線方法的弊端,很大程度地緩解了實(shí)體重疊的問題,并在中醫(yī)語料上達(dá)到80.42%的F1值。

但是,本文的方法仍存在丟失三元組的現(xiàn)象。此外該方法依賴人工標(biāo)注語料,而現(xiàn)實(shí)中存在大量無標(biāo)簽數(shù)據(jù),可以借助遠(yuǎn)程監(jiān)督的方法來緩解該問題。探究每個(gè)字符在句中的位置信息是否對(duì)實(shí)體關(guān)系聯(lián)合抽取有促進(jìn)作用是未來的工作。

猜你喜歡
三元組流水線方劑
基于語義增強(qiáng)雙編碼器的方面情感三元組提取
軟件工程(2024年12期)2024-12-28 00:00:00
基于帶噪聲數(shù)據(jù)集的強(qiáng)魯棒性隱含三元組質(zhì)檢算法*
Gen Z Migrant Workers Are Leaving the Assembly Line
中藥方劑在治療黃褐斑中的應(yīng)用
《金匱要略》黃芪類方劑探析
流水線
關(guān)于余撓三元組的periodic-模
論方劑的配伍環(huán)境
中成藥(2018年6期)2018-07-11 03:01:24
甘草在方劑中的作用及配伍規(guī)律
報(bào)廢汽車拆解半自動(dòng)流水線研究
万全县| 江源县| 烟台市| 澄江县| 长乐市| 梧州市| 友谊县| 全椒县| 定兴县| 邢台市| 新竹市| 四子王旗| 尚志市| 额敏县| 惠州市| 二手房| 怀化市| 宣武区| 涡阳县| 海南省| 徐水县| 武强县| 新干县| 阳山县| 阿克苏市| 锡林郭勒盟| 沅陵县| 商丘市| 顺昌县| 安国市| 昭平县| 镇康县| 麟游县| 大荔县| 黄山市| 岗巴县| 南江县| 乌兰浩特市| 营山县| 威宁| 额尔古纳市|