国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于語素的金融證券域文本情感探測

2021-12-11 20:10衛(wèi)衛(wèi)
安家(校外教育) 2021年51期
關(guān)鍵詞:情感分析金融信息

衛(wèi)衛(wèi)

摘要:伴隨著我國對于數(shù)據(jù)挖掘以及自然語言相關(guān)技術(shù)的不斷提高,在Web上研究者也加強了對資源的關(guān)注力度。但由于現(xiàn)階段金融證券領(lǐng)域缺乏一定的情感語料庫,因此將情感分析加入到金融證券域內(nèi)相關(guān)技術(shù)的應(yīng)用情況十分少見。面對數(shù)量巨大的非結(jié)構(gòu)化Web文本金融信息,加強對金融信息領(lǐng)域特征的考慮,充分利用基于語素的金融證券域文本情感的計算方法對Web文檔的情感分析有著巨大影響。

關(guān)鍵詞:金融信息,情感分析;領(lǐng)域特征

中圖分類號:G4 文獻標(biāo)識碼:A

一、引言

公眾可以通過Web新聞或者論壇的方式對上市公司進行一定的評論,同時結(jié)合一定的計算方法對每個文檔計算出一個情感值,情感傾向主要通過情感值來體現(xiàn),而文檔的傾向強度則是由情感值的絕對值進行控制。運用基于語素的金融證券域文本情感這一計算方法,可以避免資料庫缺少這一局限性,在不斷實驗數(shù)據(jù)以及結(jié)果來看,這種方法可以高校的分析出Web金融信息的情感傾向。

二、相關(guān)工作

使用文本情感分析方法已經(jīng)成為目前一種相對前端的分析手段,而在金融證券域中的全面開展,就需要立足于金融證券域的實際需求。從現(xiàn)階段對情感傾向性的研究來看,主要分為兩種:一種是利用機器學(xué)習(xí)的方法進行文本分類,將文本放置到特定的類別中,即正向或者負向;另一種則是給文本計算一個情感傾向值,傾向性則是通過值的符號來體現(xiàn),而傾向強度則是通過值的絕對值大小來體現(xiàn)。

要在金融證券域中應(yīng)用這種方法,主要從以下幾點展開:①對不同種類的相關(guān)對象進行分類。在具體分類過程中,很難考慮到所有方面,主要立足于我國證券的主要實施情況;②要有一定的時間限定,指的是在某一時間段內(nèi)應(yīng)該對什么類型的文本信息進行提取,這能才能夠滿足不同經(jīng)濟指標(biāo)的基本平衡;③對文本信息量進行確定。如何把握選取文本量與質(zhì)的關(guān)系,也就是在相對的量內(nèi)選擇能夠體現(xiàn)情感傾向的典型文本。想要完成好這些基礎(chǔ)性工作,就必須進行全面性的閱讀和學(xué)習(xí),從而得到一些學(xué)術(shù)上的基礎(chǔ)。同時也要對文本信息的時段、真?zhèn)吻闆r以及發(fā)布主體進行仔細辨別,確保文本的全面性,從而提高結(jié)論的公正。

三、基于語素的文本情感分析

3.1基礎(chǔ)框架

任何一項工作的開展都需要在一定的框架范圍內(nèi)實行,因此,基于語素的金融證券文本情感探測也需要建立一定的框架。從當(dāng)前Web上金融信息的基本內(nèi)容來看,主要包含兩類:一種是不同金融網(wǎng)站的新聞、專家品論、公告等等;而另一種則是不同股吧論壇上的帖子。前者的褒貶性不明顯,但內(nèi)容具有一定的真實性,通常被選作研究對象。

因此,在對金融證券進行框架構(gòu)建時,首先據(jù)需要針對金融證券產(chǎn)品實施文本情感探測,選取的目標(biāo)也要具有一定針對性,其應(yīng)具有一定的典型性、代表性。同時在對對探測內(nèi)容進行框架構(gòu)建時,就要以企業(yè)的經(jīng)濟數(shù)據(jù)作為基礎(chǔ),立足于金融證券域內(nèi)的評價、評論以及基本預(yù)測,對于一些情感傾向性強的文本信息,應(yīng)該進行歸納、綜合、分類以及提取。

3.2種子集選取

在建立的框架內(nèi),通過針對性選取,例如相關(guān)各種典型的預(yù)測以及企業(yè)走向較為理性的評價等等,并對其進行選取甄別,在大量信息中總結(jié)出具有一定規(guī)律的結(jié)論,從而指導(dǎo)不同主體的具體發(fā)展。而在實際的工作過程中,需要大量的精力用在具有一定代表性的不同情感傾做為選取目標(biāo)。特別需要注意的基本原則是,對于選取的情感文本不能融入自己的情感傾向,以一種相對客觀的心態(tài)面對文本信息。從現(xiàn)階段金融證券于的基本情況來看,其并沒有現(xiàn)成的情感此點,因此需要從現(xiàn)階段金融證券語料庫出發(fā),對所需的情感詞典進行構(gòu)造,首先就是對正向種子集和負向種子集進行定義,并根據(jù)同義關(guān)系或者反義關(guān)系對其進行擴展。

3.3文檔情感傾向性計算

這里所講的傾向性,主要指的是不同的相關(guān)主體,在對相關(guān)經(jīng)濟形式的具體觀察下,從而產(chǎn)生的具有一定個人槍桿的評論等等,雖然其中包含了一定的個人主觀色彩,有著不同種類有利于個人的祈禱祝福,但是其中仍然具有較多的理性成分。在通過對文本中的詞匯、語句甚至是整篇文芳的格局處理等進行分析,都可以得到相對文檔并且能夠用于計算的可靠數(shù)據(jù),從而結(jié)合企業(yè)發(fā)展的數(shù)據(jù)得出合理的結(jié)論。因此,在計算過程中要以文本的細粒度做為基本,從而展開情感屬性的相關(guān)研究,盡可能地將設(shè)計相關(guān)政府輿情分析、企業(yè)的發(fā)展趨勢以及其他主體的個人追求分析,都需要在計算過程中包含進去,這樣才能夠得到經(jīng)濟的綜合運算結(jié)果。

同時,對于文檔傾向性的計算主要可以從三方面進行,分別是詞匯級別、句子級別以及文檔級別。由于情感詞的傾向做為一個句子甚至一個文檔的情感傾向的具體表現(xiàn),充分利用建立好的詞典對情感詞傾向進行計算:

3.3.1詞的情感傾向性計算

組成詞的語素情感傾向決定了次的情感傾向,因此,可以通過組成詞的語素情感分?jǐn)?shù)來計算次的情感傾向值。在一個語素中,當(dāng)其出現(xiàn)在正向情感詞典中的次數(shù)較多時,則這個語素更傾向于褒義;反之,在負向情感此點中的次數(shù)較多時,則這個語素更傾向于貶義。

3.3.2句子情感傾向性計算

構(gòu)成句中情感詞的傾向決定了句子的情感傾向。由于否定詞會使情感詞的極性反轉(zhuǎn),這就導(dǎo)致在計算句子情感傾向值的時,要考慮否定詞的具體作用。同理,程度副詞也具有于否定詞相同的結(jié)果,因此也要考慮其中。

3.3.3文檔情感傾向性計算

通常情況下,人們總會將一些重要的、能夠表達觀點的句子放在相對顯眼的位置,例如標(biāo)題、段首、段末等,因此,在計算一個文檔的整體傾向性時,需要考慮情感劇的位置對情感值的印象影響。

結(jié)語:在對金融證券域語素的文本情感的不斷分析我們可以認(rèn)為,情感文本探測是現(xiàn)階段各相關(guān)主體的認(rèn)識動態(tài)的重要指標(biāo)。應(yīng)用這種探測方法,需要堅持不懈,并且在其他相關(guān)分析軟件的原有基礎(chǔ)上進行不斷研發(fā),這樣就可以為其他主體提供相對全面的思考。從現(xiàn)階段金融證券域的情感探測領(lǐng)域來看,仍然缺少針對性較強的分析原件,這就需要相關(guān)技術(shù)人員以及專業(yè)部門提高科研力度,以期在金融證券域的語素情感傾向探測上取得全面應(yīng)用。

參考文獻

[1]李國林,萬常選,邊海容,楊莉,鐘敏娟. 基于語素的金融證券域文本情感探測[J].計算機研究域發(fā)展,2011,(48):54-59.

[2]梁利高.基于語素的金融證券域文本情感探索[J].財政金融,2013,(14).

猜你喜歡
情感分析金融信息
動態(tài)信任視角下消費金融信息產(chǎn)品設(shè)計與評價
銀行、支付機構(gòu)不得收集與業(yè)務(wù)無關(guān)的消費者金融信息
基于語義的互聯(lián)網(wǎng)醫(yī)院評論文本情感分析及應(yīng)用
基于雙向循環(huán)神經(jīng)網(wǎng)絡(luò)的評價對象抽取研究
基于SVM的產(chǎn)品評論情感分析系統(tǒng)的設(shè)計與實現(xiàn)
基于詞典與機器學(xué)習(xí)的中文微博情感分析
在線評論情感屬性的動態(tài)變化
文本觀點挖掘和情感分析的研究
媒體融合時代金融信息服務(wù)業(yè)如何轉(zhuǎn)型升級
個人金融信息保護探析