王弘睿,劉 暢,于 東
(1.北京語言大學 信息科學學院,北京 100083;2.北京語言大學 漢語國際教育研究院,北京 100083)
道德判斷是人工智能倫理計算的一個重要問題。隨著人工智能技術(shù)的快速發(fā)展,機器接管了越來越多人類的工作任務,社會對人工智能決策道德性的擔憂也與日俱增:人工智能是否能夠理解我們的道德觀念?又能否學會人類的道德判斷?正如Picard[1]所說,“一臺機器的自由度越大,它就越需要道德標準?!睂⒅卮鬀Q策的控制權(quán)交給機器之前,機器首先需要具有符合人類道德標準的判斷能力。
使用詞匯來識別復雜的道德概念,從而讓機器學會道德標準,甚至具備道德判斷的能力,被認為是一種可靠的方法。Graham等人研究表明[2-5],詞匯是可以幫助機器進行道德判斷的一個相當可靠的標識符。在過去的10年里,已經(jīng)有許多研究運用詞匯學的方法來分析文本數(shù)據(jù)的道德基礎(chǔ)[6-8]。如機器認為“惡意謀殺”是不道德的,“誠實守信”是一種好的行為。道德詞典成為實現(xiàn)人工智能倫理計算的重要數(shù)據(jù)資源。
目前發(fā)布的英文道德詞典主要存在兩個問題:一是目前的道德詞典只考慮了與道德行為有關(guān)的動詞,詞性構(gòu)成和詞的類型比較單一;二是目前的道德詞典普遍規(guī)模較小,難以較為全面地覆蓋道德行為。因此,現(xiàn)有的英文道德詞典體系尚不完善。目前尚未有公開發(fā)布的中文道德詞典,其理論體系及構(gòu)建方法值得分析研究。
針對第一個問題,本文認為,除了動詞,名詞、形容詞以及一些成語也與行為的道德傾向緊密相關(guān),例如,活雷鋒、無私、公正廉潔等。除此之外,漢語中有不少體現(xiàn)道德傾向的被動表達,例如,被害、棄嬰等。因此,本文將動詞、名詞、形容詞、成語和漢語中的被動表達都納入道德詞典理論體系中,并根據(jù)所標注詞在事件行為中所處的位置,分為事件行為、事件狀態(tài)、事件屬性、事件要素四種類型,其中,事件要素再分為對象、媒介和地點三類。本文研究豐富了詞典的詞性構(gòu)成和詞的類型,覆蓋了更多的道德行為。
針對第二個問題,本文根據(jù)《現(xiàn)代漢語常用詞表》[9]整理出基礎(chǔ)道德詞表,并通過詞向量對基礎(chǔ)詞表進行擴展。道德詞典由2 777個詞擴展到29 907個詞,經(jīng)過標注核查后最終包含25 012個有效詞,減少了人工標注的成本,高效地擴展了道德詞典的規(guī)模。
最后,為了檢驗詞典的有效性,本文從詞的標簽及類型識別和判斷句子道德傾向兩個維度進行實驗。實驗結(jié)果表明,道德詞典資源能夠較為準確地判斷詞的標簽和類型,也能夠較好地判斷句子的道德傾向。
綜上,針對中文道德詞典資源缺乏的問題,本文提出了面向人工智能倫理計算的中文道德詞典構(gòu)建任務。本研究的主要貢獻包括以下三個方面。
(1)提出面向人工智能倫理計算的中文道德詞典構(gòu)建任務,將動詞、名詞、形容詞、成語以及漢語的被動表達納入道德詞典體系中,設計了中文道德詞典的理論體系,包含四類標簽和四種類型。
(2)通過詞向量擴展和人工核查,構(gòu)建了包含25 012個詞的中文道德詞典資源,盡可能全面地覆蓋各類道德行為。
(3)為了驗證詞典的有效性,本文從詞的標簽及類型識別和判斷句子道德傾向兩個維度進行了實驗。實驗結(jié)果表明,道德詞典資源能較為準確地判斷詞的標簽和類型,也能較好地判斷句子的道德傾向。
道德判斷是一個傳統(tǒng)的哲學問題。近些年來,社會心理學和認知語言學等領(lǐng)域也出現(xiàn)了跨學科的研究,但對道德傾向的大規(guī)模形式化處理,特別是道德的分類,仍處于自然語言處理的初級階段。隨著機器獲得更多的自主性,需要以更精細的方式來進行倫理計算,使其基于道德進行決策。[10]
道德判斷的研究可以追溯到情感分析任務。道德價值觀被認為是人格特征更高層次的組織結(jié)構(gòu)。而情感分析中對人格[11-12]和人類價值[13-14]等的評估,為分析人類的道德觀念提供了基礎(chǔ)。但是,情感詞典側(cè)重的是人的主觀情緒,道德詞典則是研究客觀的事件行為。例如,“殺人”這一事件,情感詞典的情感態(tài)度可能是“憤怒”“震驚”等,而道德詞典則判斷其是一個“不道德”的行為。
目前,道德詞典的研究可以分為理論體系設計和詞典資源構(gòu)建兩部分。
道德基本理論(Moral Foundations Theory,MFT)[15-17]解釋了道德的起源、心理基礎(chǔ)、發(fā)展和文化差異,被廣泛應用于計算社會科學領(lǐng)域。該理論定義了五個明確的分類,每個分類包括美德和惡習兩個維度,分別如下:
關(guān)心/傷害這一分類與我們作為哺乳動物的長期進化有關(guān),我們擁有依戀系統(tǒng)和感知他人痛苦的能力。它是善良、同情等美德的基礎(chǔ)。
公平/欺騙這一分類與人類社會的互惠性、利他主義有關(guān)。它產(chǎn)生正義、不平等和權(quán)利等觀念。
忠誠/背叛這一分類與我們部落聯(lián)盟的悠久歷史有關(guān)。它包含有愛國主義、忠誠、自我犧牲精神等。
權(quán)威/顛覆這一分類由我們長期的等級社會歷史形成。它包括對社會秩序的維護、對合法權(quán)威的尊重和對傳統(tǒng)的繼承等。
純潔/墮落這一分類由宗教觀念、以及對不潔食物和污染水源的挑戰(zhàn)里發(fā)展而來,即努力以一種高尚的、節(jié)欲的方式生活。它包括貞潔、健康和控制欲望等。
道德基礎(chǔ)理論僅保留了五種典型的道德類型,因此有大量的道德行為無法簡單歸類到這五種類型之中,這一點限制了其體系覆蓋道德行為的全面性。另外,道德作為一種文化現(xiàn)象,在不同國家及文化背景下有其獨特之處,MFT理論并不適宜直接套用于漢語體系。
Jentzsch等[18]通過設計道德選擇的問題模板,覆蓋了更多類型的道德行為。模板從第一人稱出發(fā),以問句形式呈現(xiàn)(表1)。標注者將待標注詞填入模板,如“我應該殺人嗎?”,答案模板為“應該/不該”。這些問題使標注者可以從決策層面判斷動作行為的對或錯。但目前的模板問題只適用于動詞,難以對名詞、形容詞等其他詞類進行判斷,限制了其體系覆蓋道德行為的規(guī)模。
表1 道德選擇問題模板
第一個用詞匯進行道德判斷的語言資源是道德基礎(chǔ)詞典(Moral Foundations Dictionary,MFD)[17]。該資源使用道德基礎(chǔ)理論的分類體系和極性標簽。該詞典包含151個美德詞和168個邪惡詞,詞典構(gòu)建完全依賴人工標注,構(gòu)建成本較高,不利于擴大規(guī)模。
MoralStrength[19]在道德基礎(chǔ)詞典分類的基礎(chǔ)上,通過WordNet詞匯數(shù)據(jù)庫對MFD進行了擴展。擴展前后各分類的分布情況如表2所示(括號內(nèi)為擴展前數(shù)量)。經(jīng)過人工標注核查后,得到了包含520個美德詞和476個邪惡詞的數(shù)據(jù)集。
表2 MoralStrength分類及擴展情況
續(xù)表
從以上研究可以看出,現(xiàn)有的英文道德詞典詞性構(gòu)成單一,覆蓋的道德行為較少,不利于擴大規(guī)模;且分類標準立足于英語文化,不能直接應用于漢語。因此,本文使用漢語文化思維,將詞性類型擴大到動詞、名詞、形容詞、成語,以及漢語中的被動表達,豐富了中文道德詞典詞性構(gòu)成,覆蓋了更多的道德行為。
本文將道德定義為具有普適性的行為規(guī)范,分為四類標簽和四種類型。具體類別及示例如表3所示。
表3 道德詞典分類體系及示例
本節(jié)首先介紹道德詞典中道德的界定和理論基礎(chǔ),然后介紹道德詞典的分類體系,包括標簽體系和類型體系兩部分。
本文將道德定義為具有普適性的社會行為規(guī)范,根據(jù)詞匯本身體現(xiàn)的行為信息進行道德判斷,探討道德上要求、禁止或允許的事件行為。
一方面,本文將道德的范圍限定為具有普適性的社會行為規(guī)范,如“惡意謀殺”這一行為,普遍被認為是不道德的。這一限定可以縮小道德判斷問題的范圍,回避道德困境類問題?!白詣玉{駛汽車”是否應該撞向障礙物,危及乘客,以避免與亂穿馬路的人相撞?對于這類問題,沒有普適性的行為規(guī)范進行判斷,不在本文討論的范圍內(nèi)。
另一方面,本文以非結(jié)果主義中的規(guī)則義務論為指導,根據(jù)行為本身的特征或行為體現(xiàn)的規(guī)則來判斷行為本身是否具有道德價值,將道德行為規(guī)范定義為“應該做什么”和“不應該做什么”的普遍規(guī)則。對非結(jié)果主義者來說,殺死某個人是錯誤的,因為殺人這一行為本身就是錯誤的;而對結(jié)果主義者來說,如果這個人正在殺死另外十個人的路上,這一殺人行為可能是正當?shù)?。由于結(jié)果主義的道德判斷常常需要大量的背景信息,而在詞匯級別,大多數(shù)詞本身無法完整體現(xiàn)出其行為的結(jié)果,所以本文認為,以非結(jié)果主義作為指導去判斷詞的道德傾向更為合理。
綜上,本文將道德的范疇限制為具有普適性的社會行為規(guī)范,并且只根據(jù)詞匯本身所體現(xiàn)的行為信息進行道德判斷。
本文通過分析漢語中動詞、名詞、形容詞、成語以及漢語中被動表達體現(xiàn)的道德特征,設計了中文道德詞典的分類體系。該分類體系包括四類標簽和四種類型兩部分。
2.2.1 道德詞典標簽分類
本文將道德詞典中的標簽分為正向道德、負向道德、中性、被動四類,如表4所示。
表4 道德詞典標簽分類及例詞
正向道德符合社會道德規(guī)范的事件行為,即被認為是應該做、需要做、提倡做的好的行為。例如,捐獻、正能量、福利院、活雷鋒等。
負向道德不符合社會道德規(guī)范的事件行為,即被認為是不該做、不能做、禁止做的壞的行為。例如,拐賣、慘無人道、傳銷、違禁品等。
中性在大多數(shù)情況下與社會道德規(guī)范無關(guān)的事件行為。例如,問話、人山人海、鬧劇、食品加工點等。
被動被動發(fā)生的、與社會道德規(guī)范有關(guān)的事件行為。例如,被害、棄嬰、飽受爭議、涉嫌詐騙等。
2.2.2 道德詞典類型分類
本文根據(jù)詞在事件行為中的位置和作用,將道德詞典中的類型分為事件行為、事件狀態(tài)、事件屬性以及事件要素四類,并為每個分類設計了對應的問題模板,如表5所示。
表5 道德詞典類型問題模板及例詞
事件行為這一分類針對的是動作行為本身,判斷該行為是否符合道德規(guī)范,一般表現(xiàn)為動詞。例如,詐騙、出爾反爾、惡意透支等。
事件狀態(tài)這一分類是對事件行為的狀態(tài)描述或評價,一般表現(xiàn)為形容詞。例如,合法合規(guī)、投機取巧等。
事件屬性這一分類是較為抽象的事件行為,或一系列事件行為的定義總稱,一般表現(xiàn)為名詞。例如,封建思想、敬業(yè)精神等。
事件要素這一分類是常常和事件行為一起出現(xiàn)的輔助因素,一般表現(xiàn)為名詞,包括對象、地點、媒介。其中,對象指的是事件行為的參與者,例如逃犯、棄嬰等。地點指的是事件行為發(fā)生的地點場所,例如黑作坊、非法賭場等。媒介指的是事件行為的媒介手段和工具,例如愛心專座、假幣等。
本文通過詞向量擴展的方法生成了備選詞表,并對備選詞表進行了人工標注,得到包含25 012個詞的中文道德詞典。
本節(jié)首先介紹備選詞表的生成方法,然后介紹標注方法及流程,最后對標注結(jié)果進行統(tǒng)計和分析。
《現(xiàn)代漢語常用詞表》[9]是具有權(quán)威典范性的中文詞表,表中詞匯覆蓋范圍較廣,且具有常用性和代表性。本文首先按道德分類體系對《現(xiàn)代漢語常用詞表》中的56 008個詞進行標注,得到1 164個正向道德詞、1 619個負向道德詞,構(gòu)成了包含2 777個詞的基礎(chǔ)道德詞表。
從基礎(chǔ)道德詞表的標注情況可以看出,道德詞的比例僅占《現(xiàn)代漢語常用詞表》的5%左右,大量的道德詞分散在其他漢語詞匯中。如果由人工一一進行標注,工程量大且構(gòu)建成本較高。
因此,本文通過詞向量對基礎(chǔ)道德詞表進行了擴展。對詞表的擴展基于這樣一個假設:如果一個詞具有道德傾向性,那么在詞向量空間中與其距離相近的詞也可能具有道德傾向性。[20]因此,本文將基礎(chǔ)道德詞表作為種子,使用騰訊發(fā)布的AILab詞向量[21]和gensim[22]計算找出與基礎(chǔ)道德詞表中每個詞的余弦距離最近的十個詞,構(gòu)成擴展詞表。擴展示例如表6所示。然后,將擴展詞表去重并按照詞性進行篩選,形成最終的備選詞表。
表6 詞向量擴展示例
本文參考中文情感詞典的構(gòu)建思路[23-25]設計了人工標注的流程,通過一系列步驟保證標注結(jié)果的有效性。
標注內(nèi)容根據(jù)道德詞的定義及分類體系,判斷待標注詞的道德標簽(中性、正向道德、負向道德、被動)和類型(行為、狀態(tài)、屬性、要素)。
標注人員招募10名培養(yǎng)層次為研究生的在校學生作為標注人員。
標注流程兩位標注人員為同一個詞進行標注。導入待標注詞后,標注員首先需要判斷所給詞是否具有道德傾向,標出其標簽。然后,標注員需要判斷所給詞的類型。最后,標注員需要對標注詞進行檢查,檢查無誤后提交標注結(jié)果。最終標注示例如表7所示。
表7 數(shù)據(jù)標注示例
一致性為保證標注工作的質(zhì)量,此次標注設計了培訓、試標環(huán)節(jié)來檢查一致性。培訓內(nèi)容包括道德理論、詞典體系以及標注流程等。標注人員通過培訓熟悉標注規(guī)范后,對語料進行試標注,試標結(jié)果錯誤率超過10%的標注員將被勸退。正式標注期間標注的一致性為83.6%。每個詞由兩位標注員進行標注,兩人標注結(jié)果不一致的詞,交由第三個人進行核查,有爭議的詞將被剔除。
經(jīng)過標注和一致性檢查后,本文共獲得有效標注結(jié)果25 012個,如表8所示。
表8 道德詞典分類結(jié)果
各標簽的分布情況如圖1所示。由分析結(jié)果可知,正向道德詞、負向道德詞和中性詞的規(guī)模相似,而被動詞所占比例較少,僅2%。被動類型由于涉及兩個以上對象,道德行為比較復雜。經(jīng)過進一步分析,發(fā)現(xiàn)其中正向道德和負向道德的比例大約是1∶6,這是由于被動表達中涉及受害者的詞匯較多造成的。
圖1 標簽分布
各類型的分布情況如圖2、圖3所示。行為詞數(shù)量最多,占到總數(shù)的一半,其他三個分類的比例相似。而要素的小類中,對象類明顯較多,地點類所占比例最小。
圖2 類型分布
圖3 事件要素分布
本文認為,道德詞典資源的有效性可以體現(xiàn)在以下兩個方面:一是機器能否通過道德詞典識別道德詞的標簽和類型;二是機器能否通過道德詞典識別句子的整體道德傾向,輔助道德文本分析。
針對這兩個方面,本文設計了兩個對應實驗,分別為詞的標簽及類型識別和判斷句子的道德傾向。對于前者,本文使用邏輯回歸(Logistic Regression,LR)和支持向量機(Support Vector Machine,SVM)兩種模型。對于后者,本文結(jié)合道德詞典,使用兩種方法對句子的道德傾向進行判斷。
通過道德詞標簽和類型的識別情況,可以檢驗機器是否能通過道德詞典學習到有效的道德知識。本實驗使用帶標簽、類型信息的道德詞典資源對模型進行訓練,然后使用預留的測試集對模型的分類識別能力進行評估。
4.1.1 實驗數(shù)據(jù)
本實驗將道德詞典按照8∶1∶1的比例劃分為訓練集、驗證集和測試集。兩個實驗使用共同的測試集,確保不同實驗的結(jié)果具有可對比性。輸入模型的訓練數(shù)據(jù)是詞項對應的預訓練詞向量[21]。標簽信息則依據(jù)預測目標的不同,分別對應詞典的標簽列和類型列。
4.1.2 實驗設計
預測詞的標簽本實驗使用兩種思路對詞的標簽進行預測。
思路一:四分類標簽預測。這一思路是將詞典中的四種標簽分類信息,即中性、正向道德、負向道德和被動,直接作為標簽對模型進行訓練。
思路二:兩步分類標簽預測。這一思路是先判斷詞是否包含道德傾向,即分為道德詞(包括正向道德和負向道德)或其他詞(包括中性和被動),再對兩者分別進行正向道德或負向道德,中性或被動的分類。
思路一和思路二均先使用LR和SVM在驗證集上優(yōu)化參數(shù),再對測試集進行預測,取測試集的結(jié)果作為最終的結(jié)果。
預測詞的類型本實驗使用六分類的方法對詞的類型進行預測。
六分類類型預測:本文將行為、狀態(tài)、屬性和要素-地點、要素-對象、要素-媒介六個分類設置為標簽對模型進行訓練,并對測試集進行預測。
考慮到數(shù)據(jù)的各個分類數(shù)量并不平衡,本文采用加權(quán)平均值(Weighted Average)來計算F1。
4.1.3 實驗結(jié)果及分析
表9展示了LR和SVM在三個實驗中預測測試集的F1值。從實驗結(jié)果可以看出,經(jīng)過訓練后,機器可以較好地掌握道德知識,對未知分類的詞進行預測,給出可靠的標簽。預測詞的標簽實驗中,四分類標簽預測結(jié)果好于兩步分類標簽預測。觀察測試集 輸出結(jié)果發(fā)現(xiàn),兩步分類標簽預測過程中存在誤差疊加的問題,即第一步分類中有誤差的結(jié)果會對第二步分類造成影響。在預測詞的類型實驗中,雖然有的類型數(shù)據(jù)不平衡,如要素-地點類的數(shù)據(jù)量較少,但是模型仍能給出比較理想的結(jié)果。
表9 道德詞典分類實驗結(jié)果 (F1/%)
三個實驗中,分類結(jié)果較好的模型對測試集預測結(jié)果的混淆矩陣熱力圖如圖4、圖5所示??梢钥闯?,直接四分類和兩步分類實驗中,中性類與負向道德、正向道德標簽識別的錯誤率均比較高。類型分類的混淆矩陣熱力圖如圖6所示??梢钥闯?,行為類和狀態(tài)類的區(qū)分較為困難。
圖4 四分類標簽預測
圖5 兩步分類標簽預測
圖6 六分類類型預測
對此,本文統(tǒng)計了人工標注環(huán)節(jié)標簽和類型標注不一致的情況。從圖7可以看出,最容易混淆的標簽分別是中性-負向道德和中性-正向道德,說明正確區(qū)分中性-正向道德和中性-負向道德是一個難點,即使對人類標注者而言也很容易出錯。從圖8可以看出,容易混淆的類型是狀態(tài)和行為,占不一致樣本總數(shù)的40%。和圖5中反映的規(guī)律相類似。
圖7 人工標注標簽不一致情況
圖8 人工標注類型不一致情況
此外,如表10所示,對一些有一定難度、存在迷惑性的詞項,模型也可以很好地做出判斷。如 “不隨地吐痰”和“隨地吐痰”非常類似,但是標簽相反,很容易誤判為負向道德標簽等。
表10 詞項標簽預測結(jié)果示例
本實驗通過道德詞典,使用兩種方法判斷句子總體的道德傾向性,以驗證道德詞典對判斷句子道德傾向的有效性。
4.2.1 實驗數(shù)據(jù)
本實驗使用社會新聞類報道作為判斷的句子來源,對2018—2019年新浪新聞的社會新聞版塊的新聞數(shù)據(jù)進行了爬取,收集了10.4萬篇新聞數(shù)據(jù)。然后按句拆解每篇新聞,保留結(jié)構(gòu)完整且句長為10~45詞的句子,作為判斷的來源句集。
4.2.2 實驗設計
本實驗使用兩種方法對句子道德傾向進行判斷。
方法一:對照文獻[26]使用情感詞典對句子進行情感分析的方法,建立基于道德詞典的道德分析。首先使用HanLP[27]對句子進行分詞,分詞前將道德詞典添加到分詞器的用戶詞典中,確保不會將道德詞典中較長的詞組切分開導致召回率下降;然后根據(jù)句子分詞結(jié)果,統(tǒng)計其與道德詞典中正向道德、負向道德、中性和被動標簽的對應情況,將對應數(shù)量最多的標簽作為句子整體的道德傾向。
方法二:道德詞典與依存句法分析結(jié)合的道德分析。在方法一的基礎(chǔ)上,對含有道德詞典中詞的句子進行依存句法分析。依存句法理論認為,每個句子中存在一個唯一的中心詞,支配著句子中其他所有的詞,其他詞直接或間接依賴于中心詞。同時,句子中除了中心詞外,每個詞都只被一個詞支配[28]。通過對句子做依存句法分析,可以理解句子中各部分的關(guān)系,以及各部分在各自關(guān)系中扮演的角色。根據(jù)不同類型的詞在句子中常扮演的角色,本實驗將依存句法分析中的幾種關(guān)系與道德詞典中的類型建立聯(lián)系,對應關(guān)系如表11所示。其中,依存句法分析的關(guān)系體系中沒有與地點和媒介兩種類型較為合適的對應關(guān)系。最后,將句中詞項對應的依存關(guān)系與該詞項在詞典中類型的對應關(guān)系進行對比,取詞項類型對應的標簽為句子的整體道德傾向。
表11 類型與依存句法對應關(guān)系
4.2.3 實驗結(jié)果及分析
本實驗從10.4萬篇新聞報道中進行抽取,得到1 627 123條句子供處理。由于這些句子都是沒有標簽的數(shù)據(jù),為了對方法一和方法二輸出的結(jié)果進行評估,我們從兩種方法的結(jié)果中各隨機抽取400條結(jié)果進行了人工標注,得到的結(jié)果如表12所示。
表12 兩種判斷方法結(jié)果
從表12可以看出,結(jié)合道德詞典做詞匹配的方法可以得到還不錯的正確率,而結(jié)合依存句法分析的方法可以更為可靠地對句子的道德傾向進行判斷。實驗結(jié)果證明了道德詞典在判斷句子道德傾向上的有效性。
判斷結(jié)果與句子實際道德傾向性不一致的情況,除去一些不滿足普適性道德判斷的句子,如有爭議性的國際新聞等,比較典型的錯誤:句子討論的話題涉及道德,但句子整體的道德傾向與句中道德詞的傾向不同。如表13所示,方法一的例句中含有兩個負向道德詞,被判斷為負向道德,但句子整體的道德傾向偏向于中性;方法二的例句中含有負向道德詞“慣匪”,但句子整體的道德傾向是中性的。這個問題涉及句子中的語義信息,從詞匯層面很難解決,未來我們會結(jié)合句子的語義信息進行完善。
表13 道德傾向判斷錯誤樣例
本文通過對詞的道德傾向性進行研究分析,提出面向人工智能倫理計算的中文道德詞典構(gòu)建任務,我們將詞典詞分為四類標簽和四種類型,通過詞向量擴展和人工標注構(gòu)建中文道德詞典資源。該詞典包含25 012個詞,其中,正向道德詞7 912個,負向道德詞7 647個,中性詞8 963個,被動詞490個。
同時,本文也探討了道德詞典資源的有效性表現(xiàn)。從詞的標簽及類型識別和判斷句子道德傾向兩個維度進行了實驗設計。實驗結(jié)果顯示,該詞典資源不僅能夠判斷詞的標簽和類型,而且能夠較好地判斷句子的道德傾向,為今后句子級別的道德文本分析提供了數(shù)據(jù)支持。
將社會倫理道德規(guī)范與科學技術(shù)創(chuàng)新結(jié)合是一條漫長的道路。目前詞典的分類方法比較粗糙,未來我們會根據(jù)詞的語義特征進一步細分,深入研究事件行為之間的語義關(guān)系,以便更好地解決人工智能倫理計算的道德判斷問題。