国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于現(xiàn)代信息技術(shù)的情報(bào)分析方法研究

2021-11-27 12:22郭建偉
天津科技 2021年11期
關(guān)鍵詞:科技情報(bào)評(píng)判情報(bào)

趙 欣,郭建偉

(1. 北京科學(xué)學(xué)研究中心 北京 100089;2. 北京市科學(xué)技術(shù)情報(bào)研究所 北京 100048)

0 引言

情報(bào)分析工作主要包括信息的抽取、篩選,知識(shí)分析、綜合,知識(shí)濃縮、集成,以及相應(yīng)的情報(bào)(信息)系統(tǒng)(決策支持系統(tǒng)、群體決策系統(tǒng)、電子數(shù)據(jù)處理系統(tǒng)等)開(kāi)發(fā)、研制與使用[1]。情報(bào)分析的最終目的是通過(guò)分析研究已知信息,獲得對(duì)事物深層次的認(rèn)識(shí)與把握,探索未知、預(yù)測(cè)未來(lái),為科學(xué)決策、科學(xué)研究、市場(chǎng)開(kāi)拓等提供參考方案,為知識(shí)創(chuàng)新服務(wù)。通過(guò)情報(bào)分析,揭示研究對(duì)象的內(nèi)在變化規(guī)律及其與周?chē)嘘P(guān)事物的聯(lián)系,弄清其歷史和現(xiàn)狀,并預(yù)測(cè)其未來(lái)發(fā)展的可能趨勢(shì);通過(guò)情報(bào)分析,可根據(jù)決策者和有關(guān)人員的情報(bào)需求,動(dòng)態(tài)及時(shí)提供情報(bào)。

1 情報(bào)分析的對(duì)象及作用

按照內(nèi)容的加工深度分,情報(bào)分析的對(duì)象可分為零次文獻(xiàn)、一次文獻(xiàn)、二次文獻(xiàn)和三次文獻(xiàn)[2]。零次文獻(xiàn)是指最原始的未公開(kāi)傳播的文獻(xiàn),如私人筆記、設(shè)計(jì)草圖、試驗(yàn)記錄、文章草圖、會(huì)議紀(jì)要及各種內(nèi)部文檔。一次文獻(xiàn)是以作者本人的生產(chǎn)和科研工作成果為依據(jù)而創(chuàng)作的原始文獻(xiàn),如期刊論文、科技報(bào)告、專(zhuān)利說(shuō)明書(shū)、會(huì)議論文、學(xué)位論文等。一次文獻(xiàn)通常反映了作者的創(chuàng)見(jiàn),是對(duì)知識(shí)的第一次加工。二次文獻(xiàn)是對(duì)一次文獻(xiàn)進(jìn)行替代、改組和綜合的產(chǎn)物,如編輯成目錄、文摘、索引等檢索工具或數(shù)據(jù)庫(kù)。二次文獻(xiàn)具有存儲(chǔ)、報(bào)道和檢索的功能,是對(duì)知識(shí)的第二 次加工。三次文獻(xiàn)是對(duì)原始文獻(xiàn)群的內(nèi)容進(jìn)行系統(tǒng)分析、綜合、評(píng)述而編寫(xiě)的文獻(xiàn)資料,是高度濃縮加工的再生科研文獻(xiàn),如專(zhuān)題評(píng)述、動(dòng)態(tài)綜述、學(xué)科年度總結(jié)、進(jìn)展報(bào)告以及數(shù)據(jù)手冊(cè)等。

目前,情報(bào)分析工作一般是通過(guò)二次文獻(xiàn),或直接閱讀、篩選一次文獻(xiàn),對(duì)情報(bào)信息的再度濃縮、提煉和加工。其研究報(bào)告是直接面對(duì)用戶(hù)、面向問(wèn)題的智慧結(jié)晶或決策參考方案。國(guó)外把承擔(dān)這類(lèi)工作的機(jī)構(gòu)稱(chēng)之為“智囊團(tuán)”或“腦庫(kù)”,如美國(guó)的蘭德公司、英國(guó)倫敦國(guó)際戰(zhàn)略研究所、日本野村綜合研究所等。在我國(guó)則是由情報(bào)研究機(jī)構(gòu)、咨詢(xún)公司等承擔(dān),如中國(guó)核情報(bào)研究所、全國(guó)各省市情報(bào)所等。他們?yōu)楦骷?jí)、各行業(yè)領(lǐng)導(dǎo)機(jī)關(guān)、決策機(jī)構(gòu)、科技管理部門(mén)的宏觀決策及時(shí)提供情報(bào)支持;為科學(xué)研究單位承擔(dān)的科研項(xiàng)目提供情報(bào)調(diào)研服務(wù)及關(guān)鍵技術(shù)跟蹤,研究科技發(fā)展態(tài)勢(shì);為社會(huì)有關(guān)行業(yè)和部門(mén)提供科技信息咨詢(xún)服務(wù),為重大項(xiàng)目論證、重大技術(shù)攻關(guān)以及科研成果產(chǎn)業(yè)化提供信息支撐服務(wù)。

2 情報(bào)分析方法的國(guó)內(nèi)外現(xiàn)狀與發(fā)展趨勢(shì)

情報(bào)分析是情報(bào)研究當(dāng)中的一個(gè)重要環(huán)節(jié),傳統(tǒng)的分析方法大多是采取人工方式,側(cè)重于對(duì)文獻(xiàn)的調(diào)研,如判斷分析法、對(duì)比法、相關(guān)分析法、綜合法、類(lèi)別法、時(shí)間序列分析法、模糊綜合評(píng)價(jià)法、回歸分析法、文獻(xiàn)計(jì)量法和德?tīng)柗品ǖ萚3]。這些方法在一些經(jīng)典的情報(bào)學(xué)著作中有詳細(xì)的介紹,在此不再贅述。網(wǎng)絡(luò)時(shí)代的到來(lái),可以獲取的信息資源越來(lái)越多,怎樣從海量信息當(dāng)中獲取有價(jià)值的情報(bào),去偽存真,總結(jié)提高,并且對(duì)分析結(jié)果進(jìn)行明晰表達(dá),都是急迫需要解決的問(wèn)題。面對(duì)數(shù)量龐大和形式復(fù)雜的信息資源,已經(jīng)有越來(lái)越多的研究和實(shí)踐表明,將計(jì)算機(jī)技術(shù)應(yīng)用到情報(bào)分析當(dāng)中,可以極大地提高情報(bào)分析的質(zhì)量和效率[4]。

通過(guò)對(duì)美國(guó)、英國(guó)、日本、加拿大、韓國(guó)等信息分析業(yè)比較發(fā)達(dá)的國(guó)家的研究發(fā)現(xiàn),充分運(yùn)用現(xiàn)代化的信息分析手段是其提高情報(bào)分析水平的關(guān)鍵[5]。早在1980年美國(guó)進(jìn)行的一次信息分析專(zhuān)業(yè)人員的調(diào)查就表明他們的工作已經(jīng)計(jì)算機(jī)化。這些國(guó)家的信息分析機(jī)構(gòu)除了采用熟知的通用統(tǒng)計(jì)分析軟件包,如社會(huì)科學(xué)統(tǒng)計(jì)軟件包(Statistical Package for the Social Sciences,SPSS)、統(tǒng)計(jì)分析系統(tǒng)(Statistics Analysis System,SAS)和Oracle、SQL server等數(shù)據(jù)庫(kù)軟件,德溫特分析家(Derwent Analytice,DA)等專(zhuān)利分析軟件包,還自行開(kāi)發(fā)了大量情報(bào)分析專(zhuān)用軟件。

我國(guó)在普及計(jì)算機(jī)技術(shù)在情報(bào)研究中的應(yīng)用、掌握利用互聯(lián)網(wǎng)從事信息采集和分析的技術(shù)、熟悉并開(kāi)發(fā)各種情報(bào)分析軟件、改進(jìn)情報(bào)成果表達(dá)和交流方式等方面做了大量的工作,使情報(bào)研究環(huán)境得到改善。以中國(guó)科技信息研究所、上海市科技情報(bào)研究所為代表的一些國(guó)內(nèi)情報(bào)服務(wù)機(jī)構(gòu),已經(jīng)在情報(bào)分析專(zhuān)用數(shù)據(jù)庫(kù)建設(shè)、智能情報(bào)分析軟件的開(kāi)發(fā)和利用等方面,取得了顯著的成果。中國(guó)科技信息研究所為了加強(qiáng)對(duì)中國(guó)科技論文的統(tǒng)計(jì)和分析,在1987年建立了大型多功能文獻(xiàn)數(shù)據(jù)庫(kù)——“中國(guó)科技論文與引文數(shù)據(jù)庫(kù)(CSTPCD)”,既有科技論文與引文的統(tǒng)計(jì)分析功能,又有很強(qiáng)的文獻(xiàn)檢索功能。數(shù)據(jù)來(lái)源于1200多種科技類(lèi)核心期刊,以及國(guó)家科技部年度發(fā)布的科技論文與引文的統(tǒng)計(jì)結(jié)果。除了關(guān)鍵詞檢索之外,還能通過(guò)地區(qū)、城市、學(xué)科、科研單位、高等院校、各類(lèi)基金資助論文發(fā)表情況、科研人員本人發(fā)表的論文情況等方面進(jìn)行檢索和統(tǒng)計(jì),從而反映我國(guó)學(xué)科、專(zhuān)業(yè)的發(fā)展趨勢(shì)、國(guó)家的科技水平、主要大學(xué)和科研院所的科學(xué)生產(chǎn)能力以及新興領(lǐng)域的潛力。在CSTPCD數(shù)據(jù)庫(kù)的支持下,中國(guó)科技信息研究所每年完成《中國(guó)科技論文統(tǒng)計(jì)與分析》年度報(bào)告、《中國(guó)科技期刊引證報(bào)告》、《中國(guó)高??萍颊撐漠a(chǎn)出排行榜》,對(duì)中國(guó)作者在國(guó)內(nèi)外發(fā)表的論文和被引情況進(jìn)行多角度的深入分析,從科技論文角度反映我國(guó)科研整體狀況和在世界上所處的位置及其變化。

上海市科技情報(bào)研究所利用Oracle數(shù)據(jù)分析軟件實(shí)現(xiàn)對(duì)專(zhuān)利信息的數(shù)據(jù)挖掘;北京市科技情報(bào)研究所建立的以自然語(yǔ)言處理技術(shù)為基礎(chǔ)的智能情報(bào)處理系統(tǒng),實(shí)現(xiàn)了科技情報(bào)的自動(dòng)分類(lèi)、去重、摘編等功能。一些軟件公司也推出了專(zhuān)業(yè)的情報(bào)分析軟件,如萬(wàn)方數(shù)據(jù)專(zhuān)利文獻(xiàn)多維檢索與分析軟件、TRS競(jìng)爭(zhēng)情報(bào)系統(tǒng)等[6]。

情報(bào)機(jī)構(gòu)的信息化、情報(bào)分析工作的現(xiàn)代化仍是我國(guó)科技情報(bào)事業(yè)的工作重點(diǎn)。目前,我國(guó)在情報(bào)研究工作方式、手段及研究方法上都有待提高。國(guó)內(nèi)的情報(bào)研究工作方式還有相當(dāng)一部分停留在文獻(xiàn)調(diào)研的基礎(chǔ)上,單純的定性研究仍占有較大的比例,情報(bào)分析工作也要加強(qiáng)信息資源的整合,通過(guò)引入和利用計(jì)算機(jī)輔助情報(bào)分析(Computer Aided Information Analysis,CAIA)軟件,通過(guò)數(shù)據(jù)挖掘技術(shù)、語(yǔ)義理解技術(shù)、相關(guān)統(tǒng)計(jì)分析技術(shù)以及數(shù)據(jù)抽取技術(shù)等提高定量分析能力,并集成多種情報(bào)分析手段和工具,建立更為完善的情報(bào)分析平臺(tái),并通過(guò)網(wǎng)絡(luò)組成虛擬的情報(bào)分析團(tuán)隊(duì),發(fā)揮潛在的社會(huì)智力資源。

3 基于數(shù)據(jù)挖掘技術(shù)的情報(bào)分析方法研究

數(shù)據(jù)挖掘,又稱(chēng)數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)[7],是指從巨大的、不完整的、有聲造的、含糊的、隨機(jī)的數(shù)據(jù)中,抓取隱藏在其中的、人們事先不知道的但又潛在有用的信息和知識(shí)的過(guò)程。最為著名的是美國(guó)沃爾瑪連鎖超市利用數(shù)據(jù)挖掘方法對(duì)顧客的購(gòu)物行為進(jìn)行分析,意外發(fā)現(xiàn):跟尿布一起購(gòu)買(mǎi)最多的商品竟是啤酒。原來(lái)美國(guó)的太太們常叮囑她們的丈夫下班后為小孩買(mǎi)尿布,而丈夫們?cè)谫I(mǎi)尿布后又隨手帶回了他們喜歡的啤酒。

數(shù)據(jù)挖掘的主流技術(shù)方法有:關(guān)聯(lián)分析、決策樹(shù)、遺傳算法、貝葉斯網(wǎng)絡(luò)、粗糙集方法、神經(jīng)網(wǎng)絡(luò)、統(tǒng)計(jì)分析[8]。近幾年來(lái),自然語(yǔ)言理解、語(yǔ)義關(guān)聯(lián)分析、詞頻分布統(tǒng)計(jì)、語(yǔ)料學(xué)研究等可以用于進(jìn)行情報(bào)分析的技術(shù)方法和工具已經(jīng)成為數(shù)據(jù)挖掘算法的重要研究方向,并且已經(jīng)出現(xiàn)一些成型的軟件工具。計(jì)算機(jī)技術(shù)的飛速發(fā)展使情報(bào)的自動(dòng)化收集、自動(dòng)化處理成為科技情報(bào)工作必然的發(fā)展趨勢(shì),更需要利用數(shù)據(jù)挖掘技術(shù)從海量信息中快速、準(zhǔn)確地獲取有用信息,并發(fā)現(xiàn)這些信息內(nèi)在的聯(lián)系,根據(jù)現(xiàn)有信息預(yù)測(cè)將來(lái)的發(fā)展趨勢(shì),以幫助情報(bào)分析人員實(shí)現(xiàn)對(duì)情報(bào)資料的深加工。

4 常用情報(bào)分析方法的計(jì)算機(jī)實(shí)現(xiàn)

4.1 Matlab實(shí)現(xiàn)層次分析法

層次分析法一般針對(duì)目標(biāo)結(jié)構(gòu)復(fù)雜的決策任務(wù),通過(guò)將目標(biāo)分層,建立多個(gè)分層的矩陣進(jìn)行計(jì)算得到最后結(jié)果,在解決實(shí)際問(wèn)題時(shí),往往計(jì)算量大,手工計(jì)算費(fèi)時(shí)且容易出現(xiàn)錯(cuò)誤,這很大程度制約了此方法的應(yīng)用。隨著計(jì)算機(jī)技術(shù)的出現(xiàn),計(jì)算量大的任務(wù)在計(jì)算機(jī)上實(shí)現(xiàn)能夠極大地節(jié)省時(shí)間。下面就Matlab軟件實(shí)現(xiàn)層次分析方法進(jìn)行介紹。

Matlab能夠?qū)哟畏治龇ǖ呐袛?、分析和?jì)算過(guò)程進(jìn)行處理。當(dāng)用戶(hù)輸入層次結(jié)構(gòu)方案和兩兩對(duì)比的判斷矩陣后可以快速得出相應(yīng)的結(jié)果,提高了層次分析方法在實(shí)際應(yīng)用中的效率。層次分析方法中最大的計(jì)算量是計(jì)算判斷矩陣是否滿(mǎn)足一致性約束,并且求解最大特征值和它對(duì)應(yīng)的特征向量。它在Matlab中求解程序如下:

使用者既可以利用上述程序在Matlab中編程實(shí)現(xiàn),也可利用一些成熟的層次分析法軟件,如yaahp 0.4.1進(jìn)行計(jì)算。

4.2 模糊評(píng)判法介紹及計(jì)算機(jī)輔助實(shí)現(xiàn)

模糊綜合評(píng)判法的基本思想主要是先利用與評(píng)價(jià)對(duì)象有關(guān)的單因素來(lái)評(píng)價(jià)結(jié)果,構(gòu)成相應(yīng)的評(píng)價(jià)矩陣,然后利用各確定因素重要性程度的權(quán)重因子作模糊變換,最終得到對(duì)評(píng)價(jià)對(duì)象的評(píng)價(jià)結(jié)果。

模糊評(píng)判法的實(shí)現(xiàn)步驟如下:

①設(shè)定各級(jí)評(píng)價(jià)因素和評(píng)判集。對(duì)于一個(gè)問(wèn)題進(jìn)行評(píng)判,關(guān)鍵問(wèn)題之一是確定與此問(wèn)題有密切關(guān)系的評(píng)價(jià)因素。找出影響問(wèn)題領(lǐng)域的典型因素,需要全面但是不能太過(guò)精細(xì)以免影響效率。

②計(jì)算因素值。一般現(xiàn)實(shí)生活中評(píng)價(jià)因素多是定性指標(biāo),而進(jìn)行模糊評(píng)判時(shí)需要轉(zhuǎn)化為定量指標(biāo),SPSS統(tǒng)計(jì)分析軟件為處理此類(lèi)問(wèn)題提供了強(qiáng)大的 功能。

③設(shè)定各級(jí)評(píng)價(jià)因素的權(quán)重(W)。各評(píng)價(jià)因素權(quán)重系數(shù)的準(zhǔn)確定義對(duì)于評(píng)判結(jié)果的合理性有決定性作用,為合理確定權(quán)重系數(shù),需要綜合考慮問(wèn)題領(lǐng)域多個(gè)經(jīng)驗(yàn)豐富的專(zhuān)家意見(jiàn)和此前相關(guān)的處理經(jīng)驗(yàn)。權(quán)重系數(shù)的量化處理方式可參照層次分析法的權(quán)重選擇系數(shù)確定方法。

④進(jìn)行模糊綜合評(píng)判計(jì)算,得出最后結(jié)果。建立評(píng)判因素、評(píng)判集、因素值矩陣和權(quán)重系數(shù)之后,即可以借助計(jì)算機(jī)進(jìn)行模糊綜合評(píng)判計(jì)算。

5 情報(bào)預(yù)測(cè)

情報(bào)研究的目的不僅在于更好地解釋過(guò)去與總結(jié)現(xiàn)在,更重要的是要有效地預(yù)測(cè)將來(lái),加強(qiáng)對(duì)未知領(lǐng)域的預(yù)測(cè)是提高情報(bào)研究生命力的重要途徑,也是充分體現(xiàn)科技情報(bào)前瞻性的價(jià)值所在。通過(guò)科學(xué)的情報(bào)預(yù)測(cè)可以找到未來(lái)一個(gè)時(shí)期內(nèi)預(yù)測(cè)對(duì)象的發(fā)展動(dòng)向和必然的趨勢(shì),并給予評(píng)價(jià)和做出預(yù)想的結(jié)論,包括水平發(fā)展動(dòng)向、發(fā)展規(guī)模、發(fā)展過(guò)程中的主要因素和可能的影響因素以及各環(huán)節(jié)之間的關(guān)系變化等。通過(guò)對(duì)以往發(fā)展過(guò)程的調(diào)研和總結(jié),結(jié)合目前的現(xiàn)狀和發(fā)展趨勢(shì),經(jīng)過(guò)分析、判斷、推理而提出未來(lái)發(fā)展中的問(wèn)題。

情報(bào)預(yù)測(cè)具有戰(zhàn)略意義,這種研究的結(jié)果為決策者確定科技發(fā)展的方向、規(guī)模、結(jié)構(gòu)和速度提供依據(jù)。如科技發(fā)展方向預(yù)測(cè),科技發(fā)展水平預(yù)測(cè),某個(gè)行業(yè)、某個(gè)專(zhuān)業(yè)在國(guó)民經(jīng)濟(jì)發(fā)展中地位和發(fā)展比例的預(yù)測(cè),科技發(fā)展速度與科技隊(duì)伍之間的比例關(guān)系和培養(yǎng)的途徑,對(duì)國(guó)內(nèi)外重大科學(xué)技術(shù)發(fā)明、發(fā)現(xiàn)的預(yù) 測(cè)等。

目前,情報(bào)預(yù)測(cè)已成為科研活動(dòng)和科學(xué)決策中不可缺少的部分,并且人們對(duì)預(yù)測(cè)的科學(xué)性、合理性要求也日益提高。傳統(tǒng)的情報(bào)分析活動(dòng)以手工方式和直觀預(yù)測(cè)進(jìn)行的定性分析占據(jù)了相當(dāng)大的比例[9]。隨著現(xiàn)代信息技術(shù)的迅速發(fā)展和廣泛應(yīng)用,信息的搜集、處理和傳遞方式都發(fā)生了革命性變化。特別是在分析處理過(guò)程中,由于在現(xiàn)代信息社會(huì)中信息量劇增,需要處理的信息和可利用的情報(bào)數(shù)量巨大,更加需要采用一定的信息技術(shù)或人工智能的手段,才能達(dá)到科學(xué)預(yù)測(cè)的目的。

6 結(jié)論

隨著社會(huì)環(huán)境和戰(zhàn)略決策需求的不斷變化,作為科技情報(bào)研究前提和保證的情報(bào)研究方法也必將進(jìn)一步得到充實(shí)和完善。一些情報(bào)研究方法的軟件化、集成化及在計(jì)算機(jī)上的實(shí)現(xiàn)都是未來(lái)發(fā)展的趨勢(shì)。

猜你喜歡
科技情報(bào)評(píng)判情報(bào)
情報(bào)
情報(bào)
基于數(shù)據(jù)工程的國(guó)防科技情報(bào)生態(tài)體系構(gòu)建
情報(bào)
初中英語(yǔ)評(píng)判性閱讀教學(xué)實(shí)踐與探索
不要用街頭小吃來(lái)評(píng)判北京
銅陵市科技情報(bào)工作存在的問(wèn)題與發(fā)展對(duì)策
試論市場(chǎng)經(jīng)濟(jì)條件下農(nóng)業(yè)科技情報(bào)自動(dòng)化發(fā)展策略
評(píng)判陌生人的兩條黃金法則
加強(qiáng)科技情報(bào)檔案管理工作的建議