国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

政策對科研選題的影響

2021-08-06 20:52梁繼文楊建林王偉
現(xiàn)代情報 2021年8期
關鍵詞:新能源論文政策

梁繼文 楊建林 王偉

摘?要:[目的/意義]提出自動化的政策文本量化方法,探索政策對科研選題的影響,為趨勢預測、前沿識別以及未來的科研選題提供參考。[方法/過程]文章以戰(zhàn)略性新興產(chǎn)業(yè)中的新能源汽車領域為樣板,綜合使用了文獻調(diào)研法、專家咨詢法與政策工具,將政策文本表征為詞向量后,通過特征擴展來識別關鍵性政策文本,并抽取政策關鍵短語來代表政策主題;選用LD

A模型提取論文主題來表征科研選題,通過對比分析政策文本主題與論文主題來探索政策對科研選題的影響。[結(jié)果/結(jié)論]通過實證研究表明,文章提出的方法可以實現(xiàn)政策文本的自動分解;證實了政策會對科研選題產(chǎn)生一定程度的影響,并為前沿識別與趨勢預測研究提供建議。

關鍵詞:政策文本量化;政策分解;主題分析;科研選題;LDA模型;情報服務;前沿識別;趨勢預測;新能源汽車

DOI:10.3969/j.issn.1008-0821.2021.08.011

〔中圖分類號〕G250.23?〔文獻標識碼〕A?〔文章編號〕1008-0821(2021)08-0109-10

Research?on?the?Impact?of?Policy?on?Scientific?Research?Topics

——Based?on?the?Quantitative?Method?of?Political?Texts

Liang?Jiwen1,2?Yang?Jianlin1,2?Wang?Wei1,2

(1.School?of?Information?Management,Nanjing?University,Nanjing?210023,China;

2.Jiangsu?Key?Laboratory?of?Data?Engineering?&?Knowledge?Service,Nanjing?210023,China)

Abstract:[Purpose/Significance]This?article?attempted?to?propose?an?automated?policy?text?quantification?method,explored?the?impact?of?policies?on?scientific?research?topics,and?provide?references?for?trend?forecasting,frontier?identification,and?future?scientific?research?topics.[Method/Process]The?paper?took?the?new-energy?vehicle?field?in?the?emerging?sectors?of?strategic?importance?as?an?example,comprehensively?used?the?literature?research?method,expert?consultation?method,and?policy?tools,characterized?the?policy?text?as?a?word?vector,and?then?used?feature?expansion?to?identify?key?policy?texts,extracted?the?policy?keyphrases?represent?the?theme?of?the?policy.We?used?the?thesis?theme,choose?the?LDA?model?to?extract?the?topic,through?the?comparative?analysis?of?the?public?policy?and?thesis?topic?to?explore?the?influence?of?policies?on?scientific?research?topics.[Results/Conclusions]The?empirical?research?shows?that?the?method?proposed?in?the?article?can?realize?the?automatic?decomposition?of?the?policy;it?proves?that?the?policy?has?a?certain?degree?of?influence?on?the?selection?of?scientific?research?topics,and?provides?suggestions?for?frontier?identification?and?trend?prediction?research.

Key?words:quantitative?analysis?of?policy;policy?decomposition;topic?analysis;scientific?research?topic;LDA?model;intelligent?service;frontier?identification;trend?prediction;new?energy?vehicle

科技進步是促進社會經(jīng)濟進步的主要推手,在當前形勢下,科技實力是國家間競爭的實質(zhì)??萍颊呤钦疄榇龠M科技發(fā)展、通過科技來服務于國家目標而采取的措施,20世紀70年代之前,我國科技政策主要以國家安全為導向,之后則轉(zhuǎn)向與產(chǎn)業(yè)政策的協(xié)同整合[1]。自20世紀80年代,我國先后出臺了大量產(chǎn)業(yè)綱要性政策與行業(yè)結(jié)構(gòu)調(diào)整政策,產(chǎn)業(yè)政策的主要任務之一便是“促進產(chǎn)業(yè)內(nèi)部結(jié)構(gòu)調(diào)整”[2],2005年頒布了首部《產(chǎn)業(yè)結(jié)構(gòu)調(diào)整指導目錄》并逐年調(diào)整、延續(xù)至今,該目錄覆蓋了國民經(jīng)濟中的大類行業(yè),詳盡列出了鼓勵類、限制類、淘汰類的產(chǎn)品與項目,這意味著通過對產(chǎn)業(yè)結(jié)構(gòu)進行調(diào)整也會影響領域內(nèi)的技術創(chuàng)新與進步。

傳統(tǒng)意義上,科技政策作用于企業(yè)研發(fā),產(chǎn)業(yè)政策作用于產(chǎn)業(yè)組織與產(chǎn)業(yè)結(jié)構(gòu)[3],但隨著產(chǎn)業(yè)政策與科技政策協(xié)同發(fā)展,Rothwell?R等將科技政策與產(chǎn)業(yè)政策合并為創(chuàng)新政策[4],指出政策的引導作用貫穿于“基礎研究—技術創(chuàng)新—轉(zhuǎn)移轉(zhuǎn)化—技術商品化—商品產(chǎn)業(yè)化”(創(chuàng)新鏈)的整個流程。李建花將科技政策與產(chǎn)業(yè)政策的結(jié)合部分表述為產(chǎn)業(yè)技術政策,指出政府通過產(chǎn)業(yè)政策來明確特定時段內(nèi)產(chǎn)業(yè)重點發(fā)展方向與技術的重點研發(fā)領域[1]。因此,可以認為政策產(chǎn)生的影響不僅作用于企業(yè)研發(fā)與產(chǎn)業(yè)結(jié)構(gòu)方面,還會作用于技術發(fā)展等其他方面。

情報學始終以服務國家安全發(fā)展、引領科技創(chuàng)新進步為己任,熱點識別、前沿識別、趨勢預測等始終是情報學科的重點研究方向?,F(xiàn)有研究多數(shù)基于領域論文與專利數(shù)據(jù),通過挖掘內(nèi)部的研究主題演化模式,來預測領域發(fā)展趨勢與前沿。但除論文、專利外的科技政策與產(chǎn)業(yè)政策等其他指導性文件,也極有可能對領域內(nèi)的研究趨勢造成影響。本文以戰(zhàn)略性新興產(chǎn)業(yè)之一的新能源汽車為樣板領域,使用詞向量表征政策文本,實現(xiàn)了自動化的政策分解與政策關鍵短語抽取,通過論文主題來反應領域內(nèi)的科研選題,進行了新能源汽車政策與論文主題的對比分析,從內(nèi)容層面分析政策對領域內(nèi)的科研選題、技術發(fā)展等方面的影響。一方面,通過自動化的政策文本量化方法,可以從政策中識別國家戰(zhàn)略需求從而提供主動式情報服務,發(fā)揮情報學“耳目尖兵參謀”的作用;另一方面,通過探索政策內(nèi)容與領域科研的關聯(lián),可以為趨勢預測、前沿識別以及未來科研選題提供參考。

1?相關研究

1.1?政策文本量化研究

政策文本是政府行為的載體,客觀記載了政策的意圖與實施過程[5]。對政策文本的內(nèi)容進行量化分析,可以明確政策主題、掌握政策演化方向、把握政策發(fā)展趨勢。政策文本量化分析的方法包含以下3類:政策文獻計量、內(nèi)容分析法、文本表示法[6]。

政策文獻計量融合了文獻計量學、統(tǒng)計學、社會學等多種學科方法[7],將政策文本類比為學術文獻,定義并識別政策文獻的結(jié)構(gòu)要素,輔以共詞分析、網(wǎng)絡分析、時序分析等方法來探索政策的分布特征、主題變遷、合作模式與體系結(jié)構(gòu)等[8-9]。此外,部分研究探索了政策的計量指標,如政策擴散計量指標[10]、政策實體指標等[11]。但政策文本不同于科技文獻,缺少關鍵詞信息,若要分析文獻主題變遷,需要人工標引政策關鍵詞并進行解讀。

內(nèi)容分析法構(gòu)建了從政策文本到語義的分析單元,主要使用人工編碼的方式將文本內(nèi)容轉(zhuǎn)化為含有規(guī)定語義信息的數(shù)字編號。最常見的方法是基于政策工具理論制定分析框架,如Rothwell?R等提出的經(jīng)典的供給、環(huán)境與需求政策工具[4]。在產(chǎn)業(yè)政策研究中,國內(nèi)學者基于國家戰(zhàn)略需求對傳統(tǒng)政策工具進行細化與完善[12-14];政策工具也與創(chuàng)新鏈等維度共同構(gòu)建政策內(nèi)容分析框架[15],用以分析政策工具的使用比例、政策的分布結(jié)構(gòu),旨在優(yōu)化完善產(chǎn)業(yè)政策體系。但該方法依賴于人工解讀與人工編碼,人力成本與時間成本較高。

文本表示法融合了文本挖掘、機器學習等自然語言處理技術,通過文本表示的方法將政策文本解析成包含語義特征的文本單元[16]。相較于其他方法,該方法實現(xiàn)了政策文本的自動化處理。政策文本表征方法包含詞袋模型表示法[17]與分布式表示法[18-19],詞袋模型的方法存在特征離散、高維、稀疏的問題,無法計算相似度,分布式表示則可將文本表示成連續(xù)、低維、稠密的向量。政策文本表征后可使用主題模型與相似度計算等方法探索政策主題的演化[20-21]、生成政策框架以及進行區(qū)域政策對比分析[22]。但由于政策類文獻結(jié)構(gòu)與行文的特殊性,直接對政策全文本進行主題抽取會引入無關數(shù)據(jù)。

1.2?政策引導效用研究

科技政策與產(chǎn)業(yè)政策是社會技術進步、經(jīng)濟發(fā)展的主要推手,是政府優(yōu)化產(chǎn)業(yè)結(jié)構(gòu)、引導產(chǎn)業(yè)技術方向、促進國民經(jīng)濟可持續(xù)發(fā)展的重要手段,通過技術創(chuàng)新戰(zhàn)略,提升創(chuàng)新績效,是我國經(jīng)濟發(fā)展的重要選擇。隨著科技政策與產(chǎn)業(yè)政策的協(xié)同發(fā)展,現(xiàn)有研究聚焦于探索政策的效用——即政策引導的績效評價,主要包含:政策對企業(yè)創(chuàng)新績效的影響[23-25]、政策對經(jīng)濟績效的影響[26]、政策對區(qū)域創(chuàng)新績效的影響[27]、政策力度對區(qū)域創(chuàng)新資源與創(chuàng)新績效關系的影響機制[28]、政策對技術的效力評估[29]這幾方面,此外也有研究探索了政策與行業(yè)技術創(chuàng)新的關聯(lián)[30-32]。

總體而言,現(xiàn)有研究主要通過政策結(jié)構(gòu)分布分析不足之處,提出改進建議,為制定創(chuàng)新驅(qū)動政策提供理論參考,以及通過調(diào)整政策來激勵產(chǎn)業(yè)發(fā)展與技術創(chuàng)新,優(yōu)化產(chǎn)業(yè)資源配置。在政策文本量化方法方面,現(xiàn)有的政策分解與主題提取依賴人工編碼與標引,需要較高的人力成本與時間成本。在政策選取方面,現(xiàn)有研究關注政府補貼、稅收優(yōu)惠、信用貸款以及行業(yè)準入等具有“激勵作用”的政策,但忽視了大量蘊含技術元素的政策,同時將政策的作用點局限于企業(yè)與產(chǎn)業(yè)。在政策效用評估方面,現(xiàn)有研究使用了多種量化評估方法,但只關注企業(yè)與技術的數(shù)量特征、使用數(shù)值型指標(如技術專利數(shù)量),并未考慮技術的內(nèi)容特征,忽視了政策對技術創(chuàng)新與研究內(nèi)容的影響。

2?研究方法

2.1?研究流程與技術路線

首先,進行政策文本與論文的數(shù)據(jù)篩選與采集。在政策文本方面,進行數(shù)據(jù)清洗與預處理后,通過政策要素與核心技術關鍵詞表來識別關鍵性政策文本,并抽取關鍵性政策文本中的政策關鍵短語;在論文方面,使用LDA模型提取論文的主題。最后,對比分析政策文本主題與論文主題。具體的研究流程如圖1所示。

2.2?政策關鍵短語抽取

文章使用政策文本量化研究中文獻計量學的方法,使用關鍵詞來表征文獻的主題。隨著信息技術的飛速發(fā)展,以及我國科技政策與產(chǎn)業(yè)政策體系架構(gòu)不斷完善,中央與各地方政府出臺的政策數(shù)量逐漸增多,因此,有必要探索一種政策關鍵詞自動識別的方法來替代傳統(tǒng)的人工標引。

政策文本具有特定的寫作格式文法,結(jié)構(gòu)復雜多樣、信息密度大,與政策主題相關的關鍵詞的分布呈現(xiàn)總體分散、局部集中的特點,尤其是在中長期規(guī)劃中涵蓋多種產(chǎn)業(yè)(如新能源汽車、新一代信息技術、高端裝備制造等)的研發(fā)布局,與本文相關的政策內(nèi)容通常存在某個“專欄”中,而其余政策文本則與本文無關,因此首先需要識別出與本文研究相關的“關鍵性政策文本”。具體步驟如下:①在政策文本規(guī)范、清洗后,進行分段與分詞處理,段落作為關鍵性政策文本識別的處理單元;②結(jié)合文獻調(diào)研、借鑒已有政策工具,提取政策要素,通過匹配政策要素識別出非技術類的關鍵性政策文本;③技術類的政策文本表述復雜、識別難度大,無法通過匹配政策要素識別,因此使用專家咨詢法與文獻調(diào)研法,基于新能源汽車產(chǎn)業(yè)鏈構(gòu)建核心技術關鍵詞表;④使用Word2vec對核心技術關鍵詞進行詞向量特征擴展,加入與其語義相近的詞,計算其與政策文本中詞匯的余弦相似度,將匹配的余弦相似度均值作為政策文本段得分,設定閾值實現(xiàn)技術類關鍵性政策文本識別。

在識別出的關鍵性政策文本的基礎上提取政策關鍵短語。與關鍵詞相比,由多個詞匯組成的短語能更好地表征政策的主題。文章在預實驗中使用基于TF-IDF計算詞權(quán)重的方法提取關鍵詞但效果欠佳,因此將LDA主題模型融入TF-IFD方法中來優(yōu)化關鍵詞的打分[10]。將政策文本分詞后使用TF-IDF計算文本的關鍵詞權(quán)重,提取出碎片化的關鍵詞,將其與相鄰關鍵詞重組后重新計算權(quán)重,去除相似詞匯后得到候選的關鍵短語。然后使用LDA模型計算政策文本的主題概率分布與候選關鍵短語的主題概率分布,通過調(diào)整關鍵短語的權(quán)重來優(yōu)化打分,抽取政策關鍵短語。

2.3?論文主題提取

文章使用LDA(Latent?Dirichlet?Allocation)[33]主題模型來挖掘論文的研究主題。LDA模型如圖2所示,包含主題、文檔與主題詞3層結(jié)構(gòu),認為一篇論文由多個主題構(gòu)成,其中某個主題又由多個特征詞來表示。M表示論文的數(shù)量,Nm表示文檔的詞,K為主題數(shù)量;α為主題分布的先驗分布,θm表示第m篇論文的主題分布,zm,n為第m篇論文中的第n個詞對應的主題;β為詞分布的先驗分布,φk表示第k個主題的詞分布,wm,n為第m篇論文中的第n個詞。θmφk均服從多項式分布(θm:Dirichlet(α),?m=1,…,M;φk:Dirichlet(β),?k=1,…,K)。通常使用困惑度Perplexity確定抽取的最優(yōu)主題數(shù)量,困惑度是論文中包含句子相似性的幾何平均值的倒數(shù),因此,當該值最低時,LDA模型抽取相應的主題數(shù)量效果最好。

將主題模型抽取出對應文獻數(shù)量最多的主題定義為核心主題。當核心主題中蘊含的主題詞較為宏觀且指向多個方面時,文章通過限定論文來使主題更加明確。主要利用論文—主題概率分布作為區(qū)分度對多主題論文進行限定:①若論文對應每個主題的概率值均低于0.1,說明該論文表達主題模糊、不屬于抽取出的主題,將該類論文排除[34];②為排除多主題文獻對核心主題造成的影響,計算每篇論文的主題概率分布,提取概率分布中核心主題概率值最大的論文,計算這些論文的核心主題概率與主題概率第二大的概率差值,若差值大于0.2,將其視為僅屬于核心主題的單主題文獻,并使用這些論文再次進行主題分析。將第二次獲取的主題與原有核心主題的主題詞進行對比并進行調(diào)整。此外,將包含過多功能詞(如連詞、副詞等)與基礎詞(如項目、分析、持續(xù)等)的主題過濾。

3?實證分析

3.1?數(shù)據(jù)獲取與預處理

研究的時間跨度為2001—2020年。為探索政策內(nèi)容與科研選題的關聯(lián),在劃分時間窗口時,以我國國民經(jīng)濟發(fā)展中具有規(guī)劃性質(zhì)的重要政策“五年計劃”作為時間節(jié)點,劃分4個時間片段T1:2000—2005(十五規(guī)劃)、T2:2006—2010(十一五規(guī)劃)、T3:2011—2015(十二五規(guī)劃)、T4:2016—2020(十三五規(guī)劃)。

在政策方面,文章中的政策特指國家層面的科技政策與產(chǎn)業(yè)政策。首先,在國務院、財政部、發(fā)改委、工信部、住建部、交通部與國管局等國家層次的政府門戶網(wǎng)站中以“新能源汽車”“新能源公交車”“電動汽車”等詞檢索相關政策文件,隨后在北大法寶專業(yè)政策數(shù)據(jù)庫中再次檢索并補全缺失文本,樣本采集截止時間為2021年1月。其中不包含多批次的《享受車船稅減免優(yōu)惠的節(jié)約能源?使用新能源汽車車型目錄》與《免征車輛購置稅的新能源汽車車型目錄》,不包含符合行業(yè)規(guī)范條件的企業(yè)名單。經(jīng)整合與篩選后獲得用于文本分析的政策文獻共100篇。

在論文方面,以“新能源汽車”“純電動汽車”“混合動力汽車”與“燃料電池汽車”作為主題詞進行檢索,時間限定為2000—2020年,文獻類型選取學術質(zhì)量較高的北大核心期刊論文與學位論文。觀察獲取到的文獻可知,雖然新能源汽車這一主題屬于技術研究范疇,但其對應的文獻分屬于“技術研究”與“社會研究”兩類:“技術研究類”代表實用性的技術成果,涵蓋技術研究、技術開發(fā)、工程研究等;“社會研究類”代表理論學習與社會實踐總結(jié),涵蓋應用研究與實踐研究,以及深入的行業(yè)/產(chǎn)業(yè)研究、業(yè)務研究與政策研究等;使用科技類的文獻來挖掘新能源汽車主題下的關鍵技術發(fā)展與演化情況,使用社科類的文獻來挖掘新能源汽車主題下的政府政策、產(chǎn)業(yè)結(jié)構(gòu)、競爭情報與經(jīng)濟動態(tài)等社會焦點的發(fā)展與演化情況。文章參考CNKI根據(jù)《中國學術期刊檢索與評價數(shù)據(jù)規(guī)范》中規(guī)定的文獻標識碼,部分輔以人工判定來劃分文獻類型。

獲取到學位論文5?683篇,其中技術類4?340篇,社科類1?343篇;北大核心期刊論文3?803篇,其中技術類2?919篇,社科類884篇。論文數(shù)量分布如圖3與圖4所示,由圖可知,在新能源汽車相關主題的論文中,技術類文獻數(shù)量多于社科類;技術類的學位論文與期刊論文在后3個時間段內(nèi)均呈現(xiàn)出先增長后下降的數(shù)量波動趨勢;社科類學位論文數(shù)量呈指數(shù)增長趨勢,而社科類期刊論文數(shù)量在2010年時增速明顯,2010年后持續(xù)波動但變化值較小。

數(shù)據(jù)預處理包含字段抽取、分詞與去除停用詞。去除政策的標題、機構(gòu)行政級別等信息,保留政策正文內(nèi)容后分段,進行分詞與去停用詞處理,剔除詞頻小于2的詞匯;論文數(shù)據(jù)保留論文題名、摘要與關鍵詞,將3個字段合并作為論文的內(nèi)容文本,進行分詞與去停用詞處理。

3.2?新能源汽車政策主題抽取

首先,獲取新能源汽車的政策要素。文章基于現(xiàn)有新能源汽車的政策工具[14,35]進行調(diào)整,將政策工具劃分為“技術支撐、標準約束、基礎設施、財政補貼、稅收減免、企業(yè)管理與商業(yè)運營”七類,分屬于技術、設施、財稅、企業(yè)和商業(yè)五大類,結(jié)合新能源汽車政策特定的提示詞,列出相應的政策要素,如表1所示。

其次,自建新能源汽車核心技術詞表。在結(jié)合政策內(nèi)容、回顧相關文獻、參考專家意見后,文章從新能源汽車產(chǎn)業(yè)鏈的角度出發(fā),將其核心技術分為3個階段——上游原材料提取與制備、中游核心部件制造、下游整車配套技術。上游原材料以電池原材料為主,涵蓋鋰、鎳硅碳、石墨烯等資源開發(fā)及處理;中游核心部件以國家新能源汽車規(guī)劃中的“三橫”為基礎,即電池、電機與電控三大系統(tǒng);下游整車開發(fā)涵蓋車輛設計生產(chǎn)以及充電樁等配套設施的研發(fā)。根據(jù)上述產(chǎn)業(yè)鏈獲得新能源汽車核心技術關鍵詞詞表,并結(jié)合政策內(nèi)容,降低“新能源汽車”“混合動力汽車”等區(qū)分能力較低的基礎關鍵詞的權(quán)重。

然后,識別新能源汽車關鍵性政策文本。通過政策要素匹配識別出非技術類的關鍵政策文本;在識別技術類的關鍵政策文本時,文章使用騰訊AI?Lab開源800萬中文預訓練模型,將政策文本表征為詞向量,基于核心技術關鍵詞的詞向量進行語義特征擴展。當關鍵詞中存在未登陸詞時類比Fast-Text算法中的N-Gram處理流程,將未登陸詞N-Grams拆分后輸入預訓練模型,并將匹配到的詞向量進行平均。設置擴展詞向量個數(shù)為15,將政策文本詞匯與擴展關鍵詞向量進行匹配,詞向量的余弦相似度作為關鍵詞匹配得分,將得分均值作為政策文本的最終得分。結(jié)合政策文本得分結(jié)果,選擇區(qū)分能力最強的分數(shù)閾值,設定為0.7,即0.7分以上的政策文本為技術類關鍵政策文本。

最后,使用2.2小節(jié)中的方法提取政策關鍵短語來表征政策主題,抽取出的政策主題詳見3.4小節(jié)。

為掌握新能源汽車政策內(nèi)容的演化變遷情況,將政策分布隨時間的變化進行可視化處理。結(jié)合政策內(nèi)容,將T1~T4?4個時間窗口與政策階段對應——T1(關鍵技術研發(fā)布局階段)、T2(產(chǎn)業(yè)化與推廣階段)、T3(推廣與技術創(chuàng)新階段)、T4(產(chǎn)業(yè)與技術調(diào)整升級的綜合階段)。統(tǒng)計上一步中識別出的關鍵政策文本在政策工具大類中的分布情況,繪制政策分布熱圖如圖5所示,顏色越深表示該類政策數(shù)量在相應年份中占比越多。由圖可知,T1階段政策集中于政府的技術戰(zhàn)略指導,從T1~T4階段,涵蓋技術要素的政策占比逐漸減小而企業(yè)商業(yè)含量增多,說明我國新能源汽車政策正逐漸由單方面的技術規(guī)劃轉(zhuǎn)向技術—產(chǎn)業(yè)—市場多方面推廣,同樣,新能源汽車領域的發(fā)展由政府戰(zhàn)略主導轉(zhuǎn)向政府—產(chǎn)業(yè)—市場多方主導;在T2~T4階段,財稅要素占比較高,顯示出優(yōu)惠政策是政府推廣新能源汽車的主要手段,同時增加充電基礎設施建設也是推廣的重點內(nèi)容;在T3與T4階段內(nèi),企業(yè)管理類要素分布較為均勻,說明政府對企業(yè)管理的關注度較為穩(wěn)定。

3.3?新能源汽車論文主題提取

分別計算4個時間段內(nèi)新能源汽車的技術類論文與社科類論文的困惑度,設定主題數(shù)K最大值為20,迭代次數(shù)設置為200,抽取訓練集為數(shù)據(jù)量的1/10。技術類論文與社科類論文的困惑度值的變化均先降低后增長,折線拐點為困惑度最小值。技術類論文在T1~T4時段內(nèi)困惑度最小值對應的主題數(shù)分別為7、6、4、5;社科類T1時段的論文數(shù)過少所以進行人工主題提取,通過困惑度確定T2~T4對應的主題數(shù)為12、8、5。設置LDA模型的迭代次數(shù)為200,No_Below參數(shù)為2用以過濾掉文檔頻率少于2的詞,其余參數(shù)保持默認值,并對詞向量進行TF-IDF特征提取。結(jié)合pyLDAvis主題可視化工具,分析獲取到的主題詞集合,通過主題調(diào)整與主題過濾,最終獲取論文的研究主題,具體主題見3.4小節(jié)。

3.4?政策與論文主題對比分析

文章綜合使用了結(jié)構(gòu)化分析方法中的大事記表與時間表方法,將抽取出的政策關鍵短語與論文主題進行可視化對比,如圖6所示。圖的縱軸是時間軸,自頂向下按照T1~T4?4個時間窗口劃分;圖左側(cè)的矩形樹圖中列出了分屬于技術、設施、財稅、企業(yè)與商業(yè)五大類的政策文本中抽取出的、有代表性的政策關鍵短語,不同類別政策的面積代表其數(shù)量占比;圖右側(cè)分別為技術類論文與社科類論文中抽取出的主題名稱。

圖6?政策文本主題與論文主題對比

3.4.1?技術類相關政策

在宏觀層面,關注規(guī)劃類政策主題與論文主題的變化趨勢與演化方向,對比分析如下:

1)技術類政策以中長期規(guī)劃為主,起到技術發(fā)展布局與引領作用,具有延續(xù)性。政策在T1初始戰(zhàn)略規(guī)劃時期,提出了三縱三橫的技術研發(fā)布局(三縱:混合動力汽車、純電動汽車、燃料電池汽車;三橫:蓄電池、電機與電控),在自科類論文中,4個時期的技術主題始終圍繞“三縱三橫”的具體內(nèi)容展開。

2)在T2時期,政策《新能源汽車生產(chǎn)準入管理規(guī)則》首次對“新能源汽車”進行了定義與規(guī)范,因此在T1時期政策中傾向于使用“電動汽車”這一概念而較少使用“新能源汽車”的概念;與之相應的是,T1時期社科類論文中對應文獻數(shù)量最多的主題為“電動汽車產(chǎn)業(yè)對比”“電動汽車發(fā)展戰(zhàn)略”,直至T2時期才開始使用新能源汽車這一概念。

3)T2時期政策《新能源汽車生產(chǎn)企業(yè)及產(chǎn)品準入管理規(guī)則》提出將3種新能源汽車劃分技術起步期、發(fā)展期以及成熟期,映射出3種車的技術成熟度與產(chǎn)業(yè)化程度為“混合動力汽車>純電動汽車>燃料電池汽車”,因此,混合動力汽車成為T2時期政策推廣新能源汽車的主打類型。與之對應的是,T2時期自科論文中的主題:“混合動力汽車關鍵核心技術”“混合動力系統(tǒng)仿真”“動力電池系統(tǒng)”,表明該時期技術方面也更加側(cè)重混合動力汽車的研發(fā)。

4)T3時期國家專項規(guī)劃提出實施“純電驅(qū)動”技術轉(zhuǎn)型戰(zhàn)略,在推廣“混合動力”應用的同時開始轉(zhuǎn)向發(fā)展“純電驅(qū)動”,將混合動力汽車理解為新能源汽車發(fā)展歷程中的“過渡產(chǎn)品”,大力研發(fā)燃料電池。自科論文對應數(shù)量最多的主題由T2的“混合動力汽車關鍵核心技術”演化至T3的“純電動汽車與混動汽車關鍵核心技術”,這與政策推廣傾向的改變相吻合。

5)T4時期政策延續(xù)“純電驅(qū)動”理念,將原有技術路線“三縱”中的混合動力汽車限定為插電式混合動力(含增程式)汽車,同時重點強調(diào)發(fā)展智能網(wǎng)聯(lián)汽車與燃料電池汽車。自科類論文中的主題“燃料電池系統(tǒng)集成”“氫燃料電池汽車關鍵技術”與社科類論文中的主題“智能汽車與電池產(chǎn)業(yè)發(fā)展戰(zhàn)略”“氫能產(chǎn)業(yè)展望”均與該時期政策技術規(guī)劃相對應。此外,T4時期政府加強了新能源汽車安全問題的監(jiān)管,尤其是電池安全標準建立與安全監(jiān)測平臺構(gòu)建,相應的在T4時期的技術類論文中出現(xiàn)了新能源汽車整車與零部件安全的研究。

在微觀層面,關注政策與論文中有關電池系統(tǒng)、電機與電控系統(tǒng)以及充電基礎設施的主題,對比分析如下:

1)電池系統(tǒng)

T1~T4時期內(nèi)的技術標準類政策對生產(chǎn)動力蓄電池的性能要求不斷攀升;與之對應的是T1~T4時期自科類論文中關于動力電池的研究主題,整體上圍繞動力電池系統(tǒng)展開,在電池容量、能量密度、功率密度與循環(huán)壽命等性能參數(shù)上不斷改進,經(jīng)歷了由鉛酸電池向鎳氫電池、鋰離子電池演化的過程,動力電池系統(tǒng)的發(fā)展已經(jīng)趨于完善,這與政策導向相符。

在氫燃料電池方面,政策在T1時期提出開發(fā)氫能源與燃料電池的規(guī)劃,在T2時期的《產(chǎn)業(yè)結(jié)構(gòu)調(diào)整指導目錄》中明確了氫燃料電池催化劑、電極、復合膜與雙極板等關鍵材料的開發(fā)與制造,T3時期要求實現(xiàn)燃料電池關鍵技術與系統(tǒng)集成的技術突破,T4時期強調(diào)開發(fā)燃料電池汽車的必要性;自科類論文中有關燃料電池的研究主題貫穿始終、與政策相符,演化如下:制氫方法/質(zhì)子交換膜制備—催化劑優(yōu)化/質(zhì)子交換膜優(yōu)化—電堆優(yōu)化—電堆優(yōu)化/氫燃料電池系統(tǒng)總成/新型燃料電池。其中T1~T3時期為氫燃料電池的基礎技術積累,T4經(jīng)過前期的技術積累走向電池系統(tǒng)集成,T4時期的系統(tǒng)集成主題晚于T3時期的政策,這是由規(guī)劃性政策的長效性與滯后性導致。此外,在T4時期政策中的“廢舊動力蓄電池回收”主題在自科類論文中尚無與之對應的研究主題。

2)電機與電控

政策中更側(cè)重于驅(qū)動電機的應用層面——電機系統(tǒng)的多種驅(qū)動方式,如混合動力汽車專用發(fā)動機、燃料電池發(fā)動機、混合動力發(fā)動機、耦合傳動等。與之不同的是自科論文中,研究主題傾向于不同類型驅(qū)動電機的優(yōu)化,如直流電機、永磁同步電機、開關磁阻電機、電機的振動與噪聲優(yōu)化等。在電控方面的政策主題與論文主題則是較為一致,隨時間演化由基礎電控系統(tǒng)逐漸走向智能控制系統(tǒng)。

3)供能技術

有關供能設施的政策分布在T2~T4時期,政策主題由充電站、加氫站等供能基礎設施的建設轉(zhuǎn)向快充與智能電網(wǎng)等供能技術;社科論文中與供能相關的主題分布在T3“基礎充電設施發(fā)展與規(guī)劃”,與T2時期提出的設施建設規(guī)劃相符;自科論文中與供能設施相關的研究主題分布在T3~T4,與T3~T4時期的政策主題相符,圍繞如加氫、微網(wǎng)、優(yōu)化調(diào)度等供能技術展開。

總體上看,在領域技術研發(fā)方面,規(guī)劃綱要類政策起主要影響作用(如三縱三橫)。該類政策多數(shù)是中長期規(guī)劃,具有持續(xù)性且作用時間較長;同時由于科技創(chuàng)新類政策受政策級別、政策過程與宏觀因素的影響[36],會出現(xiàn)政策滯后的情況,導致相應的論文研究主題會在政策出臺一段時間后出現(xiàn)(如燃料電池系統(tǒng)集成)。因此,某項近年來政策強調(diào)的技術(如廢舊電池循環(huán)技術)卻尚未出現(xiàn)在論文主題中也是由上述原因?qū)е隆?/p>

3.4.2?其他類政策

除含有技術導向的政策之外,與財稅、企業(yè)、商業(yè)相關的政策主題與論文主題的對比分析如下:

1)在T1~T4時期中,社科類研究中以電動汽車/新能源汽車產(chǎn)業(yè)技術發(fā)展戰(zhàn)略分析為主題的占比最多,在內(nèi)容上具有連續(xù)性:技術與產(chǎn)業(yè)發(fā)展戰(zhàn)略對比—產(chǎn)業(yè)化探索—宏觀與地方產(chǎn)業(yè)發(fā)展—智能汽車產(chǎn)業(yè)發(fā)展戰(zhàn)略,并逐漸引申出技術創(chuàng)新模式等主題的研究,這與政策導向演化、國家政策落地落實的趨勢相符。上述研究均以戰(zhàn)略規(guī)劃類的科技政策與產(chǎn)業(yè)政策作為研究基石。

2)財稅政策在新能源汽車政策中占據(jù)重要地位,在T2~T4時期不斷調(diào)整與完善,在初始財稅補貼推廣的基礎上逐漸提升企業(yè)與汽車性能的門檻,T4時期政府在發(fā)生“新能源汽車騙補門”后加強了對企業(yè)的監(jiān)管力度,調(diào)整補貼模式,提出以獎代補,補貼對象由汽車制造生產(chǎn)方、消費者向供能設施運營商轉(zhuǎn)移;大量的社科類論文基于系列財稅政策,在T2~T3時期分析國家及地方的財稅推廣政策變化并基于此評估產(chǎn)業(yè)發(fā)展,T4時期的論文則基于騙補事件并結(jié)合現(xiàn)有政策提出量化模型,為政策優(yōu)化與加強市場監(jiān)管提供建議。

3)隨著技術進步與產(chǎn)業(yè)發(fā)展,基于補貼政策衍生出相應的企業(yè)與商業(yè)政策。企業(yè)政策以產(chǎn)品準入、企業(yè)準入、投資準入與燃油經(jīng)濟性核算為核心內(nèi)容。國家在T4時期提出積分并行管理(雙積分)政策,該政策被視為補貼退坡后的重要承接政策,目的是促進新能源汽車企業(yè)績效的提升;T4時期以“補貼退坡、積分政策與市場監(jiān)管”“財稅政策與企業(yè)績效”為主題的論文基于積分管理與補貼退坡政策來探索政策變革是否對企業(yè)績效有影響。

4)在商業(yè)模式方面,T2時期政策中提出的“電池租賃”等新型商業(yè)模式,首次出現(xiàn)在T3時期的社科論文主題中;T3時期出現(xiàn)的“互聯(lián)網(wǎng)+”營銷模式,首次出現(xiàn)在T4時期的社科論文主題中;而T4時期政策重點扶持的“車電分離”商業(yè)模式尚未出現(xiàn)在T4時期的社科論文研究主題中。因此,與商業(yè)模式相關的政策對論文研究內(nèi)容起主導作用,但具有一定的滯后性。

總體上看,面向管理服務類的社科類研究受政策內(nèi)容影響較大。由于政策研究自身便是社科類研究的重要方向,因此與新能源汽車相關的政策與政策中提到的產(chǎn)業(yè)結(jié)構(gòu)、財政補貼、營銷模式、商業(yè)模式、科研合作模式、以及由政策引發(fā)的社會事件(如騙補門)均成為了新能源汽車社科類研究選題的重要內(nèi)容。

綜上所述,新能源汽車政策中涵蓋的技術研發(fā)、產(chǎn)業(yè)布局、企業(yè)投資、商業(yè)模式、融資信貸等多方面導向與論文主題一一對應;當某個時段中的某項政策出現(xiàn)后,相同時段或下一時段中會出現(xiàn)相應的論文主題;尤其是當政策的傾向發(fā)生變化時,隨之變化的論文主題尤為明顯。這說明出臺的政策會對論文的研究內(nèi)容產(chǎn)生影響,即政策在一定程度上影響了科研的選題,在技術類研究中的影響較為持續(xù),在社科類研究中的影響更為直接。

4?結(jié)?語

文章以科技政策與產(chǎn)業(yè)政策對科研選題的影響為研究重點,選取新能源汽車領域為樣板,提出了一種自動化的政策文本量化方法,實現(xiàn)了自動化的政策分解與政策主題提取;使用論文的主題來表征領域內(nèi)的科研選題,通過對比技術、財稅、企業(yè)等多個導向的政策的主題與技術類、社科類論文的主題,證實了政策會在一定程度上對領域內(nèi)的科研選題產(chǎn)生影響。因此,在未來的領域前沿識別與趨勢預測研究中,除了使用常見的論文與專利數(shù)據(jù)挖掘自身的變化規(guī)律外,應使用多源數(shù)據(jù),考慮政策以及其他的外部因素對研究趨勢的影響,增強前沿識別、趨勢預測、顛覆性技術預測的準確度與可解釋性,提升情報服務質(zhì)量,為未來科研選題提供參考。研究尚有不足之處:在實驗數(shù)據(jù)源方面,僅使用論文數(shù)據(jù)來代表研究選題進行初步探索,將在后續(xù)研究中加入專利數(shù)據(jù)、科技項目數(shù)據(jù)等其他多源數(shù)據(jù),同時探索外部因素對前沿識別與趨勢預測的具體影響。

參考文獻

[1]李建花.科技政策與產(chǎn)業(yè)政策的協(xié)同整合[J].科技進步與對策,2010,27(15):25-27.

[2]江飛濤,李曉萍.直接干預市場與限制競爭:中國產(chǎn)業(yè)政策的取向與根本缺陷[J].中國工業(yè)經(jīng)濟,2010,(9):26-36.

[3]沈旺,張旭,李賀.科技政策與產(chǎn)業(yè)政策比較分析及配套對策研究[J].工業(yè)技術經(jīng)濟,2013,32(1):127-133.

[4]Rothwell?R,Zegveld?W.Industrial?Innovation?and?Public?Policy:Preparing?for?the?1980s?and?1990s[M].London:France?Pronter,1981.

[5]李鋼,藍石,等.公共政策內(nèi)容分析方法:理論與應用[M].重慶:重慶大學出版社,2007.

[6]鄭新曼,董瑜.政策文本量化研究的綜述與展望[J].現(xiàn)代情報,2021,41(2):168-177.

[7]李江,劉源浩,黃萃,等.用文獻計量研究重塑政策文本數(shù)據(jù)分析——政策文獻計量的起源、遷移與方法創(chuàng)新[J].公共管理學報,2015,12(2):138-144,159.

[8]李燕萍,劉金璐,洪江鵬,等.我國改革開放40年來科技人才政策演變、趨勢與展望——基于共詞分析法[J].科技進步與對策,2019,36(10):108-117.

[9]王欣,杜寶貴.國際科技政策研究進展與趨勢——基于文獻計量分析[J].科技管理研究,2020,40(23):48-56.

[10]張劍,黃萃,葉選挺,等.中國公共政策擴散的文獻量化研究——以科技成果轉(zhuǎn)化政策為例[J].中國軟科學,2016,(2):145-155.

[11]劉建華,張智雄,張琴.基于多維政策實體及其關系的科技政策演化路徑揭示方法研究[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2019,3(5):57-67.

[12]陳衍泰,張露嘉,汪沁,等.基于二階段的新能源汽車產(chǎn)業(yè)支持政策評價[J].科研管理,2013,34(S1):167-174.

[13]張永安,周怡園.新能源汽車補貼政策工具挖掘及量化評價[J].中國人口·資源與環(huán)境,2017,27(10):188-197.

[14]李珒,戰(zhàn)建華.中國新能源汽車產(chǎn)業(yè)的政策變遷與政策工具選擇[J].中國人口·資源與環(huán)境,2017,27(10):198-208.

[15]胡峰,張巍巍,曹鵬飛,等.基于政策工具視角的長三角地區(qū)機器人產(chǎn)業(yè)政策研究[J].科技管理研究,2019,39(4):174-183.

[16]Webster?J,Kit?C.Tokenization?as?the?initial?phase?in?NLP[C]//COLING?1992?Volume?4:The?15th?International?Conference?on?Computational?Linguistics,1992.

[17]Windsor?L,Dowell?N,Windsor?A,et?al.Leader?Language?and?Political?Survival?Strategies[J].International?Interactions,2018,44(2):321-336.

[18]Rodman?E.A?Timely?Intervention:Tracking?the?Changing?Meanings?of?Political?Concepts?with?Word?Vectors[J].Political?Analysis,2020,28(1):87-111.

[19]Jentsch?C,Lee?E?R,Mammen?E.Time-dependent?Poisson?Reduced?Rank?Models?for?Political?Text?Data?Analysis[J].Computational?Statistics?&?Data?Analysis,2020,142:106813.

[20]楊慧,楊建林.融合LDA模型的政策文本量化分析——基于國際氣候領域的實證[J].現(xiàn)代情報,2016,36(5):71-81.

[21]Blaydes?L,Grimmer?J,McQueen?A.Mirrors?for?Princes?and?Sultans:Advice?on?the?Art?of?Governance?in?the?Medieval?Christian?and?Islamic?Worlds[J].The?Journal?of?Politics,2018,80(4):1150-1167.

[22]張濤,馬海群,易揚.文本相似度視角下我國大數(shù)據(jù)政策比較研究[J].圖書情報工作,2020,64(12):26-37.

[23]張永安,閆瑾.技術創(chuàng)新政策對企業(yè)創(chuàng)新績效影響研究——基于政策文本分析[J].科技進步與對策,2016,33(1):108-113.

[24]孟維站,徐喆,劉宇佳,等.我國科技政策組合特征對高技術產(chǎn)業(yè)創(chuàng)新效率的分階段影響[J].經(jīng)濟問題,2019,(6):49-54.

[25]鄭燁,劉遙.政策引導對中小企業(yè)創(chuàng)新績效的影響機理研究[J].科研管理,2021,42(4):73-81.

[26]顏曉暢,黃桂田.政府財政補貼、企業(yè)經(jīng)濟及創(chuàng)新績效與產(chǎn)能過?!趹?zhàn)略性新興產(chǎn)業(yè)的實證研究[J].南開經(jīng)濟研究,2020,(1):176-198.

[27]林周周,蘇屹.知識源異質(zhì)性視角下知識溢出與區(qū)域創(chuàng)新績效關系——基于知識產(chǎn)權(quán)保護的門檻效應分析[J].系統(tǒng)管理學報,2021,30(2):227-237,252.

[28]何增華,陳升.科技創(chuàng)新政策對創(chuàng)新資源——績效的跨層調(diào)節(jié)影響機制[J].科學學與科學技術管理,2020,41(4):19-33.

[29]郭本海,陸文茜,王涵,等.基于關鍵技術鏈的新能源汽車產(chǎn)業(yè)政策分解及政策效力測度[J].中國人口·資源與環(huán)境,2019,29(8):76-86.

[30]何凌云,黎姿,梁宵,等.政府補貼、稅收優(yōu)惠還是低利率貸款?——產(chǎn)業(yè)政策對環(huán)保產(chǎn)業(yè)綠色技術創(chuàng)新的作用比較[J].中國地質(zhì)大學學報:社會科學版,2020,20(6):42-58.

[31]余長林,楊國歌,杜明月.產(chǎn)業(yè)政策與中國數(shù)字經(jīng)濟行業(yè)技術創(chuàng)新[J].統(tǒng)計研究,2021,38(1):51-64.

[32]Andriosopoulos?K,Silvestre?S.French?Energy?Policy:A?Gradual?Transition[J].Energy?Policy,2017,106:376-381.

[33]Blei?D?M,Ng?A?Y,Jordan?M?I,et?al.Latent?Dirichlet?Allocation[J].Journal?of?Machine?Learning?Research,2003,(3):993-1022.

[34]Mann?G?S,Mimno?D,McCallum?A.Bibliometric?Impact?Measures?Leveraging?Topic?Analysis[C]//Proceedings?of?the?6th?ACM/IEEE-CS?Joint?Conference?on?Digital?libraries(JCDL06).IEEE,2006:65-74.

[35]王靜,王海龍,丁堃,等.新能源汽車產(chǎn)業(yè)政策工具與產(chǎn)業(yè)創(chuàng)新需求要素關聯(lián)分析[J].科學學與科學技術管理,2018,39(5):28-38.

[36]高峰,郭海軒.科技創(chuàng)新政策滯后概念模型研究[J].科技進步與對策,2014,31(10):101-105.

(責任編輯:馬?卓)

猜你喜歡
新能源論文政策
政策
政策
助企政策
政策
買不買新能源汽車
下期論文摘要預登
下期論文摘要預登
下期論文摘要預登
“新能源門”的背后
順應新能源發(fā)展趨勢
卫辉市| 青阳县| 石门县| 南漳县| 青浦区| 玉门市| 闽清县| 阳朔县| 鸡泽县| 万州区| 大兴区| 修水县| 郁南县| 清苑县| 瑞昌市| 阳信县| 英德市| 大英县| 江油市| 麻城市| 高安市| 盐源县| 福贡县| 上蔡县| 辽中县| 吉木乃县| 南木林县| 云梦县| 喀喇沁旗| 兴仁县| 平阳县| 炉霍县| 哈尔滨市| 宕昌县| 淮阳县| 贡觉县| 托克托县| 安义县| 南昌县| 曲阳县| 桃园县|