国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

跨境電商進口商品與中國國際進口博覽會展品的對比分析

2019-09-24 08:08:54趙民鋼周俊妍薛文良魏孟媛錢競芳郭建峰
中國纖檢 2019年8期
關(guān)鍵詞:品名展品博會

文/趙民鋼 周俊妍 薛文良 魏孟媛 錢競芳 郭建峰

中國國際進口博覽會(以下簡稱進博會)是由商務(wù)部、上海市人民政府聯(lián)合主辦的,旨在推動經(jīng)濟全球化、貿(mào)易自由化發(fā)展的世界首個以進口為主題的國家級大型展會。2018年,進博會累計吸引了172個國家、地區(qū)以及國際組織參展,3600多家企業(yè)匯聚,其中,“一帶一路”沿線國家共58個,涉及1000多家企業(yè),幾乎占所有參展國家的三分之一,這也表明進博會在“一帶一路”建設(shè)過程中的重要地位,必將為“一帶一路”相關(guān)國家對華出口提供新的機遇[1-3]。

作為世界首屆進口博覽會,進博會沒有現(xiàn)成的監(jiān)管模式可以借鑒,檢驗檢疫工作也面臨著巨大的挑戰(zhàn),主要問題包括:其一進博會參展對象以“一帶一路”國家為代表,進口展品種類繁多,包括農(nóng)產(chǎn)品、食品、日用消費品、服裝服飾等多個門類,所涉及的通關(guān)流程復(fù)雜,疫情疫病風險高;其二主辦方提出“6天會展+365天銷售”的運作模式,線上線下結(jié)合銷售,監(jiān)管時間長,要求高。總體來說,進博會的監(jiān)管工作時間緊張、任務(wù)繁重、模式復(fù)雜,這些都推動著檢驗檢疫部門加快監(jiān)管創(chuàng)新,在保證質(zhì)量的情況下,讓商品快速通關(guān)進口,并在接下來一年的銷售期內(nèi)對質(zhì)量安全實現(xiàn)長期的動態(tài)監(jiān)控。

跨境電子商務(wù)有著批次多、批量小、品類繁多、交易頻繁等特點,這與進博會的商品特點大同小異[4];此外,展品在展覽結(jié)束后,經(jīng)批準,允許在常年展示館保稅展示交易。這也與跨境電商的保稅監(jiān)管模式異曲同工[5]。因此,相關(guān)部門提出是否可以借鑒跨境電商保稅倉的監(jiān)管模式,以實現(xiàn)對進博會商品的長期監(jiān)管。為了驗證這種思路的可行性,本文提出利用跨境電商的商品數(shù)據(jù)庫以及跨境電商進口正面清單與進博會主要商品類型進行匹配,若匹配程度在合理范圍內(nèi),則說明兩者商品具有一定的相似度,其模式的相互借鑒有一定現(xiàn)實意義。

1 研究框架

本文的主體研究框架如圖1所示,主要分為三個階段,首先建立跨境電商全平臺產(chǎn)品數(shù)據(jù)庫;其次整理進博會展品數(shù)據(jù),與跨境電商產(chǎn)品數(shù)據(jù)庫進行匹配;最后對匹配結(jié)果進行分析。

目前,跨境電商進口網(wǎng)站繁雜多樣,從進口商品來看,可以分為綜合型、垂直型;從物流模式來看,可以分為保稅倉、海外直郵。基于進博會展銷并舉、保稅交易、商品種類廣的特點,本文僅選取以保稅倉模式為主的綜合型電商為研究對象。此外,本文擬通過機器采集的方式采集主流跨境電商平臺商品數(shù)據(jù),建立跨境電商全平臺產(chǎn)品數(shù)據(jù)庫,以方便機器匹配的快速掃描。

在匹配方法的選擇上,由于數(shù)據(jù)庫的建立需要一定時間,而跨境電商網(wǎng)站商品更新又較為頻繁,因此本文將采取機器加人工的方法完成匹配。第一步:機器快速掃描商品庫,完成初步匹配;第二步:人工檢索主流跨境電商平臺,對第一步匹配失敗的商品二次檢索,查漏補缺。這種方式既實現(xiàn)了快速匹配的要求又盡可能提高了匹配精度。

2 研究方法

2.1 搭建跨境電商平臺商品數(shù)據(jù)庫

本文主要利用python編程實現(xiàn)網(wǎng)頁商品信息的自動采集,采集流程包括選定采集網(wǎng)站、制定網(wǎng)址采集規(guī)則、制定內(nèi)容采集規(guī)則以及數(shù)據(jù)的采集與保存[6]。

2.1.1 數(shù)據(jù)采集流程

1)選定采集網(wǎng)站。據(jù)中國電子商務(wù)研究中心(100EC.CN)監(jiān)測顯示,按整體交易額計算,近兩年的主流跨境進口電商平臺中網(wǎng)易考拉、京東全球購、唯品國際以及天貓國際均處于市場份額前列,累計份額占比保持在60%以上?;诩夹g(shù)以及時間的原因,本文僅以前三個平臺作為樣本進行采集,即網(wǎng)易考拉、京東全球購以及唯品國際。

2)制定網(wǎng)址采集規(guī)則。網(wǎng)址采集規(guī)則是指根據(jù)要采集內(nèi)容網(wǎng)頁在網(wǎng)站結(jié)構(gòu)中所處位置制定相應(yīng)的規(guī)則來采集網(wǎng)址?;诳缇尺M口電商平臺主頁基本結(jié)構(gòu)的相似性,網(wǎng)址采集規(guī)則可歸納如下:首先確定網(wǎng)址主頁;然后采集該主頁顯示的所有商品類目鏈接(如潔面、卸妝等類目特征詞對應(yīng)的類目鏈接)形成商品類目鏈接庫;最后遍歷訪問類目鏈接庫,采集每一個類目下所有的商品鏈接,形成商品主頁鏈接庫。

3)制定內(nèi)容采集規(guī)則。內(nèi)容采集是指通過制定一系列規(guī)則,分析、提取網(wǎng)頁HTML編碼中的元素。同一網(wǎng)站的子網(wǎng)頁源碼結(jié)構(gòu)基本一致,因此只需對一個商品主頁源碼結(jié)構(gòu)進行分析并制定采集規(guī)則即可。本次內(nèi)容采集的字段包括商品標題、原產(chǎn)國、發(fā)貨倉庫、價格、商品詳情等,內(nèi)容采集規(guī)則的核心是根據(jù)不同元素類型提取元素。針對靜態(tài)字段,本文直接利用相關(guān)模塊解析網(wǎng)頁源碼,定位元素、提取元素即可;而針對動態(tài)字段,則需要利用網(wǎng)頁控制臺進一步獲取該元素的動態(tài)加載鏈接,然后訪問該鏈接,解析轉(zhuǎn)換成python類型數(shù)據(jù),直接提取。

4)數(shù)據(jù)的采集輸出與保存。遍歷商品主頁鏈接庫,利用已制定的內(nèi)容采集規(guī)則,采集數(shù)據(jù)。數(shù)據(jù)輸出直接導(dǎo)入MongoDB數(shù)據(jù)庫,方便可視化查詢以及后續(xù)生成csv文件與展品進行自動化對比分析。

2.1.2 數(shù)據(jù)采集結(jié)果

最終共采集商品數(shù)據(jù)782473條,經(jīng)篩選后存有數(shù)據(jù)454075條,涉及商品十余類,包括汽車用品、消費電子及家電、服裝及日用消費品、醫(yī)療保健品、食品等。其中篩選原則主要包括以下三條:去除重復(fù)數(shù)據(jù)、缺失數(shù)據(jù)、海外直郵商品(包括港澳臺)。三個平臺各自的數(shù)據(jù)情況如表1所示。

2.2 商品信息匹配

商品信息匹配的對象有三類,分別是跨境電商進口平臺商品、跨境電商正面清單以及進博會主要展品。三類對象的數(shù)據(jù)基本情況如表2所示。其中,進博會的展品數(shù)據(jù)來源主要包括物流服務(wù)提供商、進出口公司以及進博會主辦方,初始共計1443條。經(jīng)過簡單的數(shù)據(jù)清洗后,按展品品名分類,展品信息共計515條。

表1 各平臺商品及原產(chǎn)國數(shù)量分布

表2 待匹配對象的數(shù)據(jù)基本情況

2.2.1 自動匹配模型

目前,常用的商品匹配算法有WHIRL算法、TMWM算法、SSM算法等[7-8]。這類算法以商品標題、價格、屬性表等基本參數(shù)作為匹配對象,對商品信息進行建模,計算編輯距離、余弦相似度,或是分詞后利用tf-idf加權(quán),計算Jaccord相似度等[9-10],其本質(zhì)多是將文本信息向量化后,按照某種算法計算距離從而得出相似度。

本文需要匹配的字段包括品名、來源國,并且進博會展品品名以二到五字的短語為主,冗雜信息很少。因此,本文擬利用python簡單實現(xiàn)自動匹配效果,具體算法步驟如下:

1)讀取跨境電商全平臺商品數(shù)據(jù)庫,分詞,返回分詞列表;

2)基于分詞列表建立詞典,獲得特征數(shù),即詞典中詞的個數(shù);

3)基于詞典建立語料庫 ;

4)使用TF-IDF模型處理語料庫,并建立索引 ;

5)遍歷展品品名列表,用步驟2所建詞典將品名轉(zhuǎn)換成稀疏向量,計算相似度 ;

6) 當相似度大于0,并且來源國相同,則判斷兩件商品匹配成功,否則另外輸出等待人工二次檢索[11-12]。

經(jīng)過查詢數(shù)據(jù)庫中完全匹配的展品合計112件,其中經(jīng)過機器的快速掃描實現(xiàn)完全匹配的展品共63件,占比達56.25%,這大大提高了匹配的效率,為人工匹配節(jié)約了時間。

2.2.2 人工二次匹配

跨境電商進口商品數(shù)據(jù)庫中僅包含三大跨境電商平臺,為了保證匹配結(jié)果的完整性,人工檢索的電商平臺在以上三大平臺的基礎(chǔ)上,加上了天貓國際。人工匹配以自動匹配失敗的集合為出發(fā)點,在平臺上逐條搜索相應(yīng)的品名以及原產(chǎn)國,定義匹配結(jié)果。

3 對比分析

3.1 進博會展品與跨境電商商品的對比分析

匹配的對象是進博會主要展品與跨境電商進口平臺商品,基于表2的數(shù)據(jù)情況,匹配字段僅包括商品品名、原產(chǎn)國。匹配結(jié)果如圖2所示,共分為5類:分別是完全匹配、無對象、原產(chǎn)國不匹配、原產(chǎn)國部分匹配、直郵。

其中,完全匹配指展品標題與展品來源國與電商商品完全一致;無對象指跨境電商平臺沒有商品與展品品名相同;原產(chǎn)國不匹配指跨境電商平臺有此類商品,但商品來源國與展品來源國完全不匹配;原產(chǎn)國部分匹配即跨境電商平臺有此類商品,但商品來源國與展品來源國部分不匹配;直郵即跨境電商平臺有此類商品,但入境方式為直郵。

從匹配數(shù)量來看,基本匹配占比39.23%,其中完全匹配占比28.74%,原產(chǎn)國部分匹配占比10.49%。值得注意的是僅有35.15%的展品無法在跨境電商平臺上檢索到同類商品,這就說明64.85%的展品是有監(jiān)管案例可以借鑒的。在64.85%中,44.3%是完全匹配的,即品名與原產(chǎn)國完全一致,因此其匹配程度還是比較樂觀的。

從匹配類目來看,如圖3 所示,無對象類商品集中在工業(yè)用品、模型、展臺用品、電子設(shè)備等工業(yè)類范疇,此外還有水果生鮮、農(nóng)產(chǎn)品等可食用不宜保存的食品類。

匹配類商品以食品茶水、個人護衛(wèi)品、紡織品、家居日用品為主,這也符合人們對日常生活中跨境采購消耗量較大商品類目的認知。原產(chǎn)國不匹配類以酒水生鮮農(nóng)產(chǎn)品等食品、家居日用品為主,這與“一帶一路”國家展品類型多以家居、農(nóng)副產(chǎn)品、食品為主有關(guān),這類國家大多并未與我國建立穩(wěn)定的國際貿(mào)易關(guān)系。

總體來看,博覽會展品與本文選取的三個跨境進口電商的商品匹配度比較良好。僅有35.15%是完全無案例可查,此類商品以高科技電子設(shè)備、工業(yè)設(shè)備模型以及生鮮谷物等農(nóng)畜特產(chǎn)為主,檢驗檢疫部門可以對此類商品重點關(guān)注。

3.2 進博會展品與正面清單對比分析

在3.1的比對中,本文說明了進博會部分展品與跨境電商平臺現(xiàn)有流通商品的匹配關(guān)系,為了進一步說明跨境電商所有允許保稅進口的商品與進博會展品的關(guān)系,本文提出將進博會主要展品與跨境電商正面清單進行詳細對比分析?;诒?的數(shù)據(jù)情況,這兩者的匹配字段僅包括商品品名。

匹配結(jié)果如圖4所示,共分為兩類:匹配、無對象。其中,匹配占比達62.14%,無對象占比達37.86%。

從匹配數(shù)量上來看,該匹配率略低于跨境電商平臺。這是由于正面清單的部分商品描述較為學術(shù),導(dǎo)致某些展品盡管本質(zhì)上與清單商品相一致,但很難直接檢索到或者清單商品所指的范圍很難界定。

從匹配類目上來看,如圖4所示,展品在食品酒水、工業(yè)用品、電子設(shè)備、醫(yī)療保健上所匹配的商品較少,尤其是后三個類目。這說明政府在工業(yè)模具、高科技產(chǎn)品以及醫(yī)藥保健方面的跨境電商進口管控較為嚴格或是相關(guān)的監(jiān)管經(jīng)驗欠缺。

4 結(jié)論

本文在建立跨境電商全平臺產(chǎn)品數(shù)據(jù)庫的基礎(chǔ)上,通過自動匹配加人工匹配的方式,完成了進博會部分展品與跨境電商平臺商品和正面清單的比對工作,得出如下結(jié)論:如文中所述兩者商品重合率均達60%以上,因此相關(guān)部門有理由借鑒跨境電商保稅進口模式監(jiān)管進博會展品。需要注意的是,兩者的差異集中體現(xiàn)在生鮮、農(nóng)副產(chǎn)品這些食品類商品,以及工業(yè)模具、電子設(shè)備這類制造業(yè)商品上,因此,針對這類商品,相關(guān)部門有必要區(qū)分看待。

猜你喜歡
品名展品博會
展品選刊
聚焦“絲博會”
金橋(2022年9期)2022-09-20 05:51:14
第九屆“博博會”將在鄭州舉辦
客家文博(2022年1期)2022-08-22 06:31:04
展品被盜了
閱讀之美 攝于第29屆書博會
當代陜西(2019年15期)2019-09-02 01:51:56
直企首探進博會
東莞市果菜副食交易市場水果行情
CIM T2017部分展商主要展品預(yù)覽(一)
我愛冬天
CCMT2016展品預(yù)覽(1)
安宁市| 嘉祥县| 宜兰县| 承德市| 平南县| 招远市| 竹北市| 双鸭山市| 格尔木市| 五大连池市| 吴忠市| 斗六市| 廊坊市| 双辽市| 上高县| 安义县| 江都市| 崇明县| 唐海县| 阿拉善盟| 高清| 江油市| 四川省| 蓬莱市| 霸州市| 嘉黎县| 开平市| 大庆市| 石河子市| 自贡市| 滨海县| 钟山县| 沧源| 巴彦淖尔市| 察隅县| 阜新| 斗六市| 蒲城县| 银川市| 和政县| 白朗县|