●賈彥龍,譚宗穎(中國科學院 國家科學圖書館,北京 100190)
共鏈接作為網絡挖掘的信息源正在被逐漸的重視和利用。很多研究將共鏈接的分析應用于學術空間,然而有學者發(fā)現(xiàn)其在競爭情報研究中也同樣可以發(fā)揮作用。本文希望在前人研究的基礎上,對于在傳統(tǒng)行業(yè)中應用共鏈方法識別競爭對手的適用性作進一步的論證。
互聯(lián)網的應用能夠為企業(yè)提供有效的競爭情報信息。[1]傳統(tǒng)的互聯(lián)網應用技術大多是基于文檔內容的,與經典的信息檢索技術和數據庫技術有著密切的聯(lián)系。但是,互聯(lián)網中特有的許多問題,諸如超大規(guī)模的非結構化文檔數量、良莠不齊的網頁質量、包含在文檔中的大量多媒體信息,甚至相當含糊或不規(guī)范的用戶查詢表示等,都使得經典的信息檢索技術和數據庫技術在互聯(lián)網環(huán)境中很難有效地應用。
然而,互聯(lián)網又包含了傳統(tǒng)數據環(huán)境所沒有的另一種豐富信息--超鏈接。創(chuàng)建和利用超鏈接不是一個無關的現(xiàn)象,而是暗示一種重要的社會反響。[2]他們可以被看作是對目標網頁的認可,尤其是創(chuàng)建者已經設置的那些指向有用的或者相關資源的鏈接。所以,網頁間的超鏈接一方面引導網頁瀏覽的過程,另一方面也反映了網頁創(chuàng)建者的一種判斷。因此,充分利用互聯(lián)網的鏈接結構信息對互聯(lián)網應用技術進行研究具有極為重要的意義。
目前來講,利用因特網去獲取商業(yè)信息的研究還主要集中在網絡內容挖掘,而網絡鏈接還沒有被充分地運用于這一目的。網絡計量學作為一個新興學科,可以用于挖掘鏈接(這些鏈接將網絡上的不同文檔連接在一起)中包含的信息,進而運用文獻計量技術定量地分析網絡。目前這一領域研究集中在高校和學術網絡空間,[3-5]然而,這一技術同樣也可應用于主要的商業(yè)站點。WU等人提出指向商業(yè)網站的鏈接包含著有用的商業(yè)信息。[6]Vaughan證實鏈接到一個企業(yè)網站的鏈接數量和一個企業(yè)的經營業(yè)績相關,這種業(yè)績可以用總收入和利潤來衡量。[7]Kipp等人定性考察了鏈接到商業(yè)網站的目的,不但定量地證實了以上的研究結果,還指出大多數商業(yè)網站的鏈接由商業(yè)目的產生。[8]可見,將網絡鏈接應用到企業(yè)的情報分析中,可以得到有價值的信息。
共鏈接作為一種網絡鏈接形式正在逐漸被人們認識,Vaughan對企業(yè)之間的鏈接動機進行了深入的分析,他發(fā)現(xiàn)所調查企業(yè)網站都不與其競爭對手的網站相鏈接,但是它們都有可能被第三方鏈入。也就是說,直接的鏈接關系并不能為企業(yè)競爭情報提供有用的信息,但是利用兩個企業(yè)網站的共鏈頻次卻可以對這兩個企業(yè)的相似性進行度量,而相似的企業(yè)之間必然會存在某種競爭關系,從而就假定可以通過共鏈的分析方法來判斷企業(yè)之間的競爭關系。Vaughan利用上述假設,用共鏈方法研究了電子行業(yè)(高科技企業(yè))中企業(yè)間的競爭關系,同時,作者也指出此方法應該在其他行業(yè)中廣泛試用,以便觀察其普適性。[9]本文希望能夠利用共鏈方法對傳統(tǒng)行業(yè)中的飲料制造業(yè)企業(yè)間的競爭關系進行研究,以對企業(yè)間的競爭對手有進一步認識。本研究按照以下標準選取了31家飲料制造業(yè)企業(yè)作為研究對象(見附錄):在國內飲料制造業(yè)中營業(yè)收入排在前面的企業(yè)(數據來源于中國產業(yè)信息網和上證交易所)。企業(yè)取自于飲料制造業(yè)中不同的領域,比如含酒精類飲料制造企業(yè)、純酒精制造企業(yè)以及軟飲料制造企業(yè)(國家統(tǒng)計局分類標準)。
●入鏈與出鏈:在網絡鏈接中有入鏈與出鏈之分,入鏈即是所有指向所要研究的網站的鏈接,出鏈則是所有同一個要研究的網頁中指向其他網頁的鏈接。[10,11]
●共鏈接(共鏈):分為共入鏈和共出鏈。所謂共入鏈即是如果網頁C與網頁D中都被B所鏈接(即B中同時存C、D的反向鏈接),則可稱C、D存在共入鏈。共出鏈即是網頁D中同時存在來自網頁B和網頁E中的鏈接,則稱B、E存在共出鏈。圖1顯示了網絡節(jié)點間不同的鏈接類型。[12]
圖1 網絡中不同的鏈接類型
表1說明了圖1中不同的鏈接類型。本文主要涉及入鏈和共入鏈,像很多關于鏈接的文章中提到的那樣,本文中對共入鏈與共鏈當做同義詞而未作區(qū)分,以下的共入鏈均由共鏈代替。
表1 鏈接類型定義
通過搜索引擎的選取,檢索研究對象的入鏈和共鏈數據,利用多維尺度分析法將標準化的多維數據投射為二維散點圖作進一步分析。
3.1.1 選取搜索引擎
商業(yè)搜索引擎并不是為了學術目的而建立的,結果也并不如我們需求的那樣全面。[13]爬行的算法屬于商業(yè)秘密,對檢索信息排序的準確標準也不為我們所知曉,檢索結果還會隨時間發(fā)生波動。盡管如此,商業(yè)搜索引擎對于某些網絡計量而言仍是唯一的和最好的信息來源。[14]本文對搜索引擎進行了較為廣泛的調研,并重點對搜索引擎Google、百度和Yahoo進行了比較,以選擇最適合本研究的搜索引擎。
本研究需要對網站內部自身鏈接進行剔除后才能得到準確的外部入鏈的數,這樣的結果才更準確,[15]而Google不能很好地對外部入鏈進行區(qū)分,百度相對于鏈接的檢索還有待加強。本文重點針對會涉及到的link以及domain兩個關鍵字,對Google、百度和Yahoo這三大搜索引擎的鏈接檢索特點進行了對比,其結果見表2。從比較結果中筆者發(fā)現(xiàn),Yahoo很適合運用于本研究。
3.1.2 檢索研究對象的外部入鏈和共鏈數
本研究需要得到外部入鏈和共鏈的數據,所以需要對所研究的每個企業(yè)的網頁外部入鏈數和每一對企業(yè)的共鏈數進行檢索。具體的檢索式在表3中顯示。注意:本文的檢索式中site關鍵字后面只用到了域名的一部分,這樣可以更好地排除企業(yè)內部自身的入鏈,從而更準確地得到相應站點外部入鏈數,[16,17]因為企業(yè)可能會使用一些與其網站相關的網址,例如:mail.companyX.com,而不是企業(yè)唯一的網址(www.companyX.com)。
表2 搜索引擎的比較
表3 共鏈、外部入鏈的檢索式
(1)數據獲取。為了避免數據的波動,在同一天(2010年3月17日)進行了全部數據的采集,檢索了飲料制造業(yè)的31家企業(yè)的外部入鏈以及共鏈數。
(2)數據標準化處理。單純的共鏈數并不能準確反映出企業(yè)之間的相似程度,比如兩企業(yè)的外部入鏈數都是10,那么其共鏈數是5就可以表示出他們具有很強的相似性,而如果兩企業(yè)的入鏈數都是100,那么即使他們共鏈數是10,相比之下也不能說明企業(yè)之間有很強的相似性。因此,本文用Small提出的Jaceard系數來標準化所得到的共鏈數。[18]
其中Rij為共鏈數的杰卡德標準化值,用來表示企業(yè)i與企業(yè)j之間的相似強度;Cij表示企業(yè)i與企業(yè)j之間的共鏈數;Ni,Nj表示企業(yè)i,j各自的外部入鏈數(即是企業(yè)i,j的反向鏈接數)。經過這樣的處理后,Rij可以比Cij更好地表示出企業(yè)間的相似強度。
通過對附錄1中的31家飲料制造企業(yè)間共鏈數據進行檢索和標準化,即可利用多維尺度分析法對所得到的標準化共鏈矩陣進行分析。SPSS的多維尺度分析中存在Multidimensional Scaling(ALSCAL) 和Multidimensional Scaling(PROXSCAL) 兩種分析過程。其中PROXSCAL可以看成是ALSCAL過程的擴展:
(1)ALSCAL提供了比較經典的5個模型,PROXSCAL使用了 Theory Scaling System Group(DTSS) 的最優(yōu)化數據轉換方法,提供了4個更高級的模型。
(2)ALSCAL對不相似數據進行分析,數值越大表示越不相似。而PROXSCAL既可以分析相似數據,也可以分析不相似數據。
(3) PROXSCAL過程提供了更加豐富的模型診斷、設置和輸出。[19]
基于本文共鏈數據表示企業(yè)間相似程度的特性和PROXSCAL自身的優(yōu)點,本文選用Multidimensional Scaling(PROXSCAL) 進行分析。將31家企業(yè)的標準化共鏈數據導入SPSS[20]并運行PROXSCAL,得到如圖2所示的二維散點圖。其中模型擬合優(yōu)度的情況顯示Stress值為0.15554,相應的DAF指標為0.84446,因此模型的擬合效果比較令人滿意。[21]
圖2 31家飲料制造企業(yè)共鏈分析結果的二維散點圖
圖2顯示了根據企業(yè)之間的共鏈數據,利用MDS分析所得到的31家飲料制造企業(yè)在圖形中的相對位置。通過數據點之間的遠近程度,可以判斷企業(yè)間的相似程度,進而判斷企業(yè)間的主要競爭對手。可以看到飲料制造業(yè)的這些企業(yè)被清晰地聚類到各自不同的品類之中,展示了企業(yè)各自主要的競爭對手。
圖2中的左下部分主要是白酒制造企業(yè),可以發(fā)現(xiàn),白酒行業(yè)中茅臺和五糧液比較接近,它們也正是白酒行業(yè)的領軍企業(yè)。2009年五糧液公司實現(xiàn)銷售額110.65億元(人民幣),茅臺2009年實現(xiàn)營收96.70億元,在行業(yè)中占絕對霸主的地位的同時也存在著強競爭關系。其他的白酒企業(yè)與它們的距離偏遠,分布較為分散,如圖所示稻花香、杏花村、勁牌、瀘州老窖,其營業(yè)收入都在20-40億元之間,形成了白酒行業(yè)中的第二梯隊。注意到圖2中杏花村集團既和同等級的白酒企業(yè)比較接近,又和同樣是保健酒企業(yè)--勁牌比較接近,這反映出杏花村集團在“十五”期間傾力打造白酒基地和保健酒基地的戰(zhàn)略意圖,杏花村集團也成為了同等級白酒與保健酒企業(yè)的有力競爭者。而像古井貢酒、水井坊和枝江則形成了白酒業(yè)中營業(yè)收入在10-20億之間的第三梯隊中的主要競爭者。劍南春作為一個2009年營業(yè)額在28億元的企業(yè)似乎其位置有些異常,顯得與軟飲料的維維企業(yè)距離很近,究其原因,可能是與2009年維維企業(yè)傳出入股劍南春傳聞有關,造成這兩家企業(yè)被更多的企業(yè)同時關注,其共鏈的數據變得更多。最終,維維入主枝江酒業(yè),獲得其51%的股份。從3年前維維股份以8000萬元收購了雙溝酒業(yè)38.27%的股份開始涉足白酒行業(yè)到如今收購枝江酒業(yè)的成功,可以說,維維也在白酒行業(yè)占有一席之地。在圖2中,傳統(tǒng)認為的維維豆奶制造企業(yè)卻和白酒類企業(yè)距離更近,需引起飲料制造業(yè)同行的注意,將其視為白酒企業(yè)中的競爭對手或潛在的競爭對手是有據可循的。
青島啤酒和燕京啤酒位于圖2的右上角,而其余啤酒企業(yè)分布在圖2的左下方位置。這正好印證了青島啤酒和燕京啤酒是行業(yè)內普遍被看好的兩家龍頭企業(yè),屬于全國性品牌,在全國范圍內展開競爭。而像華潤、哈爾濱、珠江啤酒充其量也都是地方性品牌,只能在其相應的地域中充當主要競爭者。
圖2最上面的3家企業(yè)張裕、王朝和長城聚在一起,它們的市場份額占據了葡萄酒市場的半壁江山,[22]印證了它們是葡萄酒市場的傳統(tǒng)三強。
南陽天冠是主要以食用酒精生產為主的企業(yè),與圖2中其他企業(yè)不存在明顯的競爭關系,在圖2中表現(xiàn)為孤立的散點。
圖2同樣較好地展示了軟飲料制造企業(yè)之間的主要競爭對手。杭州娃哈哈集團公司與廣東樂百氏集團公司位于圖2的最右側,它們都是在上個世紀90年代高速成長而享有盛譽的國內大型名牌企業(yè)。它們市場競爭的領域都集中在兩條路線上,即從1992年開始的乳酸奶市場(從單純的生產兒童類飲料產品擴大到成人市場),到1996年又擴大到瓶裝水市場。紅牛和健力寶在圖2中的右下角,這兩家企業(yè)則在功能型飲料中展開激烈的角逐。[23]同樣,我們還可以發(fā)現(xiàn)在中間偏上部分的銀鷺和安德利則主要在果汁飲料行業(yè)中有明顯的競爭。比較有爭議的就是可口可樂和百事可樂這兩家企業(yè)在圖2中的距離比較遠,且可口可樂距離其他不含汽的軟飲料都比較接近,而百事距離他們就相對遠了很多。這可以從兩家企業(yè)存在戰(zhàn)略分化的跡象上加以解釋??煽诳蓸吩谌A投資了全球最大的、設備最先進的不含氣飲料的生產基地,輻射全國發(fā)展奶飲料和果汁飲料等不含汽飲料,企圖全面進軍不含汽飲料市場,而百事可樂則繼續(xù)在含汽飲料市場擴張,可見共鏈的方法對于競爭對手之間戰(zhàn)略意圖的變化也有一定的揭示作用。
通過以上的分析,我們發(fā)現(xiàn)利用共鏈分析方法得到的多維尺度圖像基本上反映了這31家飲料制造企業(yè)間的競爭關系,其中存在的異常點也可以從實際情況得到較好的解釋。
在選取適合的搜索引擎的基礎上,本文通過共鏈分析方法,利用PROXSCAL對31家飲料制造業(yè)企業(yè)進行聚類,用二維散點圖標示了各企業(yè)所處的位置,進一步實證了共鏈方法可以應用到傳統(tǒng)行業(yè)中企業(yè)間競爭對手的識別。[12]但該方法存在局限性,比如,在共鏈方法運用中,共鏈的計數并未因網頁的不同而有所區(qū)別,但實際上,不同網站的重要程度是有差別的,是否可以通過有權重的共鏈計數達到更趨于合理的共鏈方法,例如可以利用Google所提供的網頁的PR值標示網頁權重,再與共鏈方法相結合,可能會達到更合理的效果,希望在以后的研究中進一步探索。
附錄31家飲料制造企業(yè)列表
[1] Porter ME.CompetitiveStrategy:Techniquesfor Analyz ingIndustriesand Competitors[M].FreePress(New York),1980:147.
[2] Turow J,Tsui L.The Hyperlinked Society:Questioning Connections in the Digital Age[M].The University of Michigan Press,2008:43.
[3] Thelwalll M,Wilkinson D.Finding similar academic web sites with links,bibliometric couplings and colinks[J].Information Processing and Management,2004,40(3):515-526.
[4] Bjorneborn L.Small-world link structures across an aca demic web space[D/OL].[2010-04-20].http∶//www.db.dk/lb/phd/phd-thesis.pdf.
[5] Eckmann J-P,Moses E.Curvatureof co-linksuncovers hidden thematic layers in the World Wide Web [J].PNAS,2002,99(9):5825-5829.
[6] Vaughan L,WUG.Links tocommercial web sites as a source of business information [J].Scientometrics,2004,60(3):487-496.
[7] Vaughan L.Web hyperlinks reflect business performance:a study of U.S.and chinese ITcompanies[J].Canadian Journal of Information and Library Science,2004,28(1):17-31.
[8] Vaughan L,etc.Whyare hyperlinks tobusiness websites created?A content analysis[J].Scientometrics,2006,67(2):291-300.
[9] Vaughan L,You J.Miningweb hyperlink data for business information∶the case of telecommunications equipment companies[C]//Proceedingsof the First IEEE International Conference on Signal-Image Technology and Internet-Based Systems.Cameroon:[s.n.],2005:190-195.
[10] Ingwersen P.The calculation of webimpactfactors[J].Journal of Documentation,1998,54(2):236-243.
[11] Thelwall M.Conceptualizing documentation on the web∶Anevaluationof differentheuristicbased modelsfor counting links between university web sites[J].Journal of the American Society for Information Science and Technology,2002,53(12):995-1005.
[12] Bjorneborn L,Ingwersen P.Toward a basic framework for webometrics[J].Journal of the American Society for Information Science and Technology,2004,55(14):1216-1227.
[13] Bar-Ilan J.The use of web search engines in informationscienceresearch[J].Annual Reviewof Information Scienceand Technology,2003:231-288.
[14] Thelwall M,etc.Webometrics[J].Annual Review of Information Science and Technology, 2005, 39:81-135.
[15] Ingwersen P.The calculation of web impact factors[J].Journal of Documentation,1998(54):236-243.
[16] Smith A,Thelwall M.Webimpactfactorsfor Australasian universities[J].Scientometrics,2002,54(3):363-380.
[17] Thelwall M.Extracting macroscopic information from weblinks[J].Journalof the American Societyfor Infor mation Science and Technology,2001,52(13):1157-1168.
[18] Small H.Co-citation in the scientific literature:A new mea-sure of the relationship between two socuments[J].Journal of the American Society for Information Science,1973,24(4):269.
[19]張文彤.SPSS統(tǒng)計分析教程 高級篇[M].北京:希望電子出版社,2008.
[20] Meulman J,Heiser W.SPSS Categories 11.0[M].Chicago:SPSSInc,2001.
[21] Mena J.Web Miningfor Profit∶E-Business Optimization[M].Boston:Digitalpress,2001.
[22]張婭琳.長城葡萄酒競爭營銷策略研究[D].北京:對外經濟貿易大學,2005.
[23]鮑捷.脈動品牌策略分析[D].成都:西南交通大學,2005.