国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

搜索引擎的動力引擎

2009-12-09 05:54:22
中國計算機報 2009年44期
關鍵詞:搜狗搜狐搜索引擎

朱 杰

互聯網行業(yè)競爭激烈,能否得到更多用戶的認可是企業(yè)生存的根本,而認可的關鍵就在于服務是否及時、優(yōu)質、準確。搜狗是搜狐于2005年推出的全球首個第三代互動式中文搜索引擎,在搜狐的整體發(fā)展戰(zhàn)略中占據十分重要的地位。搜狗的產品線包括了網頁應用和桌面應用兩大部分。如何在強手如林的搜索引擎市場占據有利地形,是一個必須回答的重要“命題”。

海量數據檢索帶來的挑戰(zhàn)

搜索引擎的最大難題是正確理解和滿足用戶的需求,而這一切,都必須基于一個強大的數據中心來完成。提升數據中心的效能,是提升用戶滿意度的關鍵要素?;谶@種考慮,搜狐特別啟動了搜狗新一代數據中心項目的建設,希望通過技術創(chuàng)新,提升搜狗的服務品質,從而贏得用戶的青睞。

“搜狐追求新技術應用是有傳統的,搜狗引擎就是搜狐在搜索技術領域追求創(chuàng)新的一個結果。我們希望能利用各種領先的技術與設備,讓我們的產品與服務為用戶帶來更好的感受。尤其對于搜狗數據中心,我們更希望規(guī)避傳統數據中心的‘短板,進一步提升數據中心網絡的性能、效率與可靠性,讓用戶訪問起來感覺更加良好?!彼押W絡運維部某負責人解釋了采用新一代數據中心解決方案的初衷。

此外,搜狐在數據中心網絡建設上不斷“求新”是形勢使然,從2007年搜狐正式推出搜狗網頁搜索3.0版本之后,搜狗搜索引擎的中文網頁收錄量已超過100億,每天的網頁更新量則有5億之多,激增的海量數據對搜狗數據中心帶來了前所未有的壓力。新的搜狗業(yè)務應用要求數據中心網絡平臺能支撐百億海量網頁收錄、及時更新網頁和網頁評級體系,滿足高密度服務器集群的高性能并行抓取工作,同時網絡系統要具備后期靈活的擴展能力。面對超高的網絡流量與數量龐大的服務器集群,原有的搜狗數據中心網絡架構與設備性能已無法滿足這一要求,采用新一代數據中心架構來建設搜狗IDC新機房成為必然的選擇。

根據這一需求,2009年初,搜狐公司征集了業(yè)內多家廠商的設備,進行了全方位考察和比較。最終, H3C公司集S12508數據中心級核心交換機、S75E高端多業(yè)務路由交換機、S5800萬兆交換機、iMC智能管理中心等軟硬件設備為一體的統一交換架構數據中心解決方案獲得了該項目的全部份額,搜狗新一代數據中心網絡建設的大幕也由此拉開。

讓大流量不再是問題

據記者了解,在搜狗數據中心網絡體系中,部署了兩臺H3C S12500交換機作為整個網絡的核心,同時,兩臺

S75E高端多業(yè)務路由交換機承擔起數據傳輸網的重任,而數十臺S5800交換機則作為接入交換機,將2000多臺服務器連成了一個大的網絡。

據H3C網絡產品線副總裁孫德和介紹,S12500的設計瞄準的就是數據中心高密度、大流量和大緩存的特點,其單臺設備容量已達到5.76T,而且能支持多達576個萬兆端口,能夠充分滿足搜狗數據中心高密度萬兆應用的需求,這也是傳統的萬兆交換機很難做到的一點。

眾所周知,網頁搜索最重要的就是搜索速度與結果準確性,這也是搜狗引擎持續(xù)不斷優(yōu)化改進的目標,它依托的是系統在瞬間對海量網頁數據進行挖掘、分析、顯示的結果。在這一過程中,數據中心網絡承擔的帶寬壓力非常大。為了保證用戶能夠得到及時、準確的搜索結果,當搜狗引擎接收到一個網頁搜索請求時,往往會向高密度服務器群同時發(fā)起檢索需求,并在非常短的時間內接收幾百臺服務器幾乎同時發(fā)回的搜索結果,巨大的數據流量如果不能及時吸收,那么很容易出現網絡擁塞的現象。

而S12500的大緩存能力很好地解決了這個問題,不僅每個端口擁有256M的大緩存能力,更重要的是它支持分布式緩存機制,當搜索數據浪涌到來時,一部分報文被緩存在接入交換機S5800的8M緩存中,另一些則緩存在S12500的更大緩存中,有效地利用了各級設備的端口緩存能力,最大限度地吸收突發(fā)流量,這樣,就減少了丟包的可能性,盡可能地減少了對業(yè)務的影響。先期開展的實地測試結果表明,每次浪涌的收斂時間都控制在幾十毫秒之內。

搜狐網絡運維部負責人表示,通過建設新一代數據中心網絡,解決了搜索引擎業(yè)務普遍感到頭疼的浪涌問題,對普通用戶來說,意味著搜索結果中的死鏈接會更少。可以說,H3C S12500核心交換機起到了非常關鍵的作用。

創(chuàng)新架構帶來新價值

在搜狗數據中心的網絡架構中,數十臺作為接入交換機的S5800并非是簡單的并列關系,而是每四臺虛擬成一臺虛擬交換機,然后并列著接入核心交換機S125000。對此,該負責人解釋道,這里采用的是H3C推出的IRF2(第二代智能彈性架構,Intelligent Resilient Framework 2)技術,這也正是搜狐最終選擇H3C新一代數據中心解決方案來構建搜狗網絡的另一個重要因素。

智能彈性架構技術簡單的說,是把多臺物理設備互相連接起來,使其成為一臺統一的邏輯設備。也就是說,用戶可以將多臺設備真正當作一臺設備進行管理和使用,從而為用戶帶來簡化管理、簡化網絡業(yè)務、彈性擴展、1∶N可靠、性能加倍提升和增值業(yè)務擴展等多方面的網絡使用新體驗。目前,H3C的眾多網絡設備都支持這一技術。

在H3C提出的搜狗數據中心網絡解決方案中,這一創(chuàng)新技術也在多處得以體現。上面提到的S5800堆疊就是其中之一。在實際應用中,四臺S5800通過IRF2實現40G互聯,然后10組S5800堆疊接入雙機互備的S12500,也就是說,S12500只需要10個端口,就可實現40個萬兆互聯。這使得搜狗數據中心網絡具有了良好的可擴展性,日后網絡擴容時,可直接利用其他多余端口,而無須額外投資。

兩臺核心交換機S12500雙機互聯同樣采用了IRF2架構,它所帶來的價值同樣十分明顯。以往搜狗數據中心網絡采用的是傳統的環(huán)路設計,這樣有一半的網絡帶寬必須讓道給環(huán)路,帶寬利用率低,而且容易出現環(huán)路堵塞鏈路,在維護上也容易出現問題。采用IRF2技術則可以有效避免這些問題?,F在的搜狗數據中心網絡采用MSTP+VRRP+BFD的方式構建,去掉了令人煩惱的環(huán)路。這不僅意味著網絡運維更為簡單,不會出現環(huán)路故障,而且,也意味著整個網絡在不增加投資的情況下,可利用的帶寬相比以前增加了一倍。

在搜狐對IRF2性能實際測試中,搜狐數據中心網絡的穩(wěn)定性表現得十分突出,無論是S12500內部雙引擎的主備倒換,還是鏈路級的倒換,系統的恢復時間都小于30毫秒。也就是說,即使對網絡連續(xù)性要求高達50毫秒的延遲敏感型應用,網絡的穩(wěn)定性也不會對業(yè)務造成不良影響,也有利于搜狗業(yè)務的進一步發(fā)展。

“正是因為IRF2技術可以讓整個網絡的擴展性更好,而且ROI投資回報率更高,為搜狗業(yè)務的未來提供了堅實的基礎,所以我們對H3C提出的解決方案更為滿意?!痹撠撠熑吮硎?。

在數據中心應用領域,互聯網企業(yè)由于其業(yè)務特點,一直走在應用的前列,他們的選擇往往代表著市場的風向標。從實際效果來看,H3C新一代數據中心解決方案,不僅保障了搜狐現有業(yè)務的連續(xù)性,可滿足搜狐不斷增長的業(yè)務帶寬需求,同時面向未來可以承載更多不斷涌現的新業(yè)務。

猜你喜歡
搜狗搜狐搜索引擎
騰訊擬147億元全資收購搜狗
電腦報(2020年30期)2020-08-11 07:37:49
搜狐汽車
汽車與安全(2017年7期)2017-08-03 17:20:08
搜狐汽車
汽車與安全(2017年6期)2017-07-25 09:56:50
搜狐汽車
汽車與安全(2017年5期)2017-07-20 10:58:34
搜狐汽車
汽車與安全(2017年3期)2017-04-26 01:25:36
搜狗三季度營收同比增長
CHIP新電腦(2016年11期)2016-12-03 14:26:58
網絡搜索引擎亟待規(guī)范
基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
搜狗分號工具箱 輸入更便捷
廣告主與搜索引擎的雙向博弈分析
柘荣县| 保康县| 海伦市| SHOW| 辽中县| 盱眙县| 巴林右旗| 永宁县| 临洮县| 项城市| 维西| 根河市| 梁山县| 石楼县| 老河口市| 芒康县| 青岛市| 临夏县| 岳普湖县| 莫力| 察哈| 台山市| 江油市| 茌平县| 锡林浩特市| 普陀区| 城固县| 郴州市| 思茅市| 沁阳市| 梁山县| 特克斯县| 会泽县| 砀山县| 镇远县| 邯郸市| 海盐县| 临清市| 龙海市| 青浦区| 乌拉特中旗|