趙艷秋+王眾
這家納斯達(dá)克上市的新公司,長遠(yuǎn)目標(biāo)是做“中國的Oracle”,提供“新時代的商業(yè)智能”。
9月,國雙科技成功登陸納斯達(dá)克,成為中國首家赴美上市的大數(shù)據(jù)分析軟件企業(yè)。
如果讓國雙科技CEO祁國晟說出對自己影響很深的一家企業(yè),這位自信而有雄心的80后可能會說“非微軟莫屬”。他從這家國際大企業(yè)找到了人生偶像,獲得了技術(shù)和管理的啟發(fā),也確立了公司的目標(biāo)——做一個掌握核心技術(shù)的B2B企業(yè)。
軟件創(chuàng)客
祁國晟在小學(xué)一二年級時,就注意到了電腦。到了中學(xué),他不僅學(xué)會了編程,做了網(wǎng)站,甚至還有了做軟件企業(yè)的夢想。他的偶像是比爾·蓋茨。
不過,從他對計算機產(chǎn)生興趣到后來保送進清華讀軟件這段時期,中國軟件產(chǎn)業(yè)“正在走下坡路”。由“中國第一程序員”求伯君開發(fā)的傳奇程序WPS,從占領(lǐng)國內(nèi)市場80%到最終幾乎一夜之間被微軟翻轉(zhuǎn)。祁國晟看到,中國軟件行業(yè)“慢慢沒有了自主的東西”。
在祁國晟進入大學(xué)的第二年,他在校園內(nèi)成立了“軟件產(chǎn)業(yè)研究學(xué)會”,希望通過調(diào)研來解決一直困擾自己的一個問題——為什么“中國沒有軟件產(chǎn)業(yè)”?他認(rèn)為自己有責(zé)任去研究行業(yè),而不僅僅是學(xué)習(xí)編程技術(shù)。
在與國內(nèi)各大行業(yè)協(xié)會合作的過程中,他發(fā)現(xiàn),國內(nèi)軟件企業(yè)絕大多數(shù)更像是“項目企業(yè)、系統(tǒng)集成企業(yè)或信息服務(wù)企業(yè),沒有多少真正的軟件產(chǎn)品企業(yè)”。即使是做產(chǎn)品的企業(yè),也是在微軟、Oracle或SAP這些國外基礎(chǔ)軟件產(chǎn)品上搭建一個應(yīng)用,這與他心目中的軟件——操作系統(tǒng)、瀏覽器、Office有著本質(zhì)的不同。
做產(chǎn)業(yè)研究學(xué)會也開啟了祁國晟的大學(xué)創(chuàng)業(yè)生涯。因為此時他認(rèn)識了不少業(yè)內(nèi)人士,都有編程需求。于是,祁國晟就組織同學(xué),有時幾個人,多時十幾個人,“干點兒項目”。現(xiàn)在,當(dāng)公司上市后,他身上的標(biāo)簽之一是“大學(xué)創(chuàng)業(yè)的成功代表”。
今天,社會鼓勵大學(xué)生創(chuàng)業(yè),但在祁國晟創(chuàng)業(yè)時,清華上上下下幾乎都是反對派,因為之前學(xué)校剛掀起過一波創(chuàng)業(yè)潮,結(jié)果都不太好。這甚至導(dǎo)致祁國晟成立學(xué)會時,差點找不到規(guī)定的指導(dǎo)老師。恰好當(dāng)時一位剛從美國麻省理工學(xué)院回清華任教的老師,開設(shè)了一門研究技術(shù)經(jīng)濟和創(chuàng)新經(jīng)濟的課程。“我覺得他無論如何都不該拒絕我,因為我想做的就是這個方向”。果然,這位老師支持了他,現(xiàn)在也是國雙的一名董事。
如今,很多人都會問已成為“中關(guān)村創(chuàng)業(yè)之星導(dǎo)師團成員”的祁國晟,你對大學(xué)生創(chuàng)業(yè)怎么看?“坦白講,我覺得非常非常難,因為很多產(chǎn)業(yè)分工已極度專業(yè)化了。20年前真的有“風(fēng)口”,而且“風(fēng)口”位置較低,有人肯站上去,就有可能被吹起來?,F(xiàn)在“風(fēng)口”是給很成熟、有資源、有準(zhǔn)備的人去做的”。
不過,他也肯定地說,自己是鼓勵大學(xué)生創(chuàng)業(yè)的,但前提是“應(yīng)該抱著99.99%會失敗的決心去創(chuàng)業(yè)”。因為創(chuàng)業(yè)經(jīng)歷可以讓年輕人受到很強的鍛煉,特別在意志和對殘酷競爭的認(rèn)知層面上。但是如果是抱著“30歲實現(xiàn)財務(wù)自由”的目標(biāo)創(chuàng)業(yè),那就不要做了。
比谷歌早一年
三四年前,“大數(shù)據(jù)”才被IT行業(yè)領(lǐng)頭羊企業(yè)熱烈探討。但祁國晟11年前在校創(chuàng)建公司時,就給公司取名Gridsum——他當(dāng)時想,如果有一天數(shù)據(jù)量太大,大到加法在一臺計算機上搞不定時,就用分布式計算(Grid)處理加法(Sum)。這幾乎預(yù)見了今天業(yè)界對大數(shù)據(jù)的解決之道。
“我們發(fā)覺這個方向太有意思了,因為數(shù)據(jù)的增量有一天可能會超出摩爾定律的速度,單臺機器僅憑硬件升級永遠(yuǎn)不可能搞定數(shù)據(jù)分析的量”。
祁國晟聽了大量分布式課程,像分布式操作系統(tǒng)、分布式數(shù)據(jù)庫。但這些技術(shù)在當(dāng)時更多的是為了解決部署問題,而不是性能問題?!拔覀円婚_始就要讓它解決性能問題”。
如今,在大數(shù)據(jù)行業(yè)廣為人知的是,2004年谷歌相繼發(fā)表的三篇論文——Google FS、MapReduce、BigTable,這奠定了大數(shù)據(jù)的概念和算法基礎(chǔ),也是Hadoop的起源。
實際上,祁國晟2003年就寫了一個程序,把四則運算轉(zhuǎn)化成加法,并讓多臺計算機一起來做,這甚至比谷歌的論文還早一年。
而當(dāng)時,除了谷歌這些搜索引擎公司,很少會有大公司想到數(shù)據(jù)的分布式處理,因為做搜索的企業(yè)是第一批面臨每天新增網(wǎng)頁數(shù)據(jù)超出單臺計算機處理性能的企業(yè)。這也是為什么谷歌提出MapReduce、雅虎做出Hadoop的原因。
“我們可以拍著胸脯說,我們與MapReduce是同一個時候出來的?!逼顕烧f。
這并不足奇,在業(yè)界,突破性技術(shù)往往來自小型初創(chuàng)公司。例如,CDMA編碼技術(shù)就不是來自通信大企業(yè)諾基亞或AT&T,而是當(dāng)時的初創(chuàng)公司高通。
獨門秘籍
國雙成立后,最早接觸的需求是搜索引擎優(yōu)化(SEO),就是讓某網(wǎng)站更受搜索引擎青睞。
那時,市場上大部分SEO的做法是“抓搜索引擎的漏洞,然后鉆空子”。但祁國晟認(rèn)為“這類似金庸武俠小說中的‘旁門左道,不是正宗的功法”。他采用了與之不同的方法。
他們?yōu)榇笮途W(wǎng)站拿去一個基于數(shù)據(jù)分析的診斷。在祁國晟看來,網(wǎng)站如果能掌握自己底層架構(gòu)的數(shù)據(jù),對每個頁面的內(nèi)容、鏈接、關(guān)鍵詞密度和流量了如指掌,就能做出一個結(jié)構(gòu)清晰、原創(chuàng)內(nèi)容豐富的站點,搜索引擎自然就會喜歡??蛻粲X得國雙的方法很有道理。
當(dāng)年,國雙SEO技術(shù)因為效果顯著,受到大型網(wǎng)站認(rèn)可。
“做完這些大客戶后,我們就覺得Web Analytics(網(wǎng)頁分析)太有機會了。即使是世界級產(chǎn)品,包括Google Analytics都有很多局限性。所以,我們花了兩年時間潛心把它做好?!逼顕烧f,“現(xiàn)在,Web Analytics是國雙所有產(chǎn)品的核心?!?/p>
國雙也很快通過解決點擊欺詐問題,開啟了最初的人工智能研發(fā)。當(dāng)時在廣告界,點擊欺詐現(xiàn)象非常嚴(yán)重。國雙可以提供一個多維度的自由剖析,幫助業(yè)內(nèi)人士發(fā)現(xiàn)點擊欺詐。但是很快,“我們發(fā)現(xiàn)這個事太多了,能不能教會計算機自動去做這件事?”于是,他們開始了人工智能的嘗試。
人工智能模塊將扎根于國雙的每個產(chǎn)品中,“但我們并不想突出說這就是人工智能”。祁國晟坦言,現(xiàn)在,國雙沒有實力去投入一個“能下圍棋的機器人”,但他們投入的人工智能研發(fā),目標(biāo)是在任何一個有規(guī)模的行業(yè)中,把一些機械的事變得更有效率。比如,一些應(yīng)用要通過看很多數(shù)據(jù)進行判斷,人總會有疲勞和疏漏,能不能用機器來替代?
另一個國雙的突破,來自祁國晟畢業(yè)后在微軟亞洲研究院的實習(xí)經(jīng)歷,這也是他唯一一段“打工生涯”。他接觸了一個有趣的項目——自然語言分析,訓(xùn)練機器去讀一批論文,然后回答“誰是這個領(lǐng)域的專家”。
“論文是非結(jié)構(gòu)化數(shù)據(jù),我當(dāng)時覺得這類數(shù)據(jù)很有意思,它不是1+1=2這類結(jié)構(gòu)化數(shù)據(jù)。我覺得,未來數(shù)據(jù)分析不只是1+1=2,還必須要對非結(jié)構(gòu)化數(shù)據(jù)進行有效分析”。
祁國晟發(fā)現(xiàn),因為當(dāng)年計算機架構(gòu)不能既看文本信息、又讀數(shù)字,大家因此把精力都放在文本信息上。這會導(dǎo)致這個自然語言識別項目的準(zhǔn)確率大打折扣。
“這是一個機會”。后來,國雙確立了“結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)不能分而治之的路線”。這條路有一定技術(shù)困難,做行業(yè)應(yīng)用就更麻煩了,因為每個領(lǐng)域都要訓(xùn)練一個數(shù)據(jù)集,尤其是特別專業(yè)的領(lǐng)域,缺乏復(fù)合型人才,有很多問題要克服。
不過,這條路也為國雙在多領(lǐng)域的大數(shù)據(jù)解決方案奠定了技術(shù)基礎(chǔ)。 例如,在支持“法信——中國法律應(yīng)用數(shù)字網(wǎng)絡(luò)服務(wù)平臺”的建設(shè)過程中,在人民法院電子音像出版社副社長張承兵看來,國雙是唯一一家他們接觸的大數(shù)據(jù)公司中,技術(shù)達(dá)到應(yīng)用級水平的。
今年春季,“法信”平臺上線,其中的裁判剖析大數(shù)據(jù)引擎(LD)和同案智推大數(shù)據(jù)引擎(SP)由國雙研發(fā)?,F(xiàn)在,“法信”平臺主要是為法院體系服務(wù)。但在中國司法改革中,包括在一些領(lǐng)域要推廣先例制度——不只是看法條,還要看先例,國雙會藉此把它更深入地做成整個司法行業(yè)的解決方案。
國雙也在深耕市場營銷行業(yè)、政府公共服務(wù)行業(yè),未來還會把技術(shù)帶入金融行業(yè),定制行業(yè)解決方案。
“互聯(lián)網(wǎng)思維”是個坑
2014年底,當(dāng)國雙具備一定規(guī)模后,請來在微軟曾管理過上千工程師團隊的劉激揚擔(dān)任公司CTO。
“其實,我們創(chuàng)業(yè)團隊的技術(shù)背景都很強,為什么還要到外邊請一個CTO?”祁國晟說,“因為我們都沒有大公司的經(jīng)驗。而且,我們認(rèn)為微軟的工程質(zhì)量是相當(dāng)好的。當(dāng)公司發(fā)展到一定規(guī)模后,一定要請一個專業(yè)的CTO,幫我們把控產(chǎn)品質(zhì)量和流程。”
劉激揚是微軟亞洲互聯(lián)網(wǎng)工程院的創(chuàng)建人?!八牡絹恚褔p技術(shù)團隊管理帶上一個新層次,從創(chuàng)業(yè)公司帶到一個國際公司的思維層面?!逼顕蓪⒓P的評價很高。
同出自微軟,曾擔(dān)任產(chǎn)品經(jīng)理的國雙科技助理總裁許云介紹說,微軟是最早提出產(chǎn)品開發(fā)要有“產(chǎn)品經(jīng)理、開發(fā)團隊、測試團隊三駕馬車的”的企業(yè)。互聯(lián)網(wǎng)企業(yè),像谷歌最早都沒有測試員?!暗珡漠a(chǎn)品質(zhì)量管理角度,微軟有一個很嚴(yán)格的標(biāo)準(zhǔn),產(chǎn)品出去前一定要經(jīng)過嚴(yán)格的流程”。
國雙最初更像一個互聯(lián)網(wǎng)公司,也采用敏捷開發(fā)。劉激揚加入之后,反而讓他們別太敏捷,要按照一個規(guī)程,系統(tǒng)性地做一個軟件。要分清測試、開發(fā)和產(chǎn)品職責(zé),像大集團軍一樣作戰(zhàn)。
“實際上,互聯(lián)網(wǎng)思維是B2B行業(yè)最大的坑。”祁國晟說。對“互聯(lián)網(wǎng)思維”一個極端的理解是快速做出新東西,病毒式推廣出去,免費使用,黏住用戶。但B2B企業(yè)的重心則完全不同——它要有核心技術(shù),而不僅僅是一些功能。而核心技術(shù)如果沒有時間積累、沒有專業(yè)的人是做不好的。
“我覺得現(xiàn)在一個很大的問題是,很少有人真正相信,核心技術(shù)是可以被一個中國企業(yè)或中國團隊掌握的。所以大家今天都在拼功能,而不是拼技術(shù)。”祁國晟說,“實際上,在企業(yè)級領(lǐng)域,你今天發(fā)布一個功能,明天再發(fā)布一個功能,這并不重要,因為企業(yè)級應(yīng)用要適應(yīng)嚴(yán)苛的實際應(yīng)用場景。很多看似功能豐富的產(chǎn)品一到實際應(yīng)用階段,面對小規(guī)模數(shù)據(jù)量的場景還能應(yīng)付,數(shù)據(jù)規(guī)模大到一定程度就垮了?!逼髽I(yè)級產(chǎn)品靠照貓畫虎那樣模仿功能,是打不了真正的仗的。
在今年CNTV世界杯決賽直播、奧運會女排決賽直播中,國雙提供了基于央視網(wǎng)PC網(wǎng)頁、PC客戶端、手機、Pad等多終端過億用戶的全樣本“用戶播放行為分析”,為新媒體直播提供了有力保障?!拔覀兡軕?yīng)對的數(shù)據(jù)量級是行業(yè)最具有挑戰(zhàn)性的,這是我特別自豪的一件事?!?祁國晟說。
2016年上半年,國雙研發(fā)費用占到公司營收的45%。祁國晟說,他現(xiàn)在對研發(fā)的理解是不要那么急功近利?!把邪l(fā)是錢花在未來一年都不一定會變成現(xiàn)金收入的事上”。像國雙與大學(xué)的合作,建立的“哈工大國雙聯(lián)合自然語言處理實驗室”、“人民大學(xué)—國雙大數(shù)據(jù)科學(xué)聯(lián)合實驗室”, 捐資設(shè)立“北京大學(xué)法學(xué)院科研與人才培養(yǎng)工作發(fā)展基金”,就是面向未來的研發(fā)。
目前,BAT也在加緊布局大數(shù)據(jù)。不過,祁國晟認(rèn)為,BAT的大數(shù)據(jù),更多與消費者相關(guān),與B2B的DNA很不同。“B2B行業(yè)給客戶一個工具是不行的,在中國必須提供一個端到端的解決方案,必須要做得很細(xì)。而且,以BAT的體量,如果不是做一個平臺,而是一個應(yīng)用,要一家一家地推,這不是他們想做的事。大家的方向差別還是挺大的?!?/p>
成長洞見
公司成功在納斯達(dá)克上市后,祁國晟在不同場合對10多年來在B2B行業(yè)的摸爬滾打有一些總結(jié)。他認(rèn)為early vision(早期視野)很關(guān)鍵,國雙無論是SaaS還是在數(shù)據(jù)分布式處理上,都“看得非常早,運氣也比較好”。
國雙當(dāng)時在考慮系統(tǒng)架構(gòu)時,市場上還沒有“SaaS”這個詞。祁國晟記得很清楚,2007年他們做第一個產(chǎn)品Web Dissector時,同事問他,這個系統(tǒng)要不要考慮部署在客戶那里?他說不考慮。祁國晟判斷,做大數(shù)據(jù)必須用“SaaS”,除了極少數(shù)大企業(yè)外,計算機集群要放在國雙這里來集中調(diào)度,效率才會比較高,成本也會比較優(yōu)化。
他也談到了做企業(yè)要堅持,“不管世界怎么變,我們就覺得這個事情要做下去?!?/p>
而行業(yè)專家是B2B企業(yè)成功的基石——你必須要找到這個行業(yè)里真正的專家,才有可能打動這個行業(yè)的購買者?!耙驗槊總€行業(yè)都是很深的,當(dāng)你不能深度解決別人的問題時,沒有人有時間陪你玩。你必須做出他能夠用的東西。當(dāng)只有一步之遙時,他才給你提點意見”。所以,B2B行業(yè)不光要有計算機編程能力,還一定要有行業(yè)專家。因為專家才能知道更深層面的痛和那個行業(yè)真正最嚴(yán)峻的問題。
祁國晟認(rèn)為,文化和股權(quán)激勵是把行業(yè)專家團結(jié)在一起的重要方式。
“真正的行業(yè)專家很少認(rèn)同在企業(yè)里做互聯(lián)網(wǎng)文化的,因為他自己在某個行業(yè)深耕多年,他不相信任何事情能簡簡單單、一兩年就出成果。”他說,“你要能打動這樣的人,必須要有一定的積淀?!?/p>
如今,國雙聯(lián)席總裁李峰就是互聯(lián)網(wǎng)廣告、搜索引擎營銷領(lǐng)域的大專家、百度第一任銷售總監(jiān)。在政府行業(yè),國雙與國家信息中心合作,吸引了很多政府行業(yè)專家。在法律行業(yè),國雙既有法官、檢察官,也有律師,都曾在司法機關(guān)或律師事務(wù)所擔(dān)任要職。而B2B行業(yè)也要謹(jǐn)慎地對待風(fēng)險投資?!耙驗锽2B企業(yè)能做起來就能做起來,不一定需要很多錢”。即使現(xiàn)在SaaS公司燒錢很厲害,但都是在證明它的服務(wù)有人買、愿意付費后,再燒錢做銷售的。
正因為如此,雖然國雙之前曾做過三輪融資,從2010年迪士尼旗下的思偉投資和諾基亞成長基金,到2013年索羅斯的量子基金,這也是量子基金在亞洲唯一一次領(lǐng)投項目,再到2015年高盛投資,國雙都低調(diào)處理,沒有對外宣布。
祁國晟還提醒B2B創(chuàng)業(yè)者,在中國,由于采用現(xiàn)代治理制度的企業(yè)比較少,簡單復(fù)制國外概念不太容易成功。而在一些領(lǐng)域,由于政策等因素變化比較大,解決方案最好不是一個點,而是一個面。這樣,將來抗風(fēng)險的能力會比較強。
“中國Oracle”
從當(dāng)年做“軟件創(chuàng)客”起,祁國晟的夢想就是要做基礎(chǔ)軟件。
在國雙第一個產(chǎn)品Web Dissector的研發(fā)過程中,他們遇到一個問題是,商業(yè)智能領(lǐng)域很有價值的一種老產(chǎn)品——數(shù)據(jù)倉庫技術(shù),不僅架構(gòu)不太適合分布式,而且數(shù)據(jù)量達(dá)到一定量級就不行了。直到現(xiàn)在,Oracle、微軟都沒有一個云上數(shù)據(jù)倉庫。
“但值得自豪的是,2009年Web Dissector發(fā)布時,它是全世界第一個完全基于數(shù)據(jù)倉庫的產(chǎn)品。在這個產(chǎn)品上,用戶可以直接做各種分析,這些分析當(dāng)年只有專業(yè)數(shù)據(jù)倉庫才具備,而且我們是在云上提供的。”祁國晟說。
目前,國雙正繼續(xù)優(yōu)化結(jié)構(gòu),希望幾年之后,提供一個像AWS一樣的云服務(wù),但這是一個“數(shù)據(jù)分析云服務(wù)”,所有大數(shù)據(jù)的服務(wù),包括數(shù)據(jù)倉庫、實時數(shù)據(jù)分析、關(guān)聯(lián)分析甚至單純的自然語言分析,都在云上對外提供。
祁國晟說,自己的長遠(yuǎn)目標(biāo)是做“中國的Oracle”,開發(fā)基礎(chǔ)軟件,其他企業(yè)可以在國雙軟件上做二次研發(fā),實現(xiàn)某個行業(yè)的應(yīng)用。而這個基礎(chǔ)軟件,也就是“新時代的商業(yè)智能”,現(xiàn)在被業(yè)界稱為PaaS。
而在近期,這家前期走得還算順風(fēng)順?biāo)哪贻p企業(yè)更要努力證明,其在正在到來的大數(shù)據(jù)應(yīng)用時代,能深入更多規(guī)模行業(yè),用技術(shù)改變商業(yè)。