袁斯來
10年前,張濟徽第一次發(fā)現(xiàn)專利數(shù)據(jù)庫這座“金礦”,多少有些偶然。他當時還是新加坡國立大學的學生,參加了學校的創(chuàng)業(yè)項目,到美國費城一家做醫(yī)療器械的初創(chuàng)公司實習。那家公司員工只有兩個創(chuàng)始人,張濟徽相當于001號員工,公司還沒有自己的產(chǎn)品。
不過他們很快就起步了,靠的竟然是東海岸一家倒閉公司的專利技術。
這家公司原本給醫(yī)院提供心臟搭橋手術中使用的血管支架。張濟徽的老板讓張濟徽研究后,將相關技術收購過來,把產(chǎn)品改造成血管透析患者專用的血管支架。這也成了這家初創(chuàng)公司的主打產(chǎn)品,幫他們拿到了一筆不小的融資。
這件事讓張濟徽看到了專利數(shù)據(jù)的價值。歐洲專利局曾經(jīng)統(tǒng)計過,全球有80%的技術信息只存在于專利之中,其余則分散在論文、文獻等學術資料里。全球數(shù)以億計的專利文獻,無疑是一座巨大的“金 礦”。
回到新加坡后,張濟徽創(chuàng)立了專利數(shù)據(jù)公司智慧芽(PatSnap)。目前,智慧芽已經(jīng)涵蓋了100多個國家和地區(qū)的1億條專利,擁有5000多家客戶。智慧芽的盈利模式和湯森路透類似,售賣數(shù)據(jù)庫,按年收費,目前基本達到了盈虧平衡,客單價平均從幾萬到幾百萬元不等。
在美國的經(jīng)歷讓張濟徽意識到,挖掘全球專利這座金礦,最基本的工具是“檢索”和“分析”。而整合全球專利數(shù)據(jù)庫到統(tǒng)一平臺,并有效聚合,是張濟徽要做的“基本建設”。
所以PatSnap第一步是先把數(shù)據(jù)庫做起來,以專利檢索為切入口。
全球的專利文獻都是以紙質文本的形式保存在各國專利機構中,或以電子文檔的形式儲存在它們的網(wǎng)站上。但要在浩瀚的文獻庫中檢索到“有用”的專利文獻,難度遠遠超過在網(wǎng)絡上搜索一件產(chǎn)品或一家公司。而且很多專利申請都有一個拗口的標題,要準確找到它們是一件“技術活”,如一款圖片特效工具,對應的專利名稱可能是“一種數(shù)字圖像蠟筆特效的快速生成方法”。如果以關鍵詞“蠟筆特效”檢索,會搜索出很多和美術相關的專利,說不定還有玩具“蠟筆小新”。
實際上,如果是財大氣粗的公司,可以選擇商業(yè)性的專利數(shù)據(jù)庫,如湯森路透的“德溫特”專利數(shù)據(jù)庫。它早在1960年代就創(chuàng)立,是業(yè)界公認的最權威的知識產(chǎn)權檢索庫。但是,要用好它,用戶也得自己是個“行家”,或者擁有資深的知識產(chǎn)權律師或分析師團隊。另一個關鍵是,它們很昂貴,德溫特對一個汽車工業(yè)數(shù)據(jù)庫的定價在50萬美元以上。
如果沒錢養(yǎng)人和買數(shù)據(jù)庫,技術總監(jiān)或商務拓展專員就得自己動手,在各個國家專利局網(wǎng)站的數(shù)據(jù)庫搜索,或者用免費的軟件代勞,但檢索結果的可信度無法和收費軟件相比。更不用說很多歐洲專利使用法文或德文書寫,要弄懂這些文件,已經(jīng)超出一家普通公司的能力。如果碰巧公司的競爭對手在泰國,很可能需要到泰國專利局一本本翻閱紙質文件。
張濟徽的目標是為用戶提供一個易用、平價版的德溫特專利數(shù)據(jù)庫。在母校新加坡國立大學提供的幾平方米的辦公室里,張濟徽畫出了智慧芽的產(chǎn)品草圖。他設計了一個對話框式的搜索欄,用戶使用時可以用自然語句完成搜索,整個使用流程類似于在學校時使用中國知網(wǎng)搜索論文。
10年來智慧芽的核心產(chǎn)品在外觀和使用方法上一直沒有太大變化。“我的整個產(chǎn)品就是要人性化,讓一個普通用戶不需要學習,甚至沒有人輔助也能迅速上手學會,其實就是把復雜的東西變簡單?!睆垵諏Α兜谝回斀?jīng)周刊》說。
不過,紙上談兵很簡單,真正落地時,張濟徽才發(fā)現(xiàn)自己在數(shù)據(jù)這行還非?!睙o知”?!爱敃r可以說是初生牛犢不怕虎,想得很簡單,以為有了數(shù)據(jù),很容易就能做個搜索引擎出來,然后就會有客戶了?!睆垵栈?憶。
在融資和創(chuàng)業(yè)環(huán)境有些冷清的新加坡,張濟徽手里只有新加坡國立大學給的一筆5萬新元的創(chuàng)業(yè)扶持基金,差不多相當于25萬元人民幣,而當時購買一個歐洲小國家的專利數(shù)據(jù)庫就要20萬元人民幣左右。沒有數(shù)據(jù)庫,他們接下來的開發(fā)真正如無米之炊。
最初,張濟徽只能和技術人員四處到公開網(wǎng)站上抓取數(shù)據(jù),下苦力一點點積累。但這些扒來的數(shù)據(jù)七零八落,缺斤少兩,要靠它們建立自己的數(shù)據(jù)平臺顯然不可能。張濟徽抱著死馬當活馬醫(yī)的心態(tài),在論壇上廣發(fā)帖子,尋找愿意出售數(shù)據(jù)庫的人。沒想到一家邁阿密的第三方數(shù)據(jù)公司看在張濟徽學生創(chuàng)業(yè)的份上回復了他,最后以“友情價”給了他們一批美國專利數(shù)據(jù)。這幾百萬條數(shù)據(jù)讓智慧芽有了開發(fā)產(chǎn)品的“原料”,才算打開了局面。
最難啃的骨頭,是數(shù)據(jù)的清洗。他們得把不同格式、語言的數(shù)據(jù)全部統(tǒng)一到一個架構中,讓用戶用中文就能夠直接搜索到歐洲的專利?!懊總€國家的語言、格式都有不同,這些要整合到一個數(shù)據(jù)庫中,同時還保證搜索的準確和清楚,這需要大量前期的工作?!奔t杉資本中國基金合伙人計越告訴《第一財經(jīng)周刊》。
張濟徽兼任CEO和產(chǎn)品經(jīng)理,靠著朋友關系接一些外包項目勉強養(yǎng)活開發(fā)人員,足足忙了兩年,才拿出了一個產(chǎn)品原型。
2009年算是比較好過的一年,張濟徽的學妹關典加入了團隊,成了智慧芽合伙人,分擔了銷售的工作??恐扔腥嗣}資源和四處奔走,他們積累了第一批客戶。而且,他們及時地獲得了新加坡政府扶持創(chuàng)業(yè)公司的一筆投資。
但沒想到的是,這只是又一個低谷的前奏。由于缺少經(jīng)驗,張濟徽他們一口氣招聘了20多個人,對于一個剛畢業(yè)沒多久的學生來說,他根本沒法管理這樣規(guī)模的團隊?!皼]有招聘經(jīng)驗,什么人都進來了,管理出了很大問題?!睆垵照f。
到了2011年,產(chǎn)品基本上處于癱瘓狀態(tài)。張濟徽折騰了4年,沒想到回到了原點?!爱敃r真的非常魯莽,因為快速盲目擴張,我們犯了初步創(chuàng)業(yè)者都犯的很多錯誤,可以說那是最低潮、最沮喪的時候?!彼貞浀馈?/p>
張濟徽果斷停下了持續(xù)了半年的招聘,還裁掉了一批人,帶著剩下的員工從最基礎的產(chǎn)品架構開始,全部推到重來?;苏蟀肽甑臅r間閉關,到了2011年年底,產(chǎn)品才重新上線。“外面看著是一樣的,但底層結構已經(jīng)全部不同了?!睆垵照f。endprint
但原來的客戶已經(jīng)流失大半,他們不得不從頭開始跑客戶。張濟徽嘗到了魯莽冒進的“苦 果”。
轉機來自張濟徽在倫敦的一次巧遇。他在參加行業(yè)展會時,認識了自己后來的合伙人。合伙人當時賣的是行業(yè)報告,不過他的銷售方式不是“地推”,而是純電話營銷。張濟徽了解到他們業(yè)績做得還不錯,抱著試試看的心態(tài),他把智慧芽產(chǎn)品交給合伙人代理。沒想到一年后,那位合伙人和另一個員工,靠在房間里打電話竟然賣掉了幾百萬元的產(chǎn)品。
“國外對電話營銷接受度比較高,這讓我覺得電話營銷是可行的,成本低不說,整個簽單流程也從以前的幾個月壓縮到了四五十天。”張濟徽說。
對于智慧芽這樣的產(chǎn)品,電話營銷可說是一種性價比極高的銷售方式。現(xiàn)在,智慧芽的海外業(yè)務中,絕大多數(shù)都是通過電話售賣,目前國內的電話營銷占比也不 少。
對張濟徽來說,搜索目標達到后,接下來的數(shù)據(jù)分析更值得“深挖”,而且這一市場的空間更大,用戶黏性也更強。
對于一種技術密集型產(chǎn)品,可能會有上千篇專利文獻,一個時間緊迫的研發(fā)總監(jiān),根本沒有時間逐一閱讀和消化,很多時候,他迫切需要先建立一個粗淺但全面的了解?!捌髽I(yè)級軟件有個特點,用戶不會管技術怎么樣,他們需要知道問題在哪兒,行業(yè)垂直應用的實際解決方案是什么。所以比搜索更重要的是分析。”計越 說。
在最初的版本里,張濟徽只做了簡單的分類,比如國別或發(fā)明人,沒有更細化的技術領域分類。調好了架構后,他們花了很大的力氣研究如何處理自然語言,提取出文獻中的關鍵詞。其中最麻煩的是語言的多義性,比如同樣是單詞“neddle”,在醫(yī)藥領域涉及的是和“針”相關的專利,但到打印機里,它的意思就成了“點陣打印”。智慧芽用機器學習和文本分析的辦法,輔助人工,一步步教會系統(tǒng)“理解”這些詞語的不同含義。
為了讓整個分析更加清晰,他們還開發(fā)了3D專利地圖。它類似于景觀圖,有山峰和洼地,分別代表不同的技術領域,用戶能一目了然地看清自己想要做的技術,是已經(jīng)在山峰、屬于最熱門的“紅海”領域,還是在谷底、關注度低的“藍?!眳^(qū)。
當通用型分析產(chǎn)品相對成熟后,智慧芽的分析開始往垂直領域深耕。在計越看來,定制化的分析方案才是建立起壁壘的關鍵。“企業(yè)級別的軟件可說沒有技術訣竅,最后還是要靠對行業(yè)的理解和深入,你會別人不會,這個才是越來越高的門檻?!庇嬙秸f。
這次產(chǎn)品迭代對張濟徽來說,又是一個水很深的“坑”。隔行如隔山,要進入全新的領域,所有的數(shù)據(jù)庫必須重新做定制化改造。而每一家企業(yè)都有自己的需求,比如樂高的積木耦合技術早就過了專利保護期,它們現(xiàn)在關注的反而是制造材料方面的專利。
智慧芽第一個深度切入的是用戶需求最多的化學領域,這個搜索引擎為醫(yī)藥、涂料、電器公司的客戶提供基于化學式的專利分析服務。在這個行業(yè),專利文獻最大的特點是會有長長的分子式。但工作人員平時習慣看對應的分子結構圖。在專利文獻中,這些結構圖都放在附錄部分,圖片和文字沒有對應,給閱讀造成很大的障礙?!坝泻芏嗉夹g訣竅在里面,必須招聘很多化學行業(yè)的專家來指導我們?!睆垵照f。
智慧芽用圖像識別技術,抽取出專利中的圖片,再和化學式綁定,這樣一來,用戶在點擊化學式時,就能直接看到對應的圖片。
化學領域的結果分析也有一套專門的方案。這一領域的專利創(chuàng)新,主要是在結構式上動腦筋。有時只要在既有的分子結構上加入一個節(jié)點,就是一門新技術。所以,智慧芽的檢索也在之前的以專利人、機構、技術分類上,加上了分子式的結構搜索和對比。
“要做基礎搜索很簡單,但最難的是用圖像識別技術抓取圖片后,找到化學式之間的關系,給到用戶建議?!标P典表示。而且“這個行業(yè)不是有錢就行,每個行業(yè)有每個行業(yè)的規(guī)矩,得靠一個個用戶使用場景積累經(jīng) 驗。”
化學行業(yè)有細化的要求,金融行業(yè)反而更關注“大局”。當投資機構考慮是否要收購一家公司時需要考慮很多因素,比如一個熱門專利的發(fā)明人正好是某個公司的合伙人,再綜合以往的融資新聞、產(chǎn)品發(fā)布情況,如果這個公司還處于早期,估值不高,又有核心的技術,那么收購這家公司可能就是筆比較劃算的買賣?!艾F(xiàn)在投資很多是投硬技術了,以往它們不太關注技術這方面,不過現(xiàn)在越來越重視了。”關典說。
計越顯然認為智慧芽選擇了一個綿延不斷的巨大“風口”,這也是去年11月紅杉資本領投數(shù)智慧芽C輪融資的原因。此前在2014年,智慧芽完成由新加坡淡馬錫旗下機構投資的A輪融資,2015年11月獲得美國Summit Partner的千萬美元B輪投資。
現(xiàn)在的智慧芽已經(jīng)不單單是專利數(shù)據(jù)搜索引擎,在關典看來,他們現(xiàn)在是要圍繞知識產(chǎn)權和其他信息,提供整合分析的解決方案,“以前是解決一些點,現(xiàn)在是回答從頭到尾的商業(yè)問題?!标P典說。endprint