界面網(wǎng)
本文是“數(shù)據(jù)型公司”系列報道的第二篇,研究成果來自紅杉美國數(shù)據(jù)科學(xué)團隊。
數(shù)據(jù)科學(xué)到底是什么?數(shù)據(jù)科學(xué)是一門求真的學(xué)科,它利用數(shù)據(jù)提取知識,獲得行業(yè)洞見。數(shù)據(jù)科學(xué)的應(yīng)用范圍不斷擴大,為各個行業(yè)創(chuàng)造了巨大的價值。
但和其他尚在發(fā)展的領(lǐng)域一樣,數(shù)據(jù)科學(xué)仍處在起步階段。最重要的是為這一學(xué)科留下發(fā)展的空間,而不是糾結(jié)于它的分類——是數(shù)據(jù)驅(qū)動型(Data-driven),還是數(shù)據(jù)知情型(Data-imformed)。
今天,由于互聯(lián)互通程度的加深、云儲存和計算成本的下降,創(chuàng)建一個科技公司的難度也隨之降低。因此,產(chǎn)品月活躍用戶人數(shù)破億所需的時間也大大縮短。
2013年,iTunes 的月活躍用戶人數(shù)破億花了100 個月,而游戲《Pokemon Go》只用了短短幾天。
互聯(lián)網(wǎng)產(chǎn)品數(shù)量的增多和人們在線時間的延長,使得用戶交互數(shù)據(jù)激增。通過挖掘這類數(shù)據(jù)發(fā)現(xiàn)行業(yè)洞見,從而構(gòu)建偉大產(chǎn)品,激發(fā)了人們極大的興趣。企業(yè)能否對來源多樣、海量雜亂的數(shù)據(jù)進行有效分析和利用,推動產(chǎn)品創(chuàng)新,成為衡量企業(yè)競爭力的新標尺。
對于數(shù)據(jù)型公司的產(chǎn)品團隊來說,數(shù)據(jù)分析的關(guān)鍵作用集中在以下四點:
對企業(yè)產(chǎn)品或企業(yè)本身進行健康分析和評估,是數(shù)據(jù)分析的重要作用之一。確立了產(chǎn)品成功的標準后,接下來就是對相應(yīng)標準進行監(jiān)督,確保方向正確和目標達成。
數(shù)據(jù)分析的另一個重要作用就是確保打造出正確的產(chǎn)品和功能。通常,數(shù)據(jù)科學(xué)家會幫忙設(shè)計實驗,提出假設(shè),借助數(shù)據(jù)信息,指導(dǎo)產(chǎn)品團隊不斷優(yōu)化產(chǎn)品。
數(shù)據(jù)科學(xué)家可以借助人工智能或機器學(xué)習來構(gòu)建產(chǎn)品原型/模型,為產(chǎn)品系統(tǒng)賦能,比如,通過對某一機器學(xué)習模型進行訓(xùn)練,來預(yù)測前景和趨勢。
對用戶軌跡和某些現(xiàn)象的深入分析,能夠帶來關(guān)鍵的行業(yè)洞見,幫助公司制定產(chǎn)品流程和策略,這也是世界級產(chǎn)品分析團隊最重要的作用。
數(shù)據(jù)科學(xué)家本身涵蓋了多個角色,在不同的公司、行業(yè),具體的角色也天差地別,但一般可以分為以下兩類:
產(chǎn)品分析師的職責是交付數(shù)據(jù)知情型內(nèi)容,用于產(chǎn)品或策略的改進。
算法開發(fā)員的職責是將數(shù)據(jù)驅(qū)動型功能融入到產(chǎn)品中,例如,優(yōu)化推薦內(nèi)容或搜索結(jié)果。
產(chǎn)品分析師側(cè)重于制定目標,提供產(chǎn)品流程和策略。他們的主要工作通常是給產(chǎn)品團隊提供一份文件,其中有可量化的問題、已識別的機會,以及基于數(shù)據(jù)的建議和解決方案。
算法開發(fā)員的主要工作是利用數(shù)據(jù)來優(yōu)化產(chǎn)品性能。他們?yōu)楣こ虉F隊提供原型代碼和資源文件,并與工程團隊進行緊密合作,將這些方案應(yīng)用到生產(chǎn)中。
這兩種數(shù)據(jù)科學(xué)家的能力相似,都要能夠進行分析預(yù)測和數(shù)據(jù)量化。但算法開發(fā)員需要擁有更多復(fù)雜的技術(shù)知識(如機器學(xué)習、人工智能),而產(chǎn)品分析師則需要有更多解決問題的能力,包括能與相關(guān)管理者有效溝通。
一般來說,產(chǎn)品分析師屬于數(shù)據(jù)知情型,而算法開發(fā)員屬于數(shù)據(jù)驅(qū)動型。并不是所有企業(yè)都需要算法開發(fā)員,但所有企業(yè)(尤其是那些用戶基礎(chǔ)雄厚的企業(yè))都需要產(chǎn)品分析師,因為他們可以解決產(chǎn)品的問題,提高產(chǎn)品競爭力,幫助企業(yè)更好地應(yīng)對戰(zhàn)略上的挑戰(zhàn)。
試想這樣一個世界,機器知道你喜歡的事物,了解你的選擇偏好,不用具體詢問就知道該為你購買哪些東西,可以幫助你做很多決定,包括幫助你規(guī)劃人生。
這樣的世界在短期內(nèi)可能還無法實現(xiàn),它存在于人工智能成為我們的“生活大管家”的未來,那時可能大部分事務(wù)由AI 負責。為了朝著這一夢想邁進,我們需要在數(shù)據(jù)驅(qū)動上更進一步。
在一個機器擁有完備信息的世界中,AI清楚地知道你行為背后的原因,以及各種原因之間的相互作用機制,這需要數(shù)據(jù)驅(qū)動與數(shù)據(jù)知情的結(jié)合。
在純粹使用數(shù)據(jù)驅(qū)動方式?jīng)Q策時,數(shù)據(jù)是唯一的重要因素。而使用數(shù)據(jù)知情方式?jīng)Q策時,數(shù)據(jù)是一個重要因素,但不是唯一的。
當未來越來越多的流程實現(xiàn)自動化,相比于數(shù)據(jù)知情,世界將更偏向于數(shù)據(jù)驅(qū)動。然而,在近幾十年,數(shù)據(jù)知情還將持續(xù)占據(jù)十分重要的地位,而數(shù)據(jù)驅(qū)動的發(fā)展進步則要靠數(shù)據(jù)知情型人才來推動。
目標的確定和追蹤將日益向數(shù)據(jù)驅(qū)動的方向靠攏。例如,F(xiàn)acebook 對活躍用戶的追蹤可能是一個全自動化的過程,是純粹的數(shù)據(jù)驅(qū)動。但在制定恰當?shù)募径群湍甓然钴S用戶數(shù)量目標和收益目標時,可能就不再是全自動化了,其中摻雜了數(shù)據(jù)知情型的方法。
流程和戰(zhàn)略的制定是難以量化的,因此需要采用數(shù)據(jù)知情的方法。一個好的流程路線圖會考慮到相關(guān)目標、這些目標的驅(qū)動因素、產(chǎn)品團隊手中的杠桿,以及可行的行動方案。
結(jié)果預(yù)測主要為數(shù)據(jù)驅(qū)動型。例如,要確定是否要推送某個內(nèi)容,需要考慮用戶點擊或閱讀該內(nèi)容的概率等多種因素。在進行結(jié)果預(yù)測時,企業(yè)通常會進行模型開發(fā),并不斷對模型進行迭代。
對于PayPal 這類公司來說,對每筆交易都進行詐騙活動的人工審核,成本高昂。因此,它們多依靠機器學(xué)習來增強產(chǎn)品系統(tǒng)的能力,實現(xiàn)審核的自動化和概率評估的自動化。然而,對于那些概率評估置信水平較低的領(lǐng)域,決策方式就可能更偏向數(shù)據(jù)知情型。