国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

KDD系統(tǒng)在制片人決策過程中的應(yīng)用

2020-11-13 09:44付曉朦
藝海 2020年9期
關(guān)鍵詞:大數(shù)據(jù)

付曉朦

〔摘 要〕今全球已進(jìn)入數(shù)字化、信息化、網(wǎng)絡(luò)化時(shí)代,數(shù)據(jù)影響著各個(gè)行業(yè)的發(fā)展。互聯(lián)網(wǎng)時(shí)代下的制片公司,他們并不缺乏產(chǎn)品思維,而是缺乏作品思維。他們過于的看重?cái)?shù)據(jù)的力量,一味地去迎合觀眾口味,而忽視了電影內(nèi)容本身。同樣是利用大數(shù)據(jù)國外打造的影視作品卻能可觀的成績,他們的共同點(diǎn)就是對數(shù)據(jù)的深入挖掘與解讀。也就是我所要探討的KDD系統(tǒng)。

電影既是商品也是藝術(shù),一味地去迎合觀眾的口味,難免會(huì)制造出媚俗質(zhì)量低的電影。作為制片人,我們需要重視的不是數(shù)據(jù)本身,而是根據(jù)自身的需求,通過KDD系統(tǒng),對數(shù)據(jù)進(jìn)行深入的挖掘,得到數(shù)據(jù)背后的有利用價(jià)值和意義的知識(shí)。

〔關(guān)鍵詞〕大數(shù)據(jù);數(shù)據(jù)額挖掘;KDD系統(tǒng)

一.KDD系統(tǒng)特點(diǎn)

1.KDD系統(tǒng)定義

KDD既Knowledge Discovery in Database,人們給KDD下過很多定義,但目前公認(rèn)的是由美國Microsoft Research labs的Fayyad等人所提出的定義,即KDD系統(tǒng)的目的是為了從海量大數(shù)據(jù)集中,識(shí)別出是對目標(biāo)項(xiàng)目有效且可行,新穎并且有趣,不易被發(fā)現(xiàn)的,最后生成可以被理解的模式,KDD系統(tǒng)區(qū)別于普通數(shù)據(jù)軟件的一點(diǎn)就是它的運(yùn)作過程是一個(gè)非平凡而更高級的。

KDD系統(tǒng)的優(yōu)點(diǎn)是幫助使用者,屏蔽掉原始未經(jīng)處理的數(shù)據(jù),那些煩瑣的細(xì)節(jié),將數(shù)據(jù)庫中提煉出有簡潔,有利用價(jià)值的數(shù)據(jù)報(bào)告,提供給使用者。這些知識(shí)是含蓄并且不易被發(fā)現(xiàn)的,也是事先未知的并且有趣,數(shù)據(jù)挖掘是KDD系統(tǒng)中重要的一個(gè)步驟。

2.KDD系統(tǒng)特點(diǎn)

通過數(shù)據(jù)挖掘所發(fā)現(xiàn)得到的模式,需要保證是可以被用戶所理解的,它主要是體現(xiàn)在發(fā)現(xiàn)的模式要簡單有效、新穎并且有趣、并且符合用戶需求。但KDD挖掘出來的數(shù)據(jù)是通過算法挖掘出來的,深入而不是表象,是有趣并有價(jià)值意義的。這也是KDD系統(tǒng)與普通大數(shù)據(jù)分析的最大區(qū)別。在影視行業(yè)中,指的就是制片人在為該項(xiàng)目向投資方進(jìn)行闡述的過程,要簡單易懂,使投資方產(chǎn)生投資興趣。

①有效性

“有效性”的意思是指通過數(shù)據(jù)分析這一過程,從而挖掘與發(fā)現(xiàn)出來的模式必須保持有一定的可信性。所謂的“模式”一詞的意思是將得出的規(guī)律作為依據(jù)指導(dǎo)人們進(jìn)行實(shí)踐的方式,是理論和實(shí)踐之間的中介。

對影視行業(yè)來說,有效性就是指影視項(xiàng)目必須順應(yīng)時(shí)代發(fā)展,滿足市場需求,合理合法,有說服力。

②新穎性

“新穎性”的意思是指要求KDD系統(tǒng)所發(fā)現(xiàn)的模式必須是新穎的,區(qū)別于以往的。模式是否新穎可以通過將KDD系統(tǒng)所得到的數(shù)據(jù)結(jié)果和普通數(shù)據(jù)分析所得出的結(jié)果之間進(jìn)行對比,通過比較結(jié)果來判斷模式的新穎程度。所謂的普通數(shù)據(jù)分析,就是指通過計(jì)算平均值等利用數(shù)據(jù)本身進(jìn)行計(jì)算所得到的趨勢等等的研究過程。對影視行業(yè)來說,新穎性就是指影視項(xiàng)目內(nèi)容的新穎程度。

③潛在有用性

“潛在有用性”是指KDD系統(tǒng)所總結(jié)出來的模式將來有實(shí)際效用,對于影視行業(yè)來說,就是最終的項(xiàng)目必須是有技術(shù)支持,可以完成并上映的,并且是可以提高市場回報(bào)率的高質(zhì)量項(xiàng)目。

3.KDD系統(tǒng)使用流程

①數(shù)據(jù)篩選

數(shù)據(jù)篩選:數(shù)據(jù)篩選的目的是確定目標(biāo)數(shù)據(jù)。 在第一個(gè)步驟中制片人要根據(jù)所開發(fā)的項(xiàng)目需求,從網(wǎng)絡(luò)放映平臺(tái)或者影院消息中獲取終相關(guān)的觀眾行為,興趣愛好等。

②數(shù)據(jù)預(yù)處理

數(shù)據(jù)預(yù)處理: 由于大數(shù)據(jù)存在著水分大,不夠真實(shí),不完整和不一致的弊端,所以制片人的在做項(xiàng)目決策之前,需要做的事情是將所有收集到的數(shù)據(jù)進(jìn)行預(yù)處理與分類。將數(shù)據(jù)中原有的不正確的,以及對項(xiàng)目決策利用價(jià)值的信息。在這一過程中,填補(bǔ)空缺數(shù)據(jù),糾正不一致的數(shù)據(jù),從而改善數(shù)據(jù)質(zhì)量,提高數(shù)據(jù)挖掘的精準(zhǔn)度。可以利用權(quán)威軟件進(jìn)行數(shù)據(jù)篩選例如貓眼專業(yè)版,觀影人影評等。

③知識(shí)發(fā)現(xiàn)---關(guān)聯(lián)規(guī)則模式

知識(shí)發(fā)現(xiàn):也就是數(shù)據(jù)挖掘的過程。制片人定時(shí)或隨時(shí)對上述的目標(biāo)數(shù)據(jù)集進(jìn)行知識(shí)發(fā)現(xiàn)操作,挖掘用戶感興趣的模式,即知識(shí)。本篇論文討論的是觀眾觀影行為背后有什么有趣的共同行為,即觀影共性。然后通過關(guān)聯(lián)原則模型算法進(jìn)行數(shù)據(jù)挖掘。

④決策模式

制片人將最終所決定項(xiàng)目,以投資方能理解的方式呈現(xiàn)給投資方,通過KDD技術(shù)分析過程的體現(xiàn),加強(qiáng)項(xiàng)目說服力。

4.KDD系統(tǒng)技術(shù)核心

在上述步驟中,知識(shí)的發(fā)現(xiàn)也就是所謂的數(shù)據(jù)挖掘,占據(jù)極其重要的地位,它是根據(jù)使用者需求,通過合適的,知識(shí)發(fā)現(xiàn)算法,從數(shù)據(jù)中通過挖掘工作,從而發(fā)現(xiàn)有關(guān)的知識(shí)訊息,這也決定了整個(gè)KDD過程的使用效果與處事效率。本論文中,所要進(jìn)行探討的是關(guān)聯(lián)規(guī)則模型,即制片人通過關(guān)聯(lián)規(guī)則中的算法,找到觀眾觀影行為所存在的潛在習(xí)慣。

①關(guān)聯(lián)規(guī)則定義

關(guān)聯(lián)規(guī)則就是從海量數(shù)據(jù)中,發(fā)現(xiàn)到的不同數(shù)據(jù)在同一事件中出現(xiàn)的相關(guān)性,也就是從大量數(shù)據(jù)中挖掘出不同類型數(shù)據(jù),這些頻繁的項(xiàng)目,在一個(gè)事件中,集中存在的有趣的關(guān)聯(lián)或相關(guān)關(guān)系。

這種關(guān)聯(lián)關(guān)系有可能是自身的,例如電影和爆米花;也有可能是本身毫無關(guān)聯(lián),而是通過外界因素所形成的關(guān)系,經(jīng)典的案例就是啤酒喝尿布。前一種關(guān)系我們有時(shí)候可以直觀的獲取,但后一種關(guān)系通過表面現(xiàn)象就不易獲得,而我們的關(guān)聯(lián)規(guī)則算法解決的就是這部分問題。

②關(guān)聯(lián)規(guī)則應(yīng)用

為了更直觀的理解關(guān)聯(lián)規(guī)則,我利用上述所提到的經(jīng)典案例來進(jìn)行解釋。在美國超市中,一個(gè)很奇怪的現(xiàn)象就是,如果將尿布與啤酒擺在一個(gè)貨架上賣,啤酒和尿布的銷售量會(huì)雙雙翻倍增加。這最早是由Wal-Mart數(shù)據(jù)分析人員發(fā)現(xiàn)的。Wal-Mart,作為美國曾經(jīng)的,零售行業(yè)巨頭,旗下?lián)碛惺澜缟献詈A康臄?shù)據(jù),并且有屬于自己的數(shù)據(jù)倉庫。數(shù)據(jù)分析人員的工作是為了提高超市收益,他們想通過KDD系統(tǒng),更精準(zhǔn)地了解顧客的需求,平時(shí)逛超市的購買習(xí)慣,Wal-Mart將顧客的購物行為最為目標(biāo)數(shù)據(jù),他們從數(shù)據(jù)倉庫里,集中收集了所有門店中,顧客們詳細(xì)的,交易行為數(shù)據(jù)。在這些購買記錄的基礎(chǔ)上,WalMart選擇采用關(guān)聯(lián)規(guī)則模式,對這些交易行為數(shù)據(jù)進(jìn)行分析和挖掘。讓人大吃一驚的是,尿布一直保持超高的銷售量的,但相較于其他嬰幼兒產(chǎn)品,這些顧客同尿布一起,購買最多的,卻是啤酒,這是多么奇怪但是有趣的組合。

經(jīng)過大量實(shí)際調(diào)查與跟蹤分析,數(shù)據(jù)分析人員了解到這些顧客,往往都是一些年輕的父親。他們下班后,經(jīng)常要到Wal-Mart買嬰兒尿布,而他們中有近50%的人,同時(shí)也會(huì)順手為自己買一些啤酒。其原因源于美國人的生活模式,大多數(shù)美國年輕媽媽,都會(huì)選擇在家里照顧孩子。所以,買尿布的工作就理所應(yīng)當(dāng)?shù)亟唤o了她們的丈夫。在他們下班后,路過超市,他們會(huì)習(xí)慣性的給小孩買回尿布,但也不會(huì)忘記買幾聽啤酒來犒勞自己。

這個(gè)案例同時(shí)印證了維克托·邁爾-舍恩伯格提過的一個(gè)很有指導(dǎo)意義的觀點(diǎn):通過找出一個(gè)關(guān)聯(lián)物并監(jiān)控它,利用KDD系統(tǒng),去發(fā)現(xiàn)你本不可能認(rèn)為他們會(huì)發(fā)生關(guān)聯(lián)的因素上,并以此為新的契機(jī),來開發(fā)目標(biāo)消費(fèi)群體。這也是我認(rèn)為作為制片人對大數(shù)據(jù)利用的正確方式,即通過KDD系統(tǒng)深入解讀大數(shù)據(jù),找到隱性關(guān)聯(lián),幫助制片人在策劃階段創(chuàng)新求變。

二.以《紙牌屋》為例淺析KDD在制片過程中的應(yīng)用

1.終端數(shù)據(jù)收集

對于制片人來說,首先要做到的是通過制作公司與權(quán)威網(wǎng)絡(luò)放映平臺(tái)以及影院合作,利用互聯(lián)網(wǎng)直接收集觀眾信息,掌握終端信息,建立直接聯(lián)系,作為數(shù)據(jù)收集來源。這是前提也是基礎(chǔ)。

Netflix花了一年的時(shí)間來調(diào)查觀眾的喜好,制作《紙牌屋》時(shí),充分地利用了自有播放平臺(tái)所記錄下來的數(shù)據(jù),其數(shù)據(jù)庫包含了千萬的萬用戶的收視選擇、百萬條評論、以及所有用戶的次主題搜索。Netflix將用戶觀看記錄作為目標(biāo)數(shù)據(jù),發(fā)現(xiàn)點(diǎn)播老版BBC《紙牌屋》的人數(shù)最多,并以此為出發(fā)點(diǎn),研究其背后現(xiàn)象。

2.數(shù)據(jù)預(yù)處理

Netflix 確定了目標(biāo)觀眾,過濾掉其他干擾信息,收集目標(biāo)觀眾觀看BBC《紙牌屋》的過程以及他們的后續(xù)行為。在這一過程中,Netflix會(huì)通過觀眾觀看行為來作為篩選條件,用以排除一些沒有意義而又煩瑣的數(shù)據(jù),例如我們所說的水軍刷播放量等等,從而確保數(shù)據(jù)的真實(shí)性。

數(shù)據(jù)的預(yù)處理,是對數(shù)據(jù)挖掘工作影響程度最大的一個(gè)步驟,是后面程序得以進(jìn)行的基礎(chǔ)。數(shù)據(jù)越細(xì)致與精準(zhǔn),在挖掘過程中才能找到那些有趣的聯(lián)系。制片人可以與權(quán)威網(wǎng)絡(luò)平臺(tái)與流媒體簽訂協(xié)議,共享資源,建立品牌效應(yīng),投入資金封路用戶信息,保證數(shù)據(jù)真實(shí)性,從而利于數(shù)據(jù)預(yù)處理。

3.關(guān)聯(lián)規(guī)則模型建立

①關(guān)聯(lián)規(guī)則基本模型

使用關(guān)聯(lián)規(guī)則模型,確定目標(biāo)觀眾潛在行為共性。Netflix追蹤觀看BBC《紙牌屋》的觀眾觀影記錄,發(fā)現(xiàn)其主力受眾群為“美國中年男性專業(yè)人士”。發(fā)現(xiàn)這些觀眾共頻繁點(diǎn)播政治劇,再追蹤下去,發(fā)現(xiàn)其中的一大部分人給驚悚懸疑大師大衛(wèi)芬奇拍攝的作品打分高,并且經(jīng)??词放晌髦餮莸淖髌贰_@樣一來,Netflix通過關(guān)聯(lián)規(guī)則模型,得到了隱性并且有趣的關(guān)聯(lián),政治元素與驚悚元素。

數(shù)據(jù)挖掘的算法有很多,本論文討論的是Apriori 算法,是最被人們認(rèn)可,切使用時(shí)間最長的一種算法?,F(xiàn)在,Apriori算法適合任何領(lǐng)域,我們需要大致了解一下Apriori算法。

②Apriori算法

Apriori算法,是用來挖掘目標(biāo)數(shù)據(jù)中出現(xiàn)頻繁的現(xiàn)象一種,在專業(yè)學(xué)術(shù)語言來講,我們將Apriori稱為頻繁項(xiàng)集算法,其核心思想,就是通過候選數(shù)據(jù)組成集的生成,以及目標(biāo)數(shù)據(jù)的深入挖掘,這兩個(gè)階段來挖掘有聯(lián)系的項(xiàng)與項(xiàng),之間的共同的并且有趣的關(guān)系。

在關(guān)聯(lián)模型規(guī)則中,我們需要了解三個(gè)指標(biāo),分別是支持度,可信度,提升度。為了方便了解,我們設(shè)定A代表在Netflix中點(diǎn)播BBC《紙牌屋》的觀眾同時(shí)愛看政治劇的人,B代表在Netflix中點(diǎn)播BBC《紙牌屋》的觀眾中愛看大衛(wèi)芬奇驚悚憂郁的人,C代表Netflix的所有觀眾。

所謂支持度,就是同時(shí)滿足A和B的人占C的比例。

所謂置信度,就是同時(shí)滿足A和B的人占符合A的比例。

所謂提升度,就是同時(shí)滿足A和B的人與符合B的比例。

關(guān)聯(lián)規(guī)則模型與其他模型的最大區(qū)別就在于提升度,提升度反映了關(guān)聯(lián)規(guī)則中A與B的關(guān)聯(lián)是否有趣,提升度值小于1則意味著是起反作用的,大于1則認(rèn)為是有聯(lián)系的且值越高越有意義,才能說明挖掘的關(guān)聯(lián)規(guī)則是有價(jià)值的。

我們用Netflix在制作《紙牌屋》的例子來作為說明。

上表是不完整的Netflix用戶的觀看記錄的數(shù)據(jù)庫,用來更為直觀的解釋關(guān)聯(lián)規(guī)則的運(yùn)用,

表中展現(xiàn)其中幾個(gè)觀眾的行為代號(hào)為1-6。項(xiàng)集I={點(diǎn)播BBC《紙牌屋》,??吹膶?dǎo)演,??吹难輪T,??吹念愋蛚??紤]關(guān)聯(lián)規(guī)則:A(點(diǎn)播過BBC《紙牌屋》又經(jīng)常點(diǎn)播政治劇的觀眾),1,2,4,5,6符合條件,B(點(diǎn)播過BBC《紙牌屋》又喜歡大衛(wèi)芬奇的觀眾),1,6符合條件,同時(shí)符合A和B的是1,6,因此支持度約為0.3,置信度約為0.7,提升度為1.4。提升度大于1,大衛(wèi)芬奇與政治局存在著聯(lián)系。這樣一來,Netflix發(fā)現(xiàn)點(diǎn)播BBC《紙牌屋》的用戶大多都是美國觀眾,于是Netflix將點(diǎn)播BBC《紙牌屋》的美國觀眾作為條件,將不一致數(shù)據(jù)清除掉,僅對這些美國觀眾的行為進(jìn)行追蹤,研究他們共同特點(diǎn)。

一開始,Netflix的制片人只是了解下用戶的觀影行為,不是抽樣調(diào)查,而是對所有用戶進(jìn)行調(diào)查,然后根據(jù)觀看量的排名進(jìn)行排列,發(fā)現(xiàn)美國觀眾喜歡看政治劇,發(fā)現(xiàn)貢獻(xiàn)這些數(shù)據(jù)的用戶觀影的其他關(guān)聯(lián)性,這些共同點(diǎn)是根據(jù)關(guān)聯(lián)規(guī)則算法得出來的,他們是有關(guān)聯(lián)而不是因果關(guān)系,不是說喜歡看政治局的人就一定會(huì)喜歡大衛(wèi)芬奇的作品,但是通過計(jì)算發(fā)現(xiàn)對大衛(wèi)芬奇的支持度不低,因?yàn)槭沁@兩個(gè)因素鏈接到了一起。

③決策模式形成與評價(jià)

形成項(xiàng)目決策模式。Netflix將KDD系統(tǒng)所提供的關(guān)聯(lián)信息,綜合主要用戶的潛在共同點(diǎn),邀請了大衛(wèi)芬奇作為導(dǎo)演,史派西作為主演,決定制作美版《紙牌屋》。在播放形式上,Netflix制作的《紙牌屋》不同于其他的周播劇,而是一次性播完一季。因?yàn)楦鶕?jù)KDD系統(tǒng)發(fā)現(xiàn)這些目標(biāo)人群大多不喜歡在固定時(shí)刻收看電視劇,而是直到全集播放完畢,再一次性看完。

4.通過KDD系統(tǒng)產(chǎn)生決策效果

2013年2月《紙牌屋》上線后,用戶數(shù)僅一天就增加了300萬。Netflix的成功,不是將數(shù)據(jù)分析結(jié)果直接搬用,而是通過KDD系統(tǒng)中的關(guān)聯(lián)規(guī)則模式,發(fā)現(xiàn)一些之前沒有考慮到的新的領(lǐng)域,Netflix最開始只是發(fā)現(xiàn)了用戶們對英版《紙牌屋》的關(guān)注,再將美國觀眾愛看政治劇與驚悚元素這倆之間的關(guān)聯(lián)性結(jié)合起來,在此基礎(chǔ)上再把大衛(wèi)芬奇和史派西的崇拜者拉入進(jìn)美版《紙牌屋》的這個(gè)項(xiàng)目中,同時(shí)改變播放形式,這一系列因素的關(guān)聯(lián)下,完美結(jié)合,實(shí)現(xiàn)了利益的最大化。簡而言之,《紙牌屋》的成功,歸結(jié)于對制作人通過KDD系統(tǒng)對數(shù)據(jù)進(jìn)行深度挖掘從而成就價(jià)值最大化。

三.國內(nèi)市場使用環(huán)境分析

1.國內(nèi)電影市場數(shù)據(jù)應(yīng)用

大數(shù)據(jù)這個(gè)詞,整個(gè)電影市場都在談?wù)撍胪ㄟ^大數(shù)據(jù)來提高項(xiàng)目收益。但就目前而言,國內(nèi)電影市場對數(shù)據(jù)的利用往往局限于表面現(xiàn)象,例如單純指看重瀏覽量,關(guān)注度等,單純的通過一個(gè)明星的影響力以及一個(gè)IP的好評度來武斷的進(jìn)行購買,對IP的開發(fā)只限于表面而非深層次地挖掘。

數(shù)據(jù),信息,變現(xiàn)和知識(shí)是有區(qū)別的。拿一個(gè)簡單的例子來做解釋,數(shù)據(jù)就仿佛是雞蛋和面粉,信息就是一個(gè)蛋糕坯子,表現(xiàn)就是在坯子上涂上奶油,而知識(shí),則是我們將這塊蛋糕吃掉。蛋糕的真正價(jià)值不在于你是用什么做的,你做成了什么樣,而是最終被我們吃掉。這也是數(shù)據(jù)的真正價(jià)值。

KDD系統(tǒng)與現(xiàn)在國內(nèi)電影市場對數(shù)據(jù)利用的最根本的區(qū)別是,KDD系統(tǒng)通過關(guān)聯(lián)原則對數(shù)據(jù)的加工處理,深入挖掘,得到了那些表面上也許并沒有關(guān)聯(lián)的行為,但實(shí)際上人們在不自覺中會(huì)經(jīng)常下意識(shí)地去搭配觀看的現(xiàn)象展現(xiàn)出來,給制片人提供一片嶄新的領(lǐng)域,在這個(gè)新的領(lǐng)域中,制片人尋找新的消費(fèi)點(diǎn),來創(chuàng)造出既新穎又可靠的項(xiàng)目,而不是現(xiàn)在國內(nèi)電影市場普遍存在的直接搬用數(shù)據(jù),僅僅是通過統(tǒng)計(jì),得到一個(gè)排序,然后按照熱度,來進(jìn)行項(xiàng)目更改,這種對數(shù)據(jù)淺層次的利用,不僅造成現(xiàn)在天價(jià)明星片酬,電影成本提高的現(xiàn)象,也埋沒了很多有內(nèi)容,有質(zhì)量,踏踏實(shí)實(shí)的作品。當(dāng)然,比制片人更看重這些數(shù)據(jù)的是投資方,在電影立項(xiàng)過程中,通過KDD系統(tǒng)對數(shù)據(jù)處理的展示,加強(qiáng)項(xiàng)目的說服力,提供一個(gè)好的開始,最終形成一個(gè)口碑與票房雙贏的結(jié)果。

2.國內(nèi)市場引入KDD系統(tǒng)的雛形

我仔細(xì)查閱了《捉妖記》的項(xiàng)目策劃過程,發(fā)現(xiàn)《捉妖記》的策劃過程中已經(jīng)有了KDD系統(tǒng)的流程雛形,提供了給KDD系統(tǒng)滋生的土壤,只是還沒有成熟的應(yīng)用方法。

許誠毅與江志強(qiáng)的探討中,早就有過《捉妖記》的想法,但直到開始實(shí)際拍攝,中間足足經(jīng)過了5年。這5年的時(shí)間里,他們一直在聊故事,兩個(gè)人都想創(chuàng)作一部講中國妖怪的電影。隨后的決策過程與KDD系統(tǒng)流程十分相似:

數(shù)據(jù)篩選:項(xiàng)目類型確定后,江志強(qiáng)將目標(biāo)調(diào)查對象確定為喜歡看奇幻妖魔電影的觀眾,并對其行為進(jìn)行全面的信息收集。

數(shù)據(jù)預(yù)處理:通過權(quán)威的網(wǎng)絡(luò)播放平臺(tái)作為來源,確保數(shù)據(jù)的真實(shí)性。并去除不愛觀看奇幻妖魔電影的這些不一致的觀眾數(shù)據(jù)。

知識(shí)發(fā)現(xiàn):江志強(qiáng)曾在采訪中說,他們發(fā)現(xiàn)到喜歡看奇幻題材的用戶對《山海經(jīng)》和《聊齋》的搜索量最高。并找到了一個(gè)叫作《宅妖》的小故事頗受歡迎,而這些觀眾對《史瑞克》等動(dòng)畫類型的電影點(diǎn)播量很高。這意味著雖然是講妖怪,但他們以“萬物有靈且美”的主旨,證明善與美是觀眾們都愿意接受的價(jià)值。這一過程其實(shí)就是我們所說的采用關(guān)聯(lián)規(guī)則模式,尋找目標(biāo)觀眾之間所存在的潛在關(guān)聯(lián)。

形成知識(shí):最終江志強(qiáng)與許誠毅的《捉妖記》是一個(gè)適合一家人去觀看的全家歡電影,而不是恐怖片。影片中所創(chuàng)造出來的妖怪胡巴,也廣被觀眾所接受喜愛,最終獲得了可觀的票房成績,并成功。

四.KDD系統(tǒng)的優(yōu)勢與規(guī)避風(fēng)險(xiǎn)方法

1. 使用KDD系統(tǒng)優(yōu)勢

KDD系統(tǒng)本身具有對數(shù)據(jù)處理迅速的優(yōu)勢,高效的反饋觀眾信息,定位受眾群,確定數(shù)據(jù)中潛在新穎的關(guān)聯(lián)形成決策模式。

KDD系統(tǒng)的使用目的是避免“行外人”盲目利用數(shù)據(jù),幫助制片人創(chuàng)新求變。它不是單純地進(jìn)行數(shù)據(jù)分析及搬運(yùn),而是通過對數(shù)據(jù)的分析幫助制片人進(jìn)行創(chuàng)作,在對數(shù)據(jù)深入挖掘的基礎(chǔ)上尋找新的視角,完成立項(xiàng),既符合觀眾的習(xí)慣性思維方式,又進(jìn)行了創(chuàng)新,滿足了觀眾對新事物的期待,以及對創(chuàng)作者的交代。

KDD系統(tǒng)挖掘結(jié)果是關(guān)注的相關(guān)性而不是因果關(guān)系,并不是完全符合數(shù)據(jù)的作品就可以成功,它僅能反映出觀眾的態(tài)度,但不能告訴制片人你要拍什么。最終決定電影質(zhì)量好壞的是電影自身內(nèi)容,因此,通過KDD系統(tǒng)提供的結(jié)果是需要制片人潛在的,深入的,制片人對所提供的數(shù)據(jù)進(jìn)行進(jìn)一步思考,來確保電影的高質(zhì)量以及低風(fēng)險(xiǎn)。

2.使用KDD系統(tǒng)面對的難題

①數(shù)據(jù)全面真實(shí)

與其他數(shù)據(jù)分析系統(tǒng)一樣,都必須要面對的一個(gè)最關(guān)鍵,最棘手的問題,就是你收集來的分析對象,是否真的仔細(xì)看過影片,不帶個(gè)人思想偏見,可以代表影片真正的目標(biāo)觀眾。熱衷在社交網(wǎng)絡(luò)上發(fā)言的網(wǎng)民,有哪些是真的認(rèn)真觀看過影片的,又有多少是宣傳方雇來炒作的水軍,又是否能否代表那些常年不發(fā)言,就默默地看電影的人。

現(xiàn)在,那些精確海量的數(shù)據(jù),都被掌控在電商,社交平臺(tái),視頻網(wǎng)的后臺(tái)中,為了市場競爭優(yōu)勢,他們手中的數(shù)據(jù)相對機(jī)密,不容易直接獲取。

②數(shù)據(jù)是否隱私

用戶隱私問題一直是數(shù)據(jù)挖掘應(yīng)用難以繞開的一個(gè)問題,如被央視曝光過的網(wǎng)易郵箱,蘋果電腦都涉及侵犯用戶隱私。目前,中國并沒有專門的法律法規(guī)來界定用戶隱私,處理相關(guān)問題時(shí)多采用其他相關(guān)法規(guī)條例來解釋。但隨著民眾隱私意識(shí)的日益增強(qiáng),合法合規(guī)地獲取數(shù)據(jù)、分析數(shù)據(jù)和應(yīng)用數(shù)據(jù),是進(jìn)行數(shù)據(jù)挖掘必須要遵守的原則。

3.規(guī)避風(fēng)險(xiǎn)措施

據(jù)咨詢,貓眼和豆瓣的后臺(tái)都具有放水軍的軟件。豆瓣上的口碑相對準(zhǔn)確,但人群偏文藝。貓眼的數(shù)據(jù)相對真實(shí)些。如何判斷數(shù)據(jù)是否真實(shí),目前有幾種方法。

①真實(shí)口碑和走勢曲線是否相符合

例如在沒有任何營銷事件的情況下,某部影片增長了大量的想看人數(shù),這基本斷定是水軍。貓眼上的電影數(shù)據(jù)曲線是真實(shí)反映的。

②購票用戶的評價(jià)要比一般用戶的評價(jià)權(quán)重高,這是目前放水軍刷口碑的一種方法。

③大多制片人對影片的分析,及類型的分析,一般會(huì)把前三天的數(shù)據(jù)拋去,因?yàn)橐话阗I票房會(huì)集中在首日或者周末,前三天的客觀因素太多,例如票補(bǔ)和自購等。拋去前三日的數(shù)據(jù),相對真實(shí)。

④國家政策的支持,嚴(yán)重懲戒票房作假的政策出臺(tái),勢必會(huì)在一定程度上打壓造假行為,使數(shù)據(jù)變得相對真實(shí)些。

4.避免制作公司壟斷上下游

據(jù)了解,目前公司壟斷是造成數(shù)據(jù)水分大的原因之一。以《捉妖記》為例,安樂(北京)電影發(fā)行有限公司,其播放期長達(dá)64天,安樂這樣制發(fā)放,包括院線全部都參與公司,因?yàn)榻?jīng)濟(jì)利益的問題,肯定會(huì)在自己的影城百老匯里注水。當(dāng)然還有一個(gè)原因是為了超越同檔期的速7,拿到中影冠軍。

在舊好萊塢的制片廠制的壟斷下,包括明星,影片題材等都出現(xiàn)來問題。因?yàn)槌鰜砹朔磯艛喾?,然后便進(jìn)入了新好萊塢時(shí)代。

那如果將電影制作工業(yè)線上的每個(gè)部門都拆開了,避免出現(xiàn)一個(gè)公司壟斷全過程的現(xiàn)象,這樣每個(gè)部門之間沒有利益關(guān)系,會(huì)不會(huì)在一定程度上減少注水現(xiàn)象。

5.制片人通過社交平臺(tái)直接與觀眾建立互動(dòng)關(guān)系

麻省理工學(xué)院出版的《流媒體,分享,竊取》一書中提到,制片人對電影市場的敏感度是十分重要的,通過與觀眾的溝通,建立與消費(fèi)者的直接聯(lián)系,而不僅是依賴于發(fā)行商進(jìn)行內(nèi)容宣傳與推廣。應(yīng)用數(shù)據(jù)分析有諸多阻礙,也并不能保證制作出來的影片可以成功個(gè),但KDD系統(tǒng)的最大優(yōu)勢是幫助制片人尋找新的巨大機(jī)遇,這就需要制片精英人士來進(jìn)行操作。

因此,為了保證互動(dòng)性,制片人應(yīng)充分利用社交網(wǎng)絡(luò)和粉絲社群或建立網(wǎng)站,以成為直接數(shù)據(jù)來源,例如傳奇影業(yè)在數(shù)據(jù)分析部門投入大量人力和財(cái)力,從微博,百度,豆瓣,天貓等票務(wù)軟件等多渠道獲取數(shù)據(jù),從而方便制片人與觀眾更好地進(jìn)行交流。

6.制片人與流媒體建立合作關(guān)系

Netflix僅將“好萊塢電影”就分出了近8萬種“微類型”。通過拓寬數(shù)據(jù)的來源,數(shù)據(jù)收集會(huì)全面很多,近年來制片人也在嘗試首輪放映與流媒體同步發(fā)行,隨后,制片人,放映商,流媒體平臺(tái)可以通過共享數(shù)據(jù),了解觀眾對各種類型電影的喜好,最終實(shí)現(xiàn)共贏。

總 結(jié)

數(shù)據(jù)永遠(yuǎn)只能作為輔助,靈魂永遠(yuǎn)是主創(chuàng)團(tuán)隊(duì)。夢工廠CEO卡森伯格就曾表示:“電影靠創(chuàng)造力,不靠數(shù)據(jù)分析。當(dāng)年卡梅隆創(chuàng)作《阿凡達(dá)》的時(shí)候,假如當(dāng)初對觀眾進(jìn)行調(diào)查,問他們是否想看《阿凡達(dá)》,觀眾可能根本不知道他在說什么,如果隨了這種對數(shù)據(jù)的淺層分析,也許就不會(huì)有《阿凡達(dá)》的誕生了。

對數(shù)據(jù)的判斷,以及對數(shù)據(jù)的運(yùn)用,才是影視數(shù)據(jù)挖掘最關(guān)鍵的一步。深厚的影視經(jīng)驗(yàn),專業(yè)知識(shí)素質(zhì),以及對市場的敏感度都是必不可少的。這也是中國影視數(shù)據(jù)界的最大的矛盾,懂技術(shù)的不懂電影,懂電影的不懂技術(shù)。正是因此,我才會(huì)想要嘗試引入KDD系統(tǒng),因?yàn)镵DD系統(tǒng)并不是單純的數(shù)據(jù)分析,數(shù)據(jù)分析得到是將數(shù)據(jù)整合,得到一種統(tǒng)計(jì)結(jié)果,這些結(jié)果是誰都可以得到的,并不新鮮。但KDD技術(shù)是在這些基礎(chǔ)處理上,根據(jù)當(dāng)前市場條件以及業(yè)務(wù)結(jié)合進(jìn)行解讀,通過算法進(jìn)行知識(shí)發(fā)現(xiàn),給予制片人靈感,才能發(fā)揮出數(shù)據(jù)的價(jià)值與作用。

KDD系統(tǒng)重點(diǎn)在于幫助制片人尋找未知的模式與規(guī)律,尋找新的可以開發(fā)的領(lǐng)域,是幫助制片人打開創(chuàng)作思路,在制片人進(jìn)行決策過程中,引入KDD系統(tǒng),是為了在彌補(bǔ)過于重視大數(shù)據(jù)統(tǒng)計(jì),一味地去迎合觀眾的口味,來開發(fā)影視作品這一現(xiàn)象。對于影視來說,作品本身的質(zhì)量才是最重要的。

KDD系統(tǒng)會(huì)與普通的數(shù)據(jù)分析軟件一樣成列出制片人所制定觀眾們都喜歡看的題材,并且將他們之間的有趣的關(guān)系展現(xiàn)在制片人面前,而制片人需要做的是下功夫想出一個(gè)與眾不同的講故事的方式,用專業(yè)、有深度的劇情留住目標(biāo)觀眾。否則,就會(huì)出現(xiàn)全明星高顏值陣容,大熱IP,投資巨大然后票房成績卻差強(qiáng)人意的現(xiàn)象。

觀眾的審美在不斷地提高與變化,他們在網(wǎng)絡(luò)上上傳的評論與意見、網(wǎng)頁的瀏覽痕跡,這些展示的是觀眾的喜好,但這里的陳列出來的觀眾的喜好,只是暫時(shí)的,靜態(tài)的。在這些表象之下,只有看到那些可開發(fā)的未經(jīng)觸碰的新的領(lǐng)域,才能充分地利用數(shù)據(jù)所提供的真正價(jià)值,創(chuàng)新是永恒的目標(biāo)。而這些新的領(lǐng)域,是可以通過KDD系統(tǒng)產(chǎn)出的,因此,我認(rèn)為將KDD系統(tǒng)引入到制片人進(jìn)行項(xiàng)目決策過程中,幫助制片人開拓領(lǐng)域這一作用是不可缺少的。

當(dāng)然,引入KDD系統(tǒng)的另一大目的是為了提高制片人所開發(fā)項(xiàng)目的說服力,如今,各個(gè)領(lǐng)域的公司都將手伸入到影視制作行業(yè)當(dāng)中,其中很多人并不了解電影藝術(shù),所以在他們看來,數(shù)據(jù)能說明一切。制片人通過KDD系統(tǒng)得到的數(shù)據(jù)知識(shí),呈現(xiàn)在投資方面前,讓他們通過數(shù)據(jù)直觀的了解該項(xiàng)目的市場環(huán)境,受眾面等等,也許會(huì)比制片人苦口婆心的去解釋項(xiàng)目的新意要直接得多。

(責(zé)任編輯:牧鑫)

猜你喜歡
大數(shù)據(jù)
基于在線教育的大數(shù)據(jù)研究
“互聯(lián)網(wǎng)+”農(nóng)產(chǎn)品物流業(yè)的大數(shù)據(jù)策略研究
基于大數(shù)據(jù)的小微電商授信評估研究
大數(shù)據(jù)時(shí)代新聞的新變化探究
淺談大數(shù)據(jù)在出版業(yè)的應(yīng)用
“互聯(lián)網(wǎng)+”對傳統(tǒng)圖書出版的影響和推動(dòng)作用
大數(shù)據(jù)環(huán)境下基于移動(dòng)客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
吴桥县| 灯塔市| 临泉县| 江达县| 莆田市| 滦南县| 东兴市| 大宁县| 凤山县| 织金县| 治多县| 太仓市| 石城县| 鹤峰县| 甘德县| 藁城市| 甘南县| 乐安县| 郎溪县| 呼玛县| 抚宁县| 错那县| 林州市| 阜宁县| 盘锦市| 哈巴河县| 长顺县| 虹口区| 白水县| 即墨市| 鄂温| 成武县| 丰原市| 德保县| 泸西县| 新平| 临猗县| 慈溪市| 文安县| 汾阳市| 昌图县|