陳婧
眼前是231塊LED屏幕,每隔幾秒,每塊屏幕上都會閃現(xiàn)不同的詞語或句子的片段,“女孩”、“有翅膀的天使”,“墨西哥人”這些不著四六的文字,其實是從在線聊天工具、在線開放式論壇上交談的10多萬名用戶的信息中截取的數(shù)據(jù)片段??梢⒁獾氖?,這些文字并不是滯后才“發(fā)布”的,幾秒前你剛剛敲落在鍵盤上的文字,這個時候已經(jīng)出現(xiàn)在了這一塊塊小小的屏幕之上。
你的耳邊還會得到提示,因為這些文字正在通過機器合成的聲音進行自動播報。不要以為這是個隨機現(xiàn)象,其實231塊屏幕的背后蘊含著至少6組統(tǒng)計規(guī)律。只有在符合特定的篩選機制后,計算機軟件才會實時地從不規(guī)則的數(shù)據(jù)中,抓取出需要顯示的信息。當機器相繼播報出這些符合篩選規(guī)律的句子時,就已經(jīng)幾乎成為了一種讓人可以安靜下來“白噪音”,讓你可以坐在那里幾個小時,只為了仔細聆聽這些句子表達出的內容。有意思的是,這些機器的聲音聽起來很遙遠,很失真,像來自于另一個外星空間的電波,被重新發(fā)射回到了地球上。
這件名叫《監(jiān)聽站》的作品,雖然問世時間不久,卻已然成為了當代藝術的經(jīng)典,在包括倫敦科學博物館、巴黎維萊特科技館、美國圣何塞藝術博物館等多地巡回展出,并奪得奧地利林茨電子藝術大獎。創(chuàng)作這件作品的作者,是美國加州大學洛杉磯分校的統(tǒng)計學教授馬可·漢森(Mark Hanson)和來自紐約的多媒體藝術家本恩·魯賓 (Ben Rubin)。漢森用一個數(shù)學家的方式,從數(shù)據(jù)篩選的角度,解讀了由人構成的“互聯(lián)”世界和他們的行為變化,讓數(shù)據(jù)做到了“可讀”;魯賓和漢森一起,讓更多的聽眾可以“收聽”數(shù)據(jù)的分析結果。
《監(jiān)聽站》與傳統(tǒng)的對數(shù)據(jù)進行視覺轉化的最大不同之處,在于其并非依靠現(xiàn)有的資料或嵌入式的運行環(huán)境,而是展示了一個需要對數(shù)據(jù)進行即時響應的動態(tài)環(huán)境,從數(shù)以十萬計的創(chuàng)作者中,運用統(tǒng)計學和數(shù)據(jù)模型,去發(fā)現(xiàn)、獲得有意義的輸出。雖然采用的方法是“竊聽”和“偷窺”,但這種方式本身也顯得“人性化”,就像在偷看好友鎖在抽屜里的一本日記,或是偶然忍不住去看朋友手機里儲存著的短消息。
每時每刻,我們都在線上遇到朋友、交換新聞、交互信息或是分享想法。這些數(shù)量為天文級的、碎片式的信息經(jīng)過數(shù)據(jù)的重組、排列和篩選之后,就不再只作為公共空間里的數(shù)據(jù)而存在,而是呈現(xiàn)了人與人之間相互連接的一種行為模式。而且,數(shù)據(jù)可視化呈現(xiàn)出的效果,讓我們得以擺脫社交活動的表象而進入到更深層次:我們的意見、想法、希望、理性,都可以從這些互聯(lián)網(wǎng)上實時截取的文字段落中得到表達,重新歸類,最終再通過機器復讀的形式得到強化。對數(shù)據(jù)的重新演繹,讓互聯(lián)網(wǎng)上零散的、碎片化的信息獲得了真正的意義和價值。
大數(shù)據(jù)時代,各個跨行業(yè)的公司都在千方百計地匯總數(shù)據(jù)來精確定位數(shù)字、趨勢和模式。但隨著數(shù)據(jù)環(huán)境變得越來越復雜和繁瑣,也向管理這些數(shù)據(jù)并提取數(shù)據(jù)價值的組織提出了一個挑戰(zhàn):怎么樣才能以更加巧妙的方式截取數(shù)據(jù),并讓這些碎片化的互動式數(shù)據(jù)獲得價值?交互式大數(shù)據(jù)的可視化與可分析化還停留在較為初步的階段,怎么樣可以打開這道未知的大門,讓更多的即時數(shù)據(jù)的價值被發(fā)現(xiàn)?就這些話題,記者采訪了漢森,與他一起交流在大數(shù)據(jù)時代,怎么樣從即時數(shù)據(jù)背后去挖掘人類行為上的差異性與共性,如何在保留個性化的前提下,去優(yōu)化交互式數(shù)據(jù)的可視化傳播。
Q:你們怎么會想到去截取互聯(lián)網(wǎng)上的即時信息作為輸入端的數(shù)據(jù)呢?
A:我曾經(jīng)在貝爾實驗室的研發(fā)部門工作,在那里我開始關注到統(tǒng)計學與藝術之間的交互,并意識到這會成為一件非常有意思的事情。當時我們的想法很簡單,就是想知道假如10萬人同時在線互動聊天,在這個過程中到底發(fā)生了些什么,于是就有了《監(jiān)聽站》。在互聯(lián)網(wǎng)上,有成千上萬的不設限制的站點,都可以讓計算機進行即時搜索,從發(fā)帖、留言,再到用戶間的對話。當這些文字匯入到數(shù)據(jù)庫中,將數(shù)據(jù)重新定義、排序、篩選并經(jīng)過系統(tǒng)的分析之后,數(shù)據(jù)分析的結果就會給我們講很多故事。比如《監(jiān)聽站》很像是在寫人物傳記,每個人都在說著自己的故事。它也可以成為歷史故事:當你把《紐約時報》創(chuàng)刊100多年來的讀者評價作一次系統(tǒng)的分析,或者當你把圖書館里所有的書籍來個數(shù)據(jù)匯總,就會有這么一個效果。
Q:這讓我們想到美國著名作曲家、音樂家約翰·凱奇創(chuàng)作的那些即興音樂,他從電臺播放的音樂中隨機選出音樂片段和歌詞,然后進行重新創(chuàng)作。
A:和約翰·凱奇一樣,我想這都是另一種“偷窺”世界的方式。在音樂的歌詞中,你會聽到歌手對這個世界的抱怨或是贊美,憤怒或是喜悅。而在即時的對話中,你會聽到大家對這個世界的真實想法,這些想法之間可能是針鋒相對的,但都是由他們自己表達出來的,所以你聽到的是他們發(fā)自內心的聲音,比如對美國出兵作戰(zhàn)的想法,對佛羅里達南部發(fā)生颶風的想法,對俄羅斯發(fā)生人質綁架案的想法等等,盡管這件作品本身是不存在特定立場的。你可以聽到的還有他們最真實的自我,“我喜歡藍色”、“我喜歡咖啡”、“我喜歡貓”,都是不用去遮掩或怯于表達的,不管是虛構的或是真實的。
Q:從數(shù)據(jù)池篩選數(shù)據(jù)的過程中,你設定它們應當滿足哪些規(guī)律?
A:我設計了6組場景,背后應用了不同的統(tǒng)計規(guī)律,分組并滾動式地出現(xiàn)在231塊屏幕上。比如有一組場景,都以“我是”開頭,計算機會從龐大的“數(shù)據(jù)池”中篩選到符合這一類場景的信息,截取關于性別、國籍、政治傾向等自我介紹的語句,然后輸出到屏幕上:舉個例子來說,“我是澳大利亞人”,“我很性感但不成熟”,“我在為我的兒子做飯”。還有的以“我喜歡”、“我來自”等等作為句首,都應對了不同的統(tǒng)計學運算模型。我還和魯賓一起研究了將文字轉化成聲音的軟件,最后讓3臺計算機可以同時截獲互聯(lián)網(wǎng)上的內容并進行朗讀。事實上,因為我們截取數(shù)據(jù)的實時樣本來自超過10萬人,這要求對詞匯篩選的速度比瀑布飛濺還要快。
Q:屏幕上展示的詞匯,僅僅是為了表達他們的多元化和個性么?
A:當用戶使用聊天工具或者進入論壇時,他就進入了“與他人交往”的狀態(tài)。在鍵盤前敲擊的時候,他才真正進入到了那個“社區(qū)”,他會在對話中感受到差異,也感受到那種交互。他的輸入,因此也成為了另一種形式的輸出。但“社交”的狀態(tài)并不代表他的個性非常擅長這些,相反,他可能正處于孤獨、隔絕中。所以在這一塊塊屏幕上,他們內心真正的孤獨,變得可以聽得到、可以見得到、也可以感受得到。在個性化的表達中,你會從中發(fā)現(xiàn)更多共性的存在,就是那種對心貼心交流的那種渴望,對人與人之間充滿人情味互動的渴望。
Q:有人說這件作品最成功的地方,在于把作曲家一直想做但沒有做到的事情,把普通生活化的語言,變成了一種可視聽的藝術。
A:讓即時的、動態(tài)的數(shù)據(jù)變得可視化的同時又很藝術,是很多人都在追求的東西。但其實這和傳統(tǒng)的繪畫藝術很像,你要學會去把握局部和整體之間的關系,局部的東西是在描寫細節(jié),但畫面作為一個整體就要能夠去包容,很抽象、很概括。在我看來還有一點非常重要,你要學會去銜接“閱讀”和“觀看”之間的通道,這兩者雖然都是用眼睛在看,但并不是等同的。舉個例子來說,有一副基督的畫像,遠觀的時候就是耶穌的頭像,但實際上它由600幅圖像拼湊而成,每一幅圖像本身也是可以供閱讀的,是用希伯來語和阿拉姆語在紙草、皮革上寫成的死海手卷。
Q:要實現(xiàn)大數(shù)據(jù)可視化的最優(yōu),您認為哪些因素是非常重要的?
A:我最近在和紐約的藝術家耶·索普一起從事社交媒體的可視化項目,比如Twitter的可視化。大數(shù)據(jù)的可視化最大的不同之處在于,對實時響應的要求非常高,就像汽車的儀表盤,必須能夠反映當下的、動態(tài)的數(shù)據(jù);同時不僅僅讓你看到你的網(wǎng)絡里哪些人,而且要能夠把握對你的用戶來說,哪些分享和他們之間是更加有關聯(lián)的。大數(shù)據(jù)的可視化最不能忽視的關鍵的一點,在我看來,是尊重數(shù)據(jù)表達的個性化需求。我們不能讓所有的數(shù)據(jù)都用看起來一模一樣的方法去呈現(xiàn),否則就是一種非常懶惰的做法,一組數(shù)據(jù)和另一組數(shù)據(jù)之間的表達往往是存在差異的,我們需要去找到最漂亮的那種方式。
Q:在您看來,大數(shù)據(jù)的可視化可以發(fā)揮哪些社會價值?
A:我們每天都在產(chǎn)生數(shù)據(jù),每天都在消費數(shù)據(jù),數(shù)據(jù)已經(jīng)變成我們日常生活的一部分。然而我們并沒有從文化上完全認識到這種轉變,這種轉變意味著什么,這樣的轉變會帶來什么。
從藝術的角度來看,大數(shù)據(jù)的可視化可以起到讓數(shù)據(jù)更加“人性化”的作用,從而幫助人們認識到這樣的轉變已經(jīng)發(fā)生,而且可以變得更加美好?;蛟S,這一切的終極目的就是讓數(shù)據(jù)變得更加實用。我會希望數(shù)據(jù)和人性化之間有更多的對話,理性與感性之間可以達到更完美的平衡。