杜春鳳 杜 晴 朱慶華 孫霄凌
(1. 南京大學(xué)信息管理學(xué)院 南京 210023;2. 南京郵電大學(xué)管理學(xué)院 南京 210003)
近年來,以微博和微信為首的社交媒體迅猛發(fā)展,并不斷影響和改變著人們的現(xiàn)實生活。社交媒體(Social media,又稱社會化媒體)最早由Mayf i eld在其著作What is social media中提出,他認為社交媒體具有參與、公開、交流、對話、社區(qū)化、連通性六大特征,是一種能夠給予用戶極大的參與空間的新型媒體[1]。在我國,社交網(wǎng)絡(luò)用戶不斷增加,截至2015年年底,中國互聯(lián)網(wǎng)用戶規(guī)模達6.9億人,其中社交網(wǎng)絡(luò)用戶占比高達92.8%[2]。在此背景下,如何使用戶從大量社交媒體的海量數(shù)據(jù)中迅速找到自己所需的信息,成為研究的熱點之一??捎眯匝芯孔畛跽Q生于人機交互領(lǐng)域,之后被圖書情報學(xué)、軟件工程等其他領(lǐng)域?qū)W者所引用,目前已經(jīng)廣泛應(yīng)用于各類網(wǎng)站和軟件設(shè)計中,但暫時尚未有對社交媒體的相關(guān)可用性研究。
目前,學(xué)界基于社交媒體的研究主要涉及社交媒體的理論研究[3-4]、社交媒體的用戶研究[5-6]、社交媒體的商業(yè)應(yīng)用[7-8]及社交媒體環(huán)境下的信息倫理問題[9-10]等,關(guān)于社交媒體平臺搜索系統(tǒng)的可用性研究并無多見,大部分都是關(guān)于用戶搜索行為的研究[6,11]。本研究選擇新浪微博(移動客戶端)平臺的搜索系統(tǒng)作為研究對象,新浪微博作為全球最具影響力的中文社交媒體平臺之一,其搜索系統(tǒng)的影響力也越來越大,截至2015年11月,新浪微博搜索每日用戶主動搜索量已突破2億[12]。同時,由于微博信息具有發(fā)布自由、文本簡短、語言組織松散、更新消亡迅速等特征,用戶想要快速、全面地獲取信息變得困難。然而,目前關(guān)于微博搜索的研究大都集中在排序方法、結(jié)果優(yōu)化等技術(shù)方面上[13-14],鮮有從用戶角度對搜索系統(tǒng)的可用性進行研究。
鑒于新浪微博廣泛的影響力以及數(shù)據(jù)的可獲得性,本文將結(jié)合啟發(fā)式評估法和用戶測試法對其可用性進行研究,旨在發(fā)現(xiàn)新浪微博的搜索系統(tǒng)存在哪些可用性問題,如何進行改進,從而使得用戶有更好的搜索體驗。希望本研究可以為相關(guān)社交媒體平臺搜索系統(tǒng)的開發(fā)和設(shè)計提供借鑒。
可用性(Usability)一詞來源于人機交互領(lǐng)域“對用戶友好(User-friendly)”這一概念,指 “特定的用戶在特定的使用場景下,為了達到特定的目標(biāo)而使用某產(chǎn)品時,所感受到的有效性(Effectiveness)、效率(Eff i ciency)及滿意度(Satisfaction)”[15]。有效性是指用戶能夠達成自己的目標(biāo);效率是指用戶不必做無用功,就能以最短路徑達成目的;滿意度是指既使有效性和效率兩方面沒有大問題,也要從更深層面來考慮,即有沒有給用戶帶來不愉快的體驗。
可用性作為一個非常抽象且定義模糊的概念,難以對其進行直接評價,因此研究者常常退而求其次,將其劃分為不同屬性來進行研究[16]。許多研究者根據(jù)所評價的具體系統(tǒng)的特征,概括出可用性評價的指標(biāo)體系,并通過評估指標(biāo)體系中所包含的各項具體指標(biāo)來達到評估系統(tǒng)整體可用性的目的[17]。傳統(tǒng)信息系統(tǒng)的可用性評估指標(biāo)較為明確,且內(nèi)容相對統(tǒng)一(如表1中的1、2)。近年來,隨著互聯(lián)網(wǎng)應(yīng)用的大規(guī)模普及,可用性評估指標(biāo)加入了一些新準(zhǔn)則,主要可分為兩大類:關(guān)注內(nèi)容的可用性評估指標(biāo)(如表1中的3、4)和關(guān)注用戶的可用性評估指標(biāo)(如表1中的5、6)。從研究思想上看,關(guān)注內(nèi)容的可用性指標(biāo)研究,可以看成是傳統(tǒng)信息系統(tǒng)可用性評估思想在互聯(lián)網(wǎng)時代的進一步發(fā)展;而關(guān)注用戶的可用性指標(biāo)研究則更多的從用戶行為分析的角度進行可用性指標(biāo)體系構(gòu)建。
表1 可用性評估指標(biāo)對比
雖然可用性評估指標(biāo)被劃分為關(guān)注內(nèi)容和關(guān)注用戶兩種,但并不代表前者就不關(guān)注用戶,后者不關(guān)注內(nèi)容,只是這兩種評估體系的出發(fā)點不同。從具體指標(biāo)的構(gòu)成上看,兩種評估體系的區(qū)別實際上并不明顯。Nielsen在分析了很多產(chǎn)品的可用性問題后,提煉出了隱藏在背后的產(chǎn)品可用性原則,這些原則被稱為啟發(fā)式評估十原則,包括系統(tǒng)狀態(tài)的可視性,系統(tǒng)和現(xiàn)實的協(xié)調(diào),用戶操控與自由程度,一貫性和標(biāo)準(zhǔn)化,防止錯誤,識別好過回憶,靈活性和效率,簡潔美觀的設(shè)計,幫助用戶認知、判斷及修復(fù)錯誤,幫助文檔及用戶手冊[23]。本文的評估指標(biāo)則是在傳統(tǒng)Nielsen評估十原則的基礎(chǔ)上,結(jié)合新浪微博特征,綜合內(nèi)容和用戶兩個角度建立的。
可用性評估的方法比較多,常見的有啟發(fā)式評估(Heuristic evaluation)、用戶測試(User testing)、有聲思維(Think-aloud)、焦點小組討論(focus groups)、認知走查(Cognitive walkthrough)、問卷調(diào)查(Questionnaires)、卡片分類(Card sort)、紙上原型(Paper prototyping)等方法[24]。其中使用最多的兩種方法是啟發(fā)式評估法和用戶測試法[25]。
啟發(fā)式評估法是最早使用的經(jīng)典可用性評價方法之一,它是由Nielsen提出的一個“廉價可用性工程方法(Discount Usability Engineering Methodology)”[26]。啟發(fā)式評估法的大致思想是:評估者利用一組相對簡單、通用、有啟發(fā)性的啟發(fā)式可用性原則作為測試指導(dǎo),評定待評估產(chǎn)品是否符合這些原則,并找出該產(chǎn)品的可用性問題,列出可用性問題列表。啟發(fā)式評估是一種高效而又低成本的評估方法,且成功率較高,通常只需要3~5位可用性專家就可以檢測出產(chǎn)品中出現(xiàn)的大部分(75%~80%)可用性問題[26]。但啟發(fā)式評估法也存在一定的局限性,如對評價者要求較高,而有經(jīng)驗的評價專家資源又較為稀缺;此外,啟發(fā)式評估的過程沒有涉及到真實的用戶,因此評估結(jié)果往往不能體現(xiàn)用戶真正的需求。
用戶測試法是可用性評估的另一個重要方法,它通過邀請用戶完成特定操作任務(wù),并觀察、記錄和分析用戶的行為和相關(guān)數(shù)據(jù),從而對產(chǎn)品的可用性進行評估。通常,用戶測試法采用直接觀察、大聲思考、錄像記錄、訪談、問卷等方法來搜集測試用戶的行為反應(yīng)數(shù)據(jù)。與啟發(fā)式評估法相比,用戶測試法是基于真實用戶數(shù)據(jù)進行的評估,因此能夠直接反映真實用戶的需求,從而發(fā)現(xiàn)產(chǎn)品真正的可用性問題。用戶測試法的缺陷是會受到測試環(huán)境、所用設(shè)備、受測人員、測試任務(wù)等各種因素的影響,因此在進行用戶測試時要盡可能提供真實的環(huán)境、完成實際的任務(wù)、招募有代表性的用戶。
在實際進行可用性評估時,往往可以采用組合方法進行評估以彌補單個方法本身的不足。在Nielsen的一項研究中,啟發(fā)式評估找到了42%的“大”問題和32%的“小”問題(問題的“大小”是以其重要性來評判的),因此他認為啟發(fā)式在細節(jié)問題上的弱點需要通過用戶測試來補足,盡管這兩種方法的結(jié)果在某種程度上有所重合,但總體上還是兩類存在顯著差異的可用性問題[27]。因此,本研究采用啟發(fā)式評估和可用性測試結(jié)合的方法對微博搜索的可用性進行研究。
Nielsen的啟發(fā)式評估十原則是可以廣泛應(yīng)用于各種各樣的用戶界面設(shè)計和評估中的“一般法則”,然而這些原則是1995年提出的,隨著科技的發(fā)展、交互平臺的多樣化,這些準(zhǔn)則已經(jīng)不能涵蓋現(xiàn)代社交媒體平臺的新特性[28];此外,啟發(fā)式評估是關(guān)于網(wǎng)站可用性評估的通用準(zhǔn)則,新浪微博搜索有不同于一般網(wǎng)站的特性。鑒于此,本文結(jié)合傳統(tǒng)啟發(fā)式評估原則和微博特征確立了適合微博搜索的啟發(fā)式評估原則(如表2所示)。
表2 新浪微博搜索的可用性評估原則
本研究在實施啟發(fā)式評估時,選擇了對新浪微博搜索很熟悉的4位圖書情報專業(yè)碩士研究生作為評估人員。根據(jù)上文的啟發(fā)式評估原則,評估者們尋找并記錄微博搜索中的可用性問題,并與上述啟發(fā)項進行匹配,啟發(fā)式評估結(jié)果如下所示:
(1)系統(tǒng)狀態(tài)的可視性。系統(tǒng)狀態(tài)的可視性是所有軟件產(chǎn)品都必須遵循的可用性原則。微博是一個具有海量信息的社交媒體,能否快速找到微博搜索的入口是很重要的一方面, 微博主頁有兩個搜索入口,一個是頁面上方的快捷入口,一個是頁面下方的搜索主頁面入口(如圖1左所示)。但是很多時候打開微博主頁時,上方的快捷入口會出現(xiàn)圖1右所示的情況,用戶需向下拉頁面,才會顯示出快捷入口。
圖1 搜索入口
此外,搜索過程中的進度條、搜索結(jié)果的相關(guān)反饋等也是影響微博搜索可視性的重要內(nèi)容。而在微博搜索的過程中,并沒有顯示搜索進度條(如圖2所示),這在檢索結(jié)果響應(yīng)時間較長的情況下(如網(wǎng)速不佳),讓用戶無法得知當(dāng)前搜索狀態(tài),從而降低用戶的可用性體驗。
圖2 搜索過程中
圖3 搜索記錄
(2)系統(tǒng)和現(xiàn)實的協(xié)調(diào)。微博是面向大眾的社交化媒體軟件,它存在大量的草根用戶,因此一定要避免使用專業(yè)化的語言。對于微博搜索來說,其入口的標(biāo)識一定要使用用戶所熟悉的,從而方便用戶快速找到搜索入口。如圖1所示,微博搜索的兩個搜索入口分別是用戶熟悉的搜索框和放大鏡圖標(biāo),即使是對于新用戶,也能一眼就識別出來。
(3)靈活性和效率。對于微博搜索來說,主界面上方的搜索入口就是一個快捷搜索功能(如圖1所示)。此外,由于人們一般會利用社交媒體監(jiān)控自己所感興趣的話題,因此會不斷重復(fù)地搜索此話題[29],這時,具有搜索記錄功能將會使人們監(jiān)控話題變得更高效。微博搜索的搜索記錄如圖3所示,它可以單獨刪除某條搜索記錄,也可以刪除所有搜索記錄。與百度搜索的搜索記錄相比,微博搜索記錄可以記錄剛剛完成的搜索,而百度搜索本次的搜索記錄需要在下次啟動時才能顯示。
(4)幫助用戶認知、判斷及修復(fù)錯誤。該原則要求當(dāng)出現(xiàn)錯誤時,系統(tǒng)并不只是告訴用戶錯誤信息,而更應(yīng)該做到使用戶可以靠它來解決出現(xiàn)的問題。用戶在微博搜索自己感興趣的內(nèi)容時,有時只是知道大概內(nèi)容,需要在微博進行探索式搜索,這就需要系統(tǒng)提供關(guān)聯(lián)搜索功能,這一點,微博搜索做得很好,它不僅有糾錯(如圖4左所示)、搜索提示(如圖4中所示),還有關(guān)聯(lián)用戶推薦(如圖4右所示)等。
圖4 關(guān)聯(lián)搜索
(5)搜索結(jié)果的個性化。個性化搜索可以說是社交搜索的首要條件,也是其價值所在[30]。隨著微博用戶的不斷增加,微博中用戶生成內(nèi)容也呈爆炸式增長,能使用戶在海量信息中快速獲取個性化的信息將會提高微博搜索的可用性,從而增加用戶黏性。微博搜索可以根據(jù)用戶需要選擇搜索結(jié)果分類,而且微博也具有自己的個性化推薦算法,根據(jù)用戶興趣有偏好性地展示搜索結(jié)果。
(6)搜索結(jié)果的實時性。微博是公開信息發(fā)布的第一平臺,包括突發(fā)熱點、最新動態(tài)、新聞資訊等,微博搜索可以檢索出秒級的最新事件,相比新聞網(wǎng)頁搜索速度更快[12]。很多用戶使用微博是為了查看實時信息,關(guān)注感興趣事件的最新發(fā)展動態(tài),微博搜索在這一點上很好地滿足了用戶對實效的需求。由于微博內(nèi)容的實時性,當(dāng)用戶有諸如查看實時天氣預(yù)報、查看節(jié)假日道路擁堵狀況等對實時性要求較高的信息時,微博搜索便會因?qū)崟r性而很好的滿足用戶需求,從而提高了用戶的滿意度。
(7)搜索環(huán)境的社交性。作為一個嵌套于社交媒體平臺的搜索系統(tǒng),社交性理所當(dāng)然是微博搜索可用性所應(yīng)考慮的方面之一。微博搜索的主頁面有很多類目體系,用戶可根據(jù)自己的興趣愛好選擇對應(yīng)的類目進行搜索,搜索框內(nèi)也會提示“大家正在搜”的內(nèi)容(如圖5所示)。此外,微博搜索還提供熱搜榜,用戶可以查看實時、好友、名人等搜索熱點(如圖6所示)。對于搜索結(jié)果,用戶可以進行評論、轉(zhuǎn)發(fā)、點贊等行為,從而增加了用戶的現(xiàn)場感。但由于社交性更多的是用戶的感受,因此,該準(zhǔn)則會在用戶測試階段再進行評估。
圖5 微博搜索主頁面
圖6 微博熱搜榜
可用性的測試參與者一般都是產(chǎn)品的實際用戶,其數(shù)量與實際的測試時間、成本限制等因素有關(guān)。Virzi[31]發(fā)現(xiàn),80%的問題是由最初的4~5個參與者發(fā)現(xiàn)的;Nielsen[32]指出,5個用戶就可以發(fā)現(xiàn)77%~85%的問題,因此他建議可用性測試的一般用戶數(shù)是3~5個;而Spyridakis[33]認為,少量用戶難以發(fā)現(xiàn)不同分組之間的顯著差異,實際測試中至少應(yīng)當(dāng)聘請10~12名參與者。本研究選擇了10名用戶參與了測試,其中包括經(jīng)常使用微博搜索的用戶7名,偶爾使用微博搜索的用戶2名;為了使本研究用戶測試案例更具代表性,還邀請了1位從未使用過微博搜索的用戶參與。用戶測試參與者的基本情況如表3所示:
表3 用戶測試參與者的基本情況
在前階段的啟發(fā)式評估中,本研究已經(jīng)對傳統(tǒng)的啟發(fā)式評估中的系統(tǒng)狀態(tài)的可視性,系統(tǒng)和現(xiàn)實的協(xié)調(diào),靈活性和效率,幫助用戶認知、判斷及修復(fù)錯誤這四條原則做了很好的評估;但是針對微博特征的搜索結(jié)果的個性化,搜索結(jié)果的實時性,搜索環(huán)境的社交性這三條原則的評估還有所欠缺。因此,在用戶測試階段,本研究將主要從實際用戶角度出發(fā),評估微博搜索的上述三條可用性原則,以彌補啟發(fā)式評估的不足。具體測試任務(wù)如下:
任務(wù)一:請查看自己的好友熱搜榜。
任務(wù)二:請找出北京和頤酒店事件中被襲女子的微博。
任務(wù)三:請利用微博制定一個上海迪士尼樂園的游玩攻略。
這三個任務(wù)總體是按由易到難、由簡到繁進行排序的。
為了保證用戶測試的可靠性,所有用戶的測試都是分開進行的,從而避免測試用戶之間的學(xué)習(xí)行為;此外,當(dāng)用戶進行測試任務(wù)時,觀察人員也不能對他們作出任何帶有指導(dǎo)性質(zhì)的提示,所有任務(wù)必須由測試用戶獨立完成。
表4 測試任務(wù)完成情況
在所有的測試用戶中,除了一名沒有使用過微博的測試者外,其余測試者均完成了三個任務(wù)。其中,任務(wù)一的平均完成時間為30秒,任務(wù)二的平均完成時間為2分鐘,任務(wù)三的平均完成時間為30分鐘,如表4所示。
任務(wù)一中的熱搜榜是微博搜索的一個特色產(chǎn)品,它通過用戶搜索行為來挖掘大家所關(guān)注的熱點與興趣點,其中的好友熱搜則是基于社交關(guān)系提供的好友搜索過的熱點榜,體現(xiàn)了搜索環(huán)境的社交性。本任務(wù)相對簡單,因此所有參與測試的用戶均完成了此任務(wù)(包括未使用過微博的測試者),且完成該任務(wù)的時間都較短。
HorowitzD認為[34]傳統(tǒng)搜索引擎的目的是查找能夠滿足用戶需求的文檔或資源,而社會化搜索是為了查找能夠滿足用戶需求的人。任務(wù)二的設(shè)置就是要查看測試用戶使用微博搜索來找人的情況,本任務(wù)相對任務(wù)一難度有所提高,沒有使用過微博的測試者未能完成此任務(wù),其余測試者均完成了測試。在所有完成任務(wù)的測試者中,都是通過關(guān)鍵詞搜索后,逐條瀏覽搜索結(jié)果,找出所需人物微博。沒有測試者在搜索結(jié)果中選擇“用戶”類目進行篩選,或者直接在搜索時選擇“搜人”功能。雖然新浪微博對搜索結(jié)果設(shè)置了不同的類目,供用戶進行個性化選擇,但在本測試任務(wù)中并沒有用戶選擇使用此功能。通過對測試用戶的訪談可知,用戶沒有選擇對結(jié)果進行分類篩選是因為用戶習(xí)慣了逐條瀏覽信息,而不習(xí)慣使用微博搜索的分類篩選功能。
任務(wù)三相對于前兩個任務(wù)來說并沒有更難,只是相對復(fù)雜,該任務(wù)的設(shè)計是為了測試用戶是否會采用除了直接搜索之外的方式來獲取自己所需內(nèi)容。測試結(jié)果顯示,所有測試者都是直接搜索“上海迪士尼攻略”等關(guān)鍵詞,而并不會選擇去問微博上已經(jīng)去過上海迪士尼的用戶,或者咨詢上海迪士尼官方微博。只有一名測試者表示會在對攻略有疑問時給博主留言提問。這點表明用戶對微博中的社交關(guān)系并不是很信任,相比于微博中的“好友”,他們更信任現(xiàn)實生活中的朋友。這一點說明微博搜索環(huán)境的社交性較弱,從而導(dǎo)致大部分搜索用戶只是作為一個外部搜索者,而并沒有真正地參與創(chuàng)造用戶生成內(nèi)容。
在用戶測試的過程中,還發(fā)現(xiàn)了以下可用性問題:
(1)檢索結(jié)果不能按用戶所需進行排序。微博搜索一般默認是按照時間進行排序,但用戶在實際瀏覽搜索結(jié)果時,有自己所希望的排序需求,如按轉(zhuǎn)發(fā)量、地域等進行排序。
(2)搜索結(jié)果會顯示很多無關(guān)信息。如任務(wù)二中,當(dāng)用戶輸入關(guān)鍵詞“和頤酒店”時,會出現(xiàn)很多無關(guān)信息(如圖7所示)。測試用戶表示,這種情況在平時使用微博搜索不是熱門事件的內(nèi)容時更為明顯,經(jīng)常會出現(xiàn)和搜索內(nèi)容完全不搭邊的很多無用信息。
圖7 搜索結(jié)果中的無關(guān)信息
(3)已閱讀內(nèi)容和未閱讀內(nèi)容沒有區(qū)分顯示。這個問題在任務(wù)三中顯示得較為突出,要制定一個旅游攻略,用戶需要查看大量攻略,而很多攻略的名字和內(nèi)容很相似,用戶在大量閱讀之后很難判斷出哪些是已經(jīng)看過的,哪些是沒有看過的,從而導(dǎo)致閱讀重復(fù)的信息,增加了做攻略的時間。
綜合以上兩種評估可以認為新浪微博搜索具有較好的可用性,用戶使用起來感覺也較為舒服,尤其是在系統(tǒng)和現(xiàn)實的協(xié)調(diào)、靈活性和效率、幫助用戶認知判斷及修復(fù)錯誤、搜索結(jié)果的實時性這幾個原則上的反映很好。但在系統(tǒng)狀態(tài)的可視性、搜索結(jié)果的個性化、搜索環(huán)境的社交性這幾個原則上還有所欠缺,主要表現(xiàn)為:①主頁面上方搜索入口不易發(fā)現(xiàn);②搜索過程中沒有進度條顯示;③搜索結(jié)果缺乏自主排序功能;④搜索結(jié)果關(guān)聯(lián)度不夠高;⑤無法區(qū)分已看和未看內(nèi)容。
針對以上問題,筆者對新浪微博平臺下的搜索子系統(tǒng)提出了幾條改善的建議:
(1)調(diào)整界面布局,使用戶具有更好的搜索體驗。由于大部分微博搜索用戶是利用碎片時間瀏覽微博,因此良好的搜索體驗就顯得尤為重要,不管是在搜索前、搜索中,還是搜索后。建議新浪微博搜索將快捷搜索入口始終置頂在各頁面上方,從而方便用戶隨時進行搜索;增加搜索過程中的進度條以方便用戶及時監(jiān)控搜索情況;對搜索出的已讀內(nèi)容和未讀內(nèi)容用顏色加以區(qū)分以便識別。
(2)減少冗余信息,使用戶能迅速找到所需內(nèi)容。微博信息量大且更新速度快,如何使用戶在最短的時間內(nèi)找到所需內(nèi)容是微博搜索需要重點考慮的問題之一。根據(jù)前文的研究,建議新浪微博搜索改進搜索算法,盡量減少無關(guān)冗余信息,提供更具個性化和更有關(guān)聯(lián)度的搜索結(jié)果;此外,可增加對搜索結(jié)果的排序功能,如按發(fā)布時間、轉(zhuǎn)發(fā)量、地域等,從而方便用戶更迅速地找到自己所需內(nèi)容。
(3)增強社交屬性,使用戶更信賴微博關(guān)系。新浪微博“后臺實名,前臺自愿”的規(guī)定使得大部分用戶選擇前臺匿名,因此用戶的言論相對不受控制,用戶自然無法信賴微博中的社交關(guān)系;再加上微博消息不如微信等即時軟件迅速,從而導(dǎo)致微博中相對較弱的社交關(guān)系。建議新浪微博采取一定的措施,如增強實名或改進消息更新機制等,以增強微博中的社交屬性。
目前從可用性角度對新浪微博搜索系統(tǒng)進行的研究較為有限,本文以新浪微博(移動客戶端)平臺的搜索系統(tǒng)作為研究對象,結(jié)合啟發(fā)式評估和用戶測試法對其可用性進行了評估,得出了其存在的一些可用性問題,提出了相關(guān)的建議,并構(gòu)建了適合新浪微博搜索可用性的啟發(fā)式評估原則。但本研究在評估其可用性時都是采用定性分析的方法,而并沒有將各原則進行量化,也沒有對存在的可用性問題賦予權(quán)重。在未來的研究中可以繼續(xù)擴大測試人群的覆蓋面,對任務(wù)進行更加精細化的設(shè)計。