跳到主要內容區塊

UX Research-易用性測試 (Usability test)(下)

測試(觀察與紀錄的評估方式)

易用性測試執行的重點是在用戶執行任務的過程下,觀察並紀錄其經過。觀察與紀錄的評估方式為下列

效率(Efficiency):
效率包含多個面向,但整體來說,效率代表使用者在短時間內完成任務,且錯誤發生的機率小。計算方式為:任務完成率/任務平均花費時間 。

  • 任務完成與否 (task success):受測者是否成功的完成任務。
  • 任務是否有錯誤(error):受測者在什麼情況下發生了錯誤。任務失敗、任務延遲、按錯按鈕等等皆為錯誤。
  • 任務時間 (task time):受測者完成任務所費時間。通長花費的時間越短,對使用者體驗則越正面。

 

滿意度(Satisfaction):
使用者完成任務過程中是否感到不安或不愉快。

學習性 (learnability):
受測者的學習歷程,歷程的難易、快慢為學習性;學習性差對於剛使用產品的使用者,可能因為此障礙進而放棄使用。
學習性常用的計算方式,可以前述任務時間、錯誤、完成等來做為計算;將受測者安排一定時間的多次測試,來檢視指標的變化。

 

測試評估表格製作

Yuming Cheung有詳細的介紹,該如何正確的使用評估表格,這裏有一份免費的google試算表範例(網路資源)

你需要做的事情有

  1. 在前面幾個直欄寫下測試的問題(如:電影訂票、查找電影、影院查詢等主要任務)
  2. 在大任務後面寫下要使用的步驟或腳本

                            可以按照顏色來區分是否成功完成任務,或任務過程中是否出現錯誤

 

還有其他的重要的質量屬性,其中之一是實用性(utility) 可用性與實用性對於用戶來說一樣重要,因為當這個產品並不是你想要的東西時,多簡單多好操作都沒有用

實用性(utility):是否提供使用者所需要的功能

易用性(Usability):這些功能的易用性與舒適性

有用性(Useful):可用性(Usability)+實用(utility)

 

測試(開始時)

  • 在開始測試前,可以跟測試者說明你的目標是測試產品(網站,App等),而與受測者本身的智能高低/產品熟練度高低無關。
  • 說明如何進行測試(如何使用測試的材料、紀錄的方式等等)。記得取得受測者攝影&錄音的同意
  • 鼓勵受測者在進行測試時,進行放生思考
  • 試後問卷或試後訪談,以及解釋測試結束後的數據、個人資料的處理方式

 

結果分析

完成測試後,測量的結果與數值會因著產品的不同而不同。但是普遍來說「任務成功與否」、「任務是否出錯」、「花費時間」是相對重要的,只是會依照商品性質的不同而重要程度發生改變。

                                                易用性問題排序解決問題評估表

 

我們可以根據上圖,從高到低開始解決,也可以根據產品的特性,來決定該解決問題的排序。但問題的排序應以先了解是什麼原因導致問題的發生,而問題的性質又是什麼。接者以問題發生的平率/嚴重程度來決定問題的優先處理順序為準則進行排序。

 

另外還有一個也是用來輔助測試的SUS (System Usability Scale) 量表。是目前較為人知及運用,測量使用者滿足的五點量表,題目共有10題:Google問卷連結點我

 

                                                          出自Maxxie Lin

 

SUS的評量主是採用了”quick and dirty“的方法。可以將第4項和第10項報告為可學習性的單獨度量,以及由所有十項組成的原始SUS分數。

十項組成的原始SUS分數(個別題目的分數沒有意義,加總後的分數才是 SUS 分數) 正向題:第 1,3,5,7,9 題,將各題的分數減 1,得到每題的分數,例如第一題原始分數是 3 分,減 1 後是 2 分。 
負向題:第 2,4,6,8,10 題,用 5 減去每一題的分數,例如第二題是 4,5 減 4 等於 1,這題分數就是 1 分。 最後將所有題目分數加總乘以2.5,得到SUS總分(此分數非百分比)。

          SUS分數可分為六個等級A(90~100),B(80~90),C(70~79),D(60~69),F(0~59)

 

另外一個研究發現SUS分數均值在68分,所以也有人認為低於均值就代表易用性不及格。關於SUS量表的詳細介紹可以參考Hans Shih的文章以及Jeff Sauro的文章。裡面有介紹到SUS總分的評級方式

但是要記得一件重要的事情SUS總分的評級越高只代表用起來容易&簡單。而且與用戶的熟悉度有一定程度的關係,因此評級越高並不代表是使用者真正需要的,也不見得就是最好的。要記得與測試過程中使用者真正的需求一起進行評估。

當然還有一些是根據網站/UI進行的評估測量表。關於這個部分我會在啟發式評估(Heuristic Evaluation)一文中詳細介紹。

 

/政府網站營運交流平台授權轉載/

 

原文作者:Jessy Lee

原文出處medium:UX Research-易用性測試 (Usability test)- 下