發表於2024-12-23
本書詳細闡述如何選擇統計檢驗方法,以及在應用這些方法時如何為統計理論和佳實踐提供基礎。本書聚焦於可應用於實際用戶研究項目的方法,是作者實際工作經驗、調查研究,以及對新的統計學、心理學、人因工程學的文獻資料研讀的結晶。它不隻是對傳統統計學的復述,而是為當今從業者提供瞭全新和切題的解讀。
目 錄
譯者序
作者介紹
推薦序
前言
緻謝
第1章 導論1
1.1 簡介1
1.2 本書的組織結構1
1.3 如何使用本書2
1.3.1 應該使用何種檢驗2
1.3.2 我需要多大的樣本量5
1.3.3 你不必手動計算6
1.4 本章要點6
1.5 本章思考題6
1.6 本章思考題答案6
1.7 參考資料7
第2章 量化用戶研究8
2.1 什麼是用戶研究8
2.2 用戶研究的數據8
2.3 可用性測試9
2.3.1 樣本量9
2.3.2 代錶性和隨機性9
2.3.3 用戶研究的三種研究類型11
2.3.4 數據收集11
2.3.5 任務完成率12
2.3.6 可用性問題12
2.3.7 任務時間13
2.3.8 齣錯數13
2.3.9 滿意度評分14
2.3.10 復閤分數14
2.4 A/B測試14
2.5 調查數據15
2.5.1 等級量錶15
2.5.2 淨推薦值15
2.5.3 評論和開放性數據16
2.6 需求收集16
2.7 本章要點16
2.8 參考資料17
第3章 我們的估算到底有多準確18
3.1 簡介18
3.1.1 置信區間=誤差幅度的兩倍18
3.1.2 置信區間提供瞭精確度和位置19
3.1.3 置信區間的三個組成要素19
3.2 完成率的置信區間19
3.2.1 置信區間的曆史20
3.2.2 Wald區間:對於小樣本來說太不靠譜瞭20
3.2.3 精確置信區間21
3.2.4 Wald校正區間:增加兩次成功與兩次失敗21
3.2.5 完成率的最佳點估計…23
3.2.6 遭遇可用性問題的置信區間24
3.3 等級量錶和其他連續性數據的置信區間25
3.3.1 任務時長數據的置信區間27
3.3.2 任務時長均值還是任務時長中位數28
3.3.3 幾何平均數28
3.3.4 大樣本任務時長的置信區間30
3.3.5 圍繞中位數的置信區間30
3.4 本章要點32
3.5 本章思考題33
3.6 本章思考題答案33
3.7 參考資料34
第4章 我們達到或超過目標瞭嗎35
4.1 簡介35
4.2 單側檢驗和雙側檢驗38
4.3 完成率與基準的比對39
4.3.1 小樣本檢驗39
4.3.2 大樣本檢驗42
4.4 滿意度評分與基準的比對43
4.5 任務時間和基準的比對47
4.6 本章要點51
4.7 本章思考題51
4.8 本章思考題答案52
4.9 參考資料55
第5章 不同設計之間有統計學差異嗎56
5.1 簡介56
5.2 比較兩個平均值(等級量錶和反應時)56
5.2.1 組內比較——配對t檢驗57
5.2.2 比較任務時長59
5.2.3 組間比較(雙樣本t檢驗)61
5.2.4 t檢驗的假設65
5.3 比較完成率、轉換率以及A/B測試66
5.3.1 組間比較66
5.3.2 組內比較74
5.4 本章要點82
5.5 本章思考題84
5.6 本章思考題答案86
5.7 參考資料90
第6章 關於樣本量大小的總結性研究91
6.1 簡介91
6.1.1 我們為何要關注91
6.1.2 可用性研究的類型至關重要92
6.1.3 總結性可用性測試樣本量預估的基本原則92
6.2 預估數值93
6.3 比較數值99
6.4 如何控製變異性104
6.5 二項置信區間樣本量的估計105
6.5.1 大樣本的二項樣本量估計105
6.5.2 小樣本的二項樣本量估計106
6.5.3 與基準比例相比較的樣本量109
6.6 卡方檢驗的樣本量預估(獨立比例)111
6.7 McNemar精確檢驗的樣本預估(配對比例)114
6.8 本章要點117
6.9 本章思考題119
6.10 本章思考題答案120
6.11 參考資料123
第7章 關於樣本量大小的形成性研究125
7.1 簡介125
7.2 使用發現問題的概率模型來估計形成性用戶研究的樣本量125
7.2.1 著名方程:P(x≥1)=1-(1-p)n125
7.2.2 從1-(1-p)n中推導齣樣本量估計方程127
7.2.3 使用錶格計劃形成性用戶研究樣本量129
7.3 二項概率模型的假設130
7.4 模型的附加應用131
7.4.1 估計多重問題或其他事件的復閤p值131
7.4.2 校正小樣本p的復閤評估值132
7.4.3 估計可發現的問題數和未被發現的問題數136
7.5 影響p值的是什麼138
7.6 什麼是閤理的目標問題發現率138
7.7 調解“神奇的數字5”和“8還不夠”140
7.7.1 一段曆史——20世紀80年代141
7.7.2 又一段曆史——20世紀90年代141
7.7.3 “神奇的數字5”的起源142
7.7.4 “8還不夠”——一個調解方法144
7.8 更多關於二項概率公式及其小樣本校正147
7.8.1 二項概率公式的起源147
7.8.2 緊縮校正是如何起作用的149
7.9 針對問題發現的其他統計模型151
7.9.1 對問題發現使用二項分布模型的批評151
7.9.2 擴展的二項分布模型152
7.9.3 捕獲-再捕獲模型153
7.9.4 在計劃形成性用戶研究時為什麼不用其他模型153
7.10 本章要點156
7.11 本章思考題158
7.12 本章思考題答案159
7.13 參考資料159
第8章 標準化的可用性問捲163
8.1 簡介163
8.1.1 什麼是標準化的問捲163
8.1.2 標準化可用性問捲的優點163
8.1.3 什麼樣的標準化可用性問捲是有用的164
8.1.4 標準化問捲的質量評估:信度、效度和靈敏度165
8.1.5 其他項目的特徵166
8.2 後續研究的調查問捲167
前 言歡迎閱讀本書第2版!在這一版中,我們自始至終緻力於提供關於如何檢驗和分析用戶研究數據的最新且實用的信息。第2版的主要變化如下:
我們重新審閱瞭2012年以來的相關文獻,並根據需要更新瞭內容和參考文獻列錶。
在本書涉及的話題中,自2012年以來在標準化的可用性問捲方麵,有瞭最新的研究成果發錶,所以我們全麵更新瞭第8章的內容。
關於第1版,反饋最多的是希望加入相關性分析的內容。所以在第2版中我們增加全新的一章來介紹相關性分析、迴歸分析和方差分析。
由於全新的第10章,我們調整瞭第1章中的決策導圖,以引導讀者更好地理解書中的主題。
撰寫本書的一個最主要目的是為盡可能廣泛的用戶體驗設計師和研究人員提供切實可行的用戶體驗評估方法。我們從熟悉用戶的研究人員最常遇到的數據著手,緊接著介紹適閤分析這類數據的方法——顯著性檢驗、置信區間和樣本大小評估等。這其中包含一些較為常見的檢驗方法,例如t檢驗。然而,有一些檢驗方法是我們希望被納入統計學的教學中,但目前還沒有的,例如“調整的Wald二項分布比例的置信區間”(adjusted-Wald binomial confidence interval)。
我想我們可以做到的是,在基於背景因素的情況下,提供有理有據的方法建議。當遇到難以給齣建議的案例時,我們也希望可以提供有效的信息,以幫助人們更好地做齣決策。所有的這一切都是希望能夠為創造更好的産品和服務齣一份力,為使用它們的人們帶來益處,為提供它們的企業帶來價值。
緻 謝非常感謝Morgan Kaufmann的團隊邀請我們進行第2版的撰寫。非常感謝Lynda Finn、Linda Lior和Phil Kortum對本書各章節初稿深思熟慮地審校。對於他們付齣的寶貴時間和給予的重要建議,我們錶示深深的感激。
Jeff的緻謝本書代錶瞭近10年來重新采樣和研究的成果。我們閱讀並參考瞭來自各個學科的數十篇期刊論文,以幫助我們更好地解答用戶體驗領域的問題。在這個過程中,我不僅找到瞭滿意的答案,還學到瞭很多知識,結識瞭許多朋友。這其中便包括我的閤著者——James R.Lewis。感謝在著書的整個過程中我的傢人對我的包容和鼓勵。
James的緻謝感謝每一位使我對可用性研究和用戶體驗設計如此感興趣的人,是他們讓我對我這份事業樂此不疲——從我的閤著者Jeff Sauro到IBM的用戶體驗團隊,以及州立農業保險公司,他們是我最寶貴的學習財富,他們鼓舞瞭我對教育事業的不斷追求。當然,還要感謝我的傢人一直以來對我的支持和鼓勵。
用戶體驗度量:量化用戶體驗的統計學方法(原書第2版) 下載 mobi pdf epub txt 電子書 格式 2024
用戶體驗度量:量化用戶體驗的統計學方法(原書第2版) 下載 mobi epub pdf 電子書用戶體驗度量:量化用戶體驗的統計學方法(原書第2版) mobi epub pdf txt 電子書 格式下載 2024