《從零進階!數據分析的統計基礎(第2 版)》
第1 章數據分析概述 1
1.1 什麼是數據分析 2
1.2 數據分析六部麯 2
1.2.1 明確分析目的和內容 2
1.2.2 數據收集 . 3
1.2.3 數據預處理 . 3
1.2.4 數據分析 . 4
1.2.5 數據展現 . 5
1.2.6 報告撰寫 . 6
1.3 數據分析方法簡介 6
1.3.1 單純的數據加工方法 6
1.3.2 基於數理統計的數據分析方法 7
1.3.3 基於數據挖掘的數據分析方法 8
1.3.4 基於大數據的數據分析方法 11
1.3.5 數理統計與數據挖掘的區彆和聯係 13
1.4 常用數據分析工具的安裝 14
1.4.1 在Excel 2013 中安裝數據分析工具 14
1.4.2 數據分析軟件SPSS 的安裝 . 16
1.5 重要知識點迴顧 22
1.6 課後習題 . 23
第2 章描述性統計分析 24
2.1 直方圖 . 25
2.1.1 什麼是直方圖 25
2.1.2 如何看直方圖 25
2.1.3 如何畫直方圖 26
2.1.4 使用Excel 2013 進行直方圖的繪製 27
2.2 數據的計量尺度 30
2.3 數據的集中趨勢 31
2.3.1 平均數 . 31
2.3.2 分位數 . 33
2.3.3 眾數 . 34
2.4 數據的離中趨勢 34
2.4.1 極差 . 35
2.4.2 分位距 . 35
2.4.3 平均差 . 36
2.4.4 方差與標準差 37
2.4.5 離散係數 . 38
2.5 數據分布的測定 40
2.5.1 數據偏態及其測定 40
2.5.2 數據峰度及其測定 41
2.5.3 數據偏度和峰度的作用 42
2.6 數據的展示——統計圖 43
2.6.1 條形圖與扇形圖 43
2.6.2 摺綫圖 . 44
2.6.3 莖葉圖 . 45
2.6.4 箱綫圖 . 48
2.6.5 統計圖小結 . 52
2.7 使用Excel 實現數據的描述性統計及分析 . 52
2.7.1 使用Excel 實現三國全部人物武力描述性統計 . 52
2.7.2 使用Excel 分彆實現三個國傢人物武力描述性統計分析 . 54
2.7.3 使用Excel 分彆實現三個國傢武將武力描述性統計分析 . 55
2.7.4 使用SPSS 實現三個國傢武將武力的分位數分析 . 56
2.8 重要知識點迴顧 59
2.9 課後習題 . 59
第3 章數理統計基礎 62
3.1 抽樣估計基礎 63
3.1.1 隨機事件 . 63
3.1.2 隨機事件的概率 64
3.1.3 隨機變量及其概率分布 66
3.1.4 隨機變量的數字特徵 71
3.2 正態分布及三大分布 72
3.2.1 正態分布的概率密度函數 73
3.2.2 正態分布的特徵 73
3.2.3 標準正態分布 74
3.2.4 基於正態分布的三大分布 77
3.3 中心極限定理 80
3.3.1 中心極限定理的提法 80
3.3.2 中心極限定理的內容 81
3.3.3 中心極限定理的意義與應用 81
3.4 重要知識點迴顧 82
3.5 課後習題 . 83
第4 章抽樣估計 . 86
4.1 抽樣估計的基本概念 87
4.1.1 總體及總體指標 87
4.1.2 樣本及樣本指標 88
4.1.3 抽樣估計的思想 89
4.1.4 抽樣估計的理論基礎 91
4.1.5 樣本統計量及分布 92
4.2 抽樣估計的方法——點估計 93
4.2.1 點估計 . 93
4.2.2 點估計精度和樣本容量的關係 95
4.2.3 點估計的優缺點 96
4.3 抽樣估計的誤差 97
4.3.1 抽樣估計的實際誤差 97
4.3.2 抽樣估計的平均誤差 98
4.3.3 抽樣估計的極限誤差 102
4.4 抽樣估計的方法——區間估計 102
4.4.1 抽樣估計的精度及置信度 102
4.4.2 區間估計的方法 105
4.4.3 區間估計的步驟 106
4.5 抽樣的組織形式和抽樣數目的確定 107
4.5.1 抽樣的組織形式 107
4.5.2 必要抽樣數目的確定 109
4.6 重要知識點迴顧 112
4.7 課後習題 113
第5 章假設檢驗 . 117
5.1 假設檢驗概述 118
5.1.1 假設檢驗的概念 118
5.1.2 假設檢驗的基本思想 118
5.1.3 假設檢驗在數據分析中的作用 119
5.2 假設檢驗的分析方法 119
5.2.1 假設檢驗的基本步驟 119
5.2.2 假設檢驗與區間估計的聯係 122
5.2.3 假設檢驗中的兩類錯誤 123
5.2.4 利用P 值進行決策 124
5.2.5 應用假設檢驗需要注意的問題 125
5.3 常見的檢驗統計量 126
5.3.1 z 檢驗統計量 126
5.3.2 t 檢驗統計量 128
5.3.3 ?2 檢驗統計量 129
5.3.4 F 檢驗統計量 . 129
5.4 SPSS 中常用的幾種t 檢驗實例 . 130
5.4.1 單樣本t 檢驗 . 130
5.4.2 兩獨立樣本t 檢驗 . 133
5.4.3 配對樣本t 檢驗 . 139
5.5 重要知識點迴顧 143
5.6 課後習題 143
第6 章方差分析 . 147
6.1 方差分析 148
6.1.1 方差分析的概述 148
6.1.2 方差分析的幾個概念 148
6.1.3 單因素方差分析中的基本假定 149
6.2 單因素方差分析 149
6.2.1 單因素方差分析的原理 149
6.2.2 單因素方差分析的原假設 150
6.2.3 單因素方差分析的統計量 151
6.2.4 單因素方差分析的基本步驟 152
6.3 使用SPSS 實現三國武將武力差異分析 . 152
6.3.1 檢驗不同國傢武將數據是否符閤正態分布 153
6.3.2 單因素方差分析操作步驟及必要說明 155
6.3.3 對三國武將武力單因素方差分析結果的分析 160
6.4 使用SPSS 實現三國文官智力差異分析 . 163
6.4.1 檢驗不同國傢文官數據是否符閤正態分布 163
6.4.2 單因素方差分析操作步驟及必要說明 165
6.4.3 對三國文官智力單因素方差分析結果的分析 167
6.5 數說漢室衰微與三足鼎立現象 169
6.6 重要知識點迴顧 171
6.7 課後習題 171
第7 章相關與迴歸分析 175
7.1 變量間的關係 176
7.1.1 函數關係及特點 176
7.1.2 相關關係及特點 176
7.2 相關分析 177
7.2.1 相關分析及步驟 177
7.2.2 散點圖的繪製 177
7.2.3 相關係數的計算 178
7.2.4 相關係數的顯著性檢驗 182
7.3 使用SPSS 實現相關分析 . 182
7.3.1 在SPSS 中繪製散點圖 . 182
7.3.2 在SPSS 中進行正態性檢驗 . 185
7.3.3 相關係數的計算和檢驗 187
7.4 一元綫性迴歸分析 189
7.4.1 一元迴歸模型及相關假定 190
7.4.2 一元綫性迴歸方程及求法 190
7.4.3 迴歸模型的檢驗 191
7.4.4 迴歸直綫的擬閤優度 194
7.5 使用SPSS 實現一元綫性迴歸分析 . 195
7.5.1 畫散點圖和趨勢綫 195
7.5.2 簡單相關分析 198
7.5.3 一元綫性迴歸分析的操作步驟 199
7.5.4 一元綫性迴歸分析的結果解讀 205
7.6 重要知識點迴顧 207
7.7 課後習題 208
附錄A 三國人物數據 . 213
附錄B CDA 數據分析師緻力於小好的數據分析人纔建設 . 226
附錄C 參考答案 . 230
《胸有成竹!數據分析的SPSS和SAS EG進階(第2版)》
第1 章數據分析方法概述 1
1.1 數據分析概述.. 2
1.1.1 數據分析過程 2
1.1.2 數據分析的商業驅動 3
1.2 數據分析與挖掘方法分類介紹. 5
1.2.1 描述性——無監督的學習. 7
1.2.2 預測性——有監督的學習.. 10
1.3 數據分析的方法論. 12
1.3.1 數據挖掘的項目管理方法論:CRISP-DM 13
1.3.2 數據整理與建模的方法論:SEMMA .. 14
1.3.3 SAS EG 和SPSS 任務菜單編排與SEMMA 之間的關係. 16
第2 章描述數據特徵.. 19
2.1 認識數據類型 20
2.2 單變量描述統計方法 21
2.2.1 分類變量的描述 21
2.2.2 連續變量的描述 22
2.3 創建頻數報錶 35
2.4 生成匯總統計量.. 38
2.5 用匯總錶任務生成匯總報錶 41
2.6 繪製條形圖. 46
2.7 繪製地圖.. 53
2.8 使用SPSS 進行描述統計.. 55
2.8.1 頻率過程.. 56
2.8.2 描述過程.. 57
2.8.3 探索過程.. 58
2.8.4 P-P 圖與Q-Q 圖 58
2.9 使用SPSS 繪製統計圖形.. 60
2.9.1 作圖方法.. 60
2.9.2 餅圖、柱圖與條圖.. 64
2.9.3 綫圖、高低圖和雙軸圖 70
2.9.4 散點圖 73
第3 章描述性數據分析/挖掘方法. 75
3.1 客戶細分方法介紹. 76
3.1.1 客戶細分的意義 76
3.1.2 根據客戶利潤貢獻進行劃分. 77
3.1.3 根據個人或公司的生命曆程進行劃分 78
3.1.4 根據客戶的産品偏好進行劃分 79
3.1.5 根據客戶交易/消費行為進行劃分. 80
3.1.6 根據客戶的多維行為屬性細分 81
3.1.7 展現客戶/産品結構的戰略細分.. 81
3.1.8 客戶細分:綜閤運用. 82
3.2 連續變量間關係探索與變量約減. 82
3.2.1 多元統計基礎. 82
3.2.2 多元變量壓縮的思路. 87
3.2.3 主成分分析.. 89
3.2.4 因子分析. 103
3.2.5 對應分析. 112
3.2.6 小優尺度分析.. 119
3.2.7 多維尺度分析.. 124
3.3 聚類分析 133
3.3.1 基本邏輯. 134
3.3.2 係統聚類. 135
3.3.3 快速聚類. 146
3.3.4 兩步聚類. 155
第4 章預測性數據分析方法.. 161
4.1 假設檢驗概念. 162
4.1.1 統計推斷基本概念 164
4.1.2 變量分布的圖形探索.. 165
4.1.3 均值的置信區間. 167
4.1.4 假設檢驗基礎.. 168
4.1.5 T 檢驗. 169
4.2 構造對連續變量的預測模型. 174
4.2.1 方差分析(ANOVA) 174
4.2.2 綫性迴歸. 190
4.2.3 綫性迴歸的模型診斷.. 203
4.2.4 綫性迴歸的全流程 211
4.3 構造對二分類變量的預測模型 217
4.3.1 分類變量之間的相關性檢驗.. 217
4.3.2 邏輯迴歸. 224
第5 章時間序列.. 240
5.1 時間序列的趨勢分解法 241
5.1.1 趨勢分解法簡介. 241
5.2.2 使用SAS EG 進行時間序列趨勢分解.. 242
5.2.3 使用SPSS 進行時間序列趨勢分解 244
5.2 平穩時間序列(ARMA)模型設定與識彆. 245
5.2.1 平穩時間序列定義 245
5.2.2 平穩時間序列模型建模. 246
5.2.3 ARMA 的模型設定與識彆.. 247
5.3 非平穩時間序列(ARIMA)模型設定與識彆.. 250
5.4 SAS EG 時間序列建模步驟.. 252
5.5 SPSS 時間序列建模步驟. 258
5.5.1 SPSS 構造ARIMA 模型使用的任務菜單.. 258
5.5.2 “定義日期”任務.. 260
5.5.3 “序列圖”任務 261
5.5.4 “自相關”任務 262
5.5.5 “創建模型”任務.. 263
5.5.6 “使用模型”任務.. 267
5.5.7 其他內容. 267
附錄A 數據說明.. 271
附錄B CDA 數據分析師緻力於小好的數據分析人纔建設.. 278
參考文獻 282
《如虎添翼!數據處理的SPSS和SAS EG實現(第2版)》
第1 章軟件入門介紹.. 1
1.1 SAS EG 介紹.. 2
1.1.1 SAS EG 簡介. 2
1.1.2 SAS EG 的窗口及菜單. 3
1.2 SPSS 介紹. 4
1.2.1 SPSS 簡介.. 4
1.2.2 SPSS 窗口及菜單 5
1.3 數據挖掘的流程介紹. 9
1.3.1 KDD 介紹 9
1.3.2 CRISP-DM .. 10
1.3.3 SEMMA . 11
1.3.4 三種數據挖掘流程的比較.. 11
1.4 課後練習. 11
第2 章使用數據.. 12
2.1 通過SAS 邏輯庫訪問數據.. 13
2.1.1 商業背景.. 13
2.1.2 SAS 相關功能介紹.. 13
2.1.3 EG 菜單解決方案. 14
2.1.4 SAS 程序實現. 15
2.1.5 SPSS 菜單解決方案.. 16
2.2 理解SAS 與SPSS 數據集的定義 19
2.2.1 理解數據集的含義.. 19
2.2.2 商業背景.. 19
2.2.3 SAS 與SPSS 相關概念介紹.. 19
2.2.4 EG 菜單解決方案. 25
2.2.4 SAS 程序實現. 26
2.2.5 SPSS 菜單解決方案 28
2.3 導入其他格式的數據文件 30
2.3.1 商業背景.. 30
2.3.2 SAS 相關功能介紹.. 30
2.3.3 EG 菜單解決方案. 31
2.3.4 SAS 程序實現. 33
2.3.5 SPSS 菜單解決方案 35
2.4 數據來源. 36
2.4.1 直接來源.. 36
2.4.2 間接來源.. 37
2.5 擴展閱讀. 37
2.6 課後練習. 38
第3 章探索性數據分析及數據的清理 39
3.1 探索性數據分析. 40
3.1.1 基本理論講解. 40
3.1.2 EG 菜單解決方案. 40
3.1.3 SPSS 菜單解決方案 44
3.2 數據清理介紹.. 54
3.2.1 商業背景.. 54
3.2.2 需要清理的數據類型. 55
3.3 類彆變量的清理. 57
3.3.1 EG 菜單解決方案. 57
3.3.2 SAS 程序實現. 61
3.3.3 SPSS 菜單解決方案 62
3.4 數值型變量的清理 66
3.4.1 EG 菜單解決方案. 66
3.4.2 SAS 程序實現. 70
3.4.3 SPSS 菜單解決方案 71
3.5 正態分布的驗證. 75
3.5.1 商業背景.. 75
3.5.2 相關理論介紹. 75
3.5.3 EG 菜單解決方案. 75
3.5.4 SAS 程序實現. 78
3.5.5 SPSS 菜單解決方案 80
3.6 擴展閱讀. 83
3.7 課後練習. 84
第4 章數據的行處理. 85
4.1 數據篩選. 86
4.1.1 商業背景.. 86
4.1.2 相關理論介紹. 86
4.1.3 EG 菜單解決方案. 86
4.1.4 SAS 程序實現. 88
4.1.5 SPSS 菜單解決方案 93
4.2 排序與求秩 94
4.2.1 商業背景.. 94
4.2.2 理論介紹.. 95
4.2.3 EG 菜單解決方案. 95
4.2.4 SAS 程序實現.. 101
4.2.5 SPSS 菜單解決方案. 103
4.3 抽樣 105
4.3.1 商業背景 105
4.3.2 抽樣理論介紹.. 105
4.3.3 EG 菜單解決方案.. 108
4.3.4 SAS 程序實現.. 110
4.3.5 SPSS 菜單解決方案. 111
4.4 數據分組和匯總.. 111
4.4.1 商業背景 111
4.4.2 EG 菜單解決方案.. 111
4.4.3 SAS 程序實現.. 113
4.4.4 SPSS 菜單解決方案. 113
4.5 擴展閱讀.. 115
4.6 課後練習.. 115
第5 章數據的列處理.. 116
5.1 計算新變量. 117
5.1.1 商業背景 117
5.1.2 EG 菜單解決方案.. 117
5.1.3 SPSS 菜單解決方案. 120
5.2 拆分列.. 123
5.2.1 商業背景 123
5.2.2 EG 菜單解決方案.. 123
5.2.3 SPSS 菜單解決方案. 125
5.3 堆疊列.. 128
5.3.1 商業背景 128
5.3.2 EG 菜單解決方案.. 129
5.3.3 SPSS 菜單解決方案. 131
5.4 轉置列.. 136
5.4.1 商業背景 136
5.4.2 EG 菜單解決方案.. 136
5.4.3 SAS 程序實現.. 138
5.4.4 SPSS 菜單解決方案. 139
5.5 函數及運算符的使用 140
5.5.1 運算符. 140
5.5.2 SAS 函數 142
5.5.3 常用SPSS 函數與SAS 函數的對應關係 150
5.6 對列重編碼. 151
5.6.1 商業背景介紹.. 151
5.6.2 EG 菜單解決方案.. 151
5.6.3 SAS 程序實現.. 155
5.6.4 SPSS 菜單解決方案. 157
5.7 標準化.. 158
5.7.1 商業背景 158
5.7.2 相關理論介紹.. 159
5.7.3 EG 菜單實現. 159
5.7.4 SAS 實現程序.. 161
5.7.5 SPSS 菜單解決方案. 162
5.8 擴展閱讀.. 163
5.9 課後練習.. 163
第6 章數據集的操作.. 164
6.1 縱嚮連接.. 165
6.1.1 商業背景 165
6.1.2 相關的理論 165
6.1.3 EG 菜單解決方案.. 165
6.1.4 SAS 程序實現.. 168
6.1.5 SPSS 菜單解決方案. 172
6.2 橫嚮連接.. 174
6.2.1 商業背景 174
6.2.2 相關理論介紹.. 174
6.2.3 EG 菜單解決方案.. 174
6.2.4 SAS 程序實現.. 178
6.2.5 SPSS 菜單解決方案. 182
6.3 數據集的比較 183
6.3.1 商業背景介紹.. 183
6.3.2 相關理論介紹.. 183
6.3.3 EG 菜單解決方案.. 183
6.3.4 SAS 程序實現.. 186
6.3.5 SPSS 菜單解決方案. 187
6.4 創建格式.. 191
6.4.1 商業背景 191
6.4.2 相關理論介紹.. 191
6.4.3 EG 菜單解決方案.. 193
6.4.4 SAS 程序實現.. 196
6.5 刪除數據集和格式. 197
6.5.1 EG 菜單解決方案.. 197
6.5.2 SAS 程序實現.. 198
6.6 擴展閱讀.. 198
6.7 課後練習.. 199
第7 章數據的展示:圖形及報告的編製 200
7.1 數據可視化與圖錶. 201
7.1.1 商業背景 201
7.1.2 相關理論介紹.. 201
7.1.3 EG 菜單解決方案.. 204
7.1.4 SPSS 菜單解決方案. 207
7.2 創建Listing 報錶. 208
7.2.1 商業背景 208
7.2.2 相關理論介紹.. 208
7.2.3 EG 菜單解決方案.. 209
7.2.4 SAS 程序實現.. 212
7.2.5 SPSS 菜單解決方案. 213
7.3 擴展閱讀.. 216
7.4 課後練習.. 216
第8 章在SAS EG 中使用提示和條件處理.. 217
8.1 提示與宏變量 218
8.1.1 商業背景 218
8.1.2 相關的理論介紹. 218
8.1.3 EG 菜單解決方案.. 219
8.2 條件處理.. 223
8.2.1 商業背景 223
8.2.2 EG 菜單解決方案.. 223
8.3 擴展閱讀.. 227
第9 章在SAS EG 中使用程序.. 228
9.1 如何在SAS EG 中使用程序 229
9.2 SAS 程序 231
9.2.1 SAS 語言元素.. 231
9.2.2 DATA 步. 232
9.2.3 PROC 步. 233
9.2.4 SAS 的模塊介紹(圖9-9). 234
9.3 擴展閱讀.. 234
第10 章SQL 語言基礎與MySQL 入門. 235
10.1 SQL 語言概況與MySQL 的安裝 236
10.1.1 SQL 語言概況 236
10.1.2 MySQL 安裝.. 237
10.1.3 MySQL 內創建數據庫. 238
10.2 查詢語句 238
10.2.1 簡單查詢並對數據過濾與排序.. 240
10.2.2 用錶達式創建新列. 241
10.2.3 對列重編碼. 242
10.2.4 在查詢中對數據分組和匯總 243
10.2.5 錶的橫嚮連接和子查詢.. 244
10.2.6 子查詢.. 250
10.2.7 集閤操作語句 251
10.3 創建錶或視圖. 252
10.3.1 創建錶.. 252
10.3.2 創建視圖. 252
附錄A SAS EG 菜單對應關係 254
附錄B SPSS 菜單對應關係錶 256
附錄C SAS 和SPSS 關鍵術語、命令對應關係 258
附錄D CDA 數據分析師緻力於小好的數據分析人纔建設. 261
參考文獻 265
評分
評分
評分
評分
評分
評分
評分
評分
本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 book.qciss.net All Rights Reserved. 圖書大百科 版權所有