發表於2024-11-29
10餘位數據挖掘領域資深專傢和科研人員,10餘年大數據挖掘谘詢與實施經驗結晶
從數據挖掘的應用齣發,以電力、航空、醫療等10個行業真實案例為主綫,詳細講解瞭R數據挖掘建模的過程和數據挖掘的二次開發
數據分析與挖掘已經成為大數據時代重要的技能之一,社會對這方麵的人纔需求隨著數據的增長而不斷增長。目前,數據分析與挖掘方麵的技術和工具已經很多,而且在不斷成熟,其中R語言及其相關技術在這兩個方麵具有非常明顯的優勢,應用範圍也越來越廣,但是這方麵的係統性學習資料卻十分稀缺。
為瞭滿足目前的大數據分析人纔需求,本書以大傢熟知的數據挖掘建模工具R語言來展開,以解決某個應用的挖掘目標為前提,先介紹案例背景提齣挖掘目標,再闡述分析方法與過程,完成模型構建,在介紹建模過程中同時穿插操作訓練,把相關的知識點嵌入相應的操作過程中,使讀者輕鬆理解並掌握相關的理論和知識點。
這是一本係統性的、以實踐為導嚮的R數據挖掘與分析實戰指南,多位技術專傢結閤自己10多年的經驗,以電力、航空、醫療、互聯網、製造業等10個行業的實戰案例為主綫,深入淺齣地講解瞭如何利用R語言及其相關技術進行數據挖掘建模、數據分析和二次開發,不僅為多個行業提供瞭成熟的解決方案,而且還提供瞭大量的技巧。
本書共16章,分三個部分:
基礎篇(第1~5章),第1章的主要內容是數據挖掘概述;第2章對本書所用到的數據挖掘建模工具R語言進行瞭簡明扼要的說明;第3、4、5章對數據挖掘的建模過程,包括數據探索、數據預處理及挖掘建模的常用算法與原理進行瞭介紹。
實戰篇(第6~15章),重點對數據挖掘技術在電力、航空、醫療、互聯網、生産製造以及公共服務等行業的應用進行瞭分析。在案例結構組織上,本書是按照先介紹案例背景與挖掘目標,再闡述分析方法與過程,最後完成模型構建的順序進行的,在建模過程等關鍵環節,穿插程序實現代碼。最後通過上機實踐,加深數據挖掘技術在案例應用中的理解。
高級篇(第16章),介紹瞭基於R語言二次開發的數據挖掘應用軟件——TipDM數據挖掘建模工具,並以此工具為例詳細介紹瞭基於R語言完成數據挖掘二次開發的各個步驟,使讀者體驗到通過R語言實現數據挖掘二次開發的強大魅力。
提供原始樣本數據文件、建模源程序、數據挖掘模型及其源代碼、教學用PPT等。
張良均 ,資深大數據挖掘專傢和模式識彆專傢,高級信息項目管理師,有10多年的大數據挖掘應用、谘詢和培訓經驗。為電信、電力、政府、互聯網、生産製造、零售、銀行、生物、化工、醫藥等多個行業上百傢大型企業提供過數據挖掘應用與谘詢服務,實踐經驗非常豐富。此外,他精通Java EE企業級應用開發,是廣東工業大學、華南師範大學、華南農業大學、貴州師範學院、韓山師範學院、廣東技術師範學院兼職教授,著有《神經網絡實用教程》、《數據挖掘:實用案例分析》、《MATLAB數據分析與挖掘實戰》等暢銷書。
前 言
基 礎 篇
第1章 數據挖掘基礎2
1.1 某知名連鎖餐飲企業的睏惑2
1.2 從餐飲服務到數據挖掘3
1.3 數據挖掘的基本任務4
1.4 數據挖掘建模過程4
1.4.1 定義挖掘目標4
1.4.2 數據取樣5
1.4.3 數據探索6
1.4.4 數據預處理7
1.4.5 挖掘建模7
1.4.6 模型評價7
1.5 常用數據挖掘建模工具7
1.6 小結9
第2章 R語言簡介10
2.1 R安裝10
2.2 R使用入門11
2.2.1 R操作界麵11
2.2.2 RStudio窗口介紹12
2.2.3 R常用操作13
2.3 R數據分析包16
2.4 配套附件使用設置18
2.5 小結18
第3章 數據探索19
3.1 數據質量分析19
3.1.1 缺失值分析20
3.1.2 異常值分析20
3.1.3 一緻性分析22
3.2 數據特徵分析23
3.2.1 分布分析23
3.2.2 對比分析25
3.2.3 統計量分析27
3.2.4 周期性分析29
3.2.5 貢獻度分析30
3.2.6 相關性分析31
3.3 R語言主要數據探索函數35
3.3.1 統計特徵函數35
3.3.2 統計作圖函數37
3.4 小結40
第4章 數據預處理41
4.1 數據清洗42
4.1.1 缺失值處理42
4.1.2 異常值處理45
4.2 數據集成45
4.2.1 實體識彆46
4.2.2 冗餘屬性識彆46
4.3 數據變換46
4.3.1 簡單函數變換46
4.3.2 規範化47
4.3.3 連續屬性離散化48
4.3.4 屬性構造51
4.3.5 小波變換52
4.4 數據規約55
4.4.1 屬性規約55
4.4.2 數值規約58
4.5 R語言主要數據預處理函數61
4.6 小結65
第5章 挖掘建模66
5.1 分類與預測66
5.1.1 實現過程66
5.1.2 常用的分類與預測算法67
5.1.3 迴歸分析68
5.1.4 決策樹73
5.1.5 人工神經網絡79
5.1.6 分類與預測算法評價83
5.1.7 R語言主要分類與預測算法函數87
5.2 聚類分析89
5.2.1 常用聚類分析算法89
5.2.2 KMeans聚類算法90
5.2.3 聚類分析算法評價95
5.2.4 R語言主要聚類分析算法函數95
5.3 關聯規則97
5.3.1 常用關聯規則算法97
5.3.2 Apriori算法98
5.4 時序模式102
5.4.1 時間序列算法103
5.4.2 時間序列的預處理104
5.4.3 平穩時間序列分析105
5.4.4 非平穩時間序列分析107
5.4.5 R語言主要時序模式算法函數114
5.5 離群點檢測116
5.5.1 離群點檢測方法117
5.5.2 基於模型的離群點檢測方法118
5.5.3 基於聚類的離群點檢測方法120
5.6 小結122
實 戰 篇
第6章 電力竊漏電用戶自動識彆126
6.1 背景與挖掘目標126
6.2 分析方法與過程129
6.2.1 數據抽取130
6.2.2 數據探索分析130
6.2.3 數據預處理133
6.2.4 構建專傢樣本137
6.2.5 模型構建138
6.3 上機實驗143
6.4 拓展思考144
6.5 小結144
第7章 航空公司客戶價值分析145
7.1 背景與挖掘目標145
7.2 分析方法與過程146
7.2.1 數據抽取149
7.2.2 數據探索分析149
7.2.3 數據預處理150
7.2.4 模型構建153
7.3 上機實驗158
7.4 拓展思考159
7.5 小結159
第8章 中醫證型關聯規則挖掘160
8.1 背景與挖掘目標160
8.2 分析方法與過程162
8.2.1 數據獲取163
8.2.2 數據預處理165
8.2.3 模型構建169
8.3 上機實驗171
8.4 拓展思考172
8.5 小結172
第9章 基於水色圖像的水質評價173
9.1 背景與挖掘目標173
9.2 分析方法與過程174
9.2.1 數據預處理175
9.2.2 模型構建177
9.2.3 水質評價179
9.3 上機實驗180
9.4 拓展思考180
9.5 小結181
第10章 傢用電器用戶行為分析與事件識彆182
10.1 背景與挖掘目標182
10.2 分析方法與過程183
10.2.1 數據抽取184
10.2.2 數據探索分析185
10.2.3 數據預處理185
10.2.4 模型構建195
10.2.5 模型檢驗198
10.3 上機實驗200
10.4 拓展思考201
10.5 小結202
第11章 應用係統負載分析與磁盤容量預測203
11.1 背景與挖掘目標203
11.2 分析方法與過程205
11.2.1 數據抽取206
11.2.2 數據探索分析206
11.2.3 數據預處理207
11.2.4 模型構建208
11.3 上機實驗213
11.4 拓展思考214
11.5 小結215
第12章 電子商務智能推薦服務216
12.1 背景與挖掘目標216
12.2 分析方法與過程222
12.2.1 數據抽取224
12.2.2 數據探索分析225
12.2.3 數據預處理230
12.2.4 模型構建235
12.3 上機實驗245
12.4 拓展思考246
12.5 小結251
第13章 基於數據挖掘技術的市財政收入分析預測模型252
13.1 背景與挖掘目標252
13.2 分析方法與過程254
13.2.1 灰色預測與神經網絡的組閤模型255
13.2.2 數據探索分析256
13.2.3 模型構建259
13.3 上機實驗273
13.4 拓展思考273
13.5 小結274
第14章 基於基站定位數據的商圈分析275
14.1 背景與挖掘目標275
14.2 分析方法與過程277
14.2.1 數據抽取277
14.2.2 數據探索分析278
14.2.3 數據預處理279
14.2.4 模型構建282
14.3 上機實驗286
14.4 拓展思考286
14.5 小結287
第15章 電商産品評論數據情感分析288
15.1 背景與挖掘目標288
15.2 分析方法與過程288
15.2.1 評論數據采集289
15.2.2 評論預處理292
15.2.3 文本評論分詞297
15.2.4 模型構建298
15.3 上機實驗312
15.4 拓展思考313
15.5 小結314
提 高 篇
第16章 基於R語言的數據挖掘二次開發316
16.1 混閤編程應用體驗——TipDM數據挖掘平颱316
16.2 二次開發過程環境配置320
16.3 R語言數據挖掘二次開發實例322
16.4 小結325
參考資料326
R語言數據分析與挖掘實戰 下載 mobi pdf epub txt 電子書 格式 2024
R語言數據分析與挖掘實戰 下載 mobi epub pdf 電子書趁著打摺,一下買瞭好些書,包裝都是挺好,像是正版,唯一不太好的就是同樣是自營的有些書沒有打摺,加入購物車時沒發現!
評分一直信賴京東!無論是日用電器還是生鮮水果肉菜。都還選擇京東!質量好,服務一流,價格優惠!以後會繼續支持!
評分我為什麼喜歡在京東買東西,因為今天買明天就可以送到。我為什麼每個商品的評價都一樣,因為在京東買的東西太多太多瞭,導緻積纍瞭很多未評價的訂單,所以我統一用段話作為評價內容。京東購物這麼久,有買到很好的産品
評分買瞭準備學習,還沒開始看
評分最近活動買瞭好多書,我覺得挺好的 都是正版新書
評分質量非常好,與賣傢描述的完全一緻,非常滿意,真的很喜歡,完全超齣期望值,發貨速度非常快,包裝非常仔細、嚴實,物流公司服務態度很好,運送速度很快,很滿意的一次購物
評分努力學習,天天嚮上。哈哈哈哈
評分為什麼貨物到瞭沒有發票?為什麼貨物到瞭沒有發票?為什麼貨物到瞭沒有發票?
評分吼吼哈啊哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈啊哈哈哈哈哈哈哈啊哈哈哈
R語言數據分析與挖掘實戰 mobi epub pdf txt 電子書 格式下載 2024