大數據時代的R語言·數據挖掘:R語言實戰

大數據時代的R語言·數據挖掘:R語言實戰 下載 mobi epub pdf 電子書 2024


簡體網頁||繁體網頁
黃文,王正林 著



點擊這裡下載
    


想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

發表於2024-12-20

類似圖書 點擊查看全場最低價

圖書介紹

齣版社: 電子工業齣版社
ISBN:9787121231223
版次:1
商品編碼:11477705
品牌:Broadview
包裝:平裝
叢書名: 大數據時代的R語言
開本:16開
齣版時間:2014-06-01
用紙:輕型紙
頁數:292
字數:471000
正文語種:中文


相關圖書





圖書描述

編輯推薦

  


  
  海報:

內容簡介

  數據挖掘技術是當下大數據時代最關鍵的技術,其應用領域及前景不可估量。R是一款極其優秀的統計分析和數據挖掘軟件,《大數據時代的R語言·數據挖掘:R語言實戰》側重使用R進行數據挖掘,重點講述瞭R的數據挖掘流程、算法包的使用及相關工具的應用,同時結閤大量精選的數據挖掘實例對R軟件進行深入潛齣和全麵的介紹,以便讀者能深刻理解R的精髓並能快速、高效和靈活地掌握使用R進行數據挖掘的技巧。
  通過《大數據時代的R語言·數據挖掘:R語言實戰》,讀者不僅能掌握使用R及相關的算法包來快速解決實際問題的方法,而且能得到從實際問題分析入手,到利用R進行求解,以及對挖掘結果進行分析的全麵訓練。

作者簡介

王正林已齣版過如下圖書:1、MATLAB/Simulink與控製係統仿真, 電子工業齣版社2、精通MATLAB7(附光盤) 電子工業齣版社3、精通MATLAB7科學計算(附光盤) 電子工業齣版社

內頁插圖

目錄

第0章 緻敬,R!
緻敬,肩膀!
緻敬,時代!
緻敬,人纔!
緻敬,R 瑟!
上篇 數據預處理
第1章 數據挖掘導引
1.1 數據挖掘概述
1.1.1 數據挖掘的過程
1.1.2 數據挖掘的對象
1.1.3 數據挖掘的方法
1.1.4 數據挖掘的應用
1.2 數據挖掘的算法
1.3 數據挖掘的工具
1.3.1 工具的分類
1.3.2 工具的選擇
1.3.3 商用的工具
1.3.4 開源的工具
1.4 R 在數據挖掘中的優勢
數據挖掘:R 語言實戰
VI
第2章 數據概覽
2.1 n×m 數據集
2.2 數據的分類
2.2.1 一般的數據分類
2.2.2 R 的數據分類
2.2.3 用R 簡單處理數據
2.3 數據抽樣及R 實現
2.3.1 簡單隨機抽樣
2.3.2 分層抽樣
2.3.3 整群抽樣
2.4 訓練集與測試集
2.5 本章匯總
第3章 用R 獲取數據
3.1 獲取內置數據集
3.1.1 datasets 數據集
3.1.2 包的數據集
3.2 獲取其他格式的數據
3.2.1 CSV 與TXT 格式
3.2.2 從Excel 直接獲取數據
3.2.3 從其他統計軟件中獲取數據
3.3 獲取數據庫數據
3.4 獲取網頁數據
3.5 本章匯總
第4章 探索性數據分析
4.1 數據集
4.2 數字化探索
4.2.1 變量概況
4.2.2 變量詳情
4.2.3 分布指標
4.2.4 稀疏性
4.2.5 缺失值
4.2.6 相關性
4.3 可視化探索
4.3.1 直方圖
目 錄
VII
4.3.2 纍積分布圖
4.3.3 箱形圖
4.3.4 條形圖
4.3.5 點陣圖
4.3.6 餅圖
4.5 本章匯總
第5章 數據預處理
5.1 數據集加載
5.2 數據清理
5.2.1 缺失值處理
5.2.2 噪聲數據處理
5.2.3 數據不一緻的處理
5.3 數據集成
5.4 數據變換
5.5 數據歸約
5.6 本章匯總
中篇 基本算法及應用
第6章 關聯分析
6.1 概述
6.2 R 中的實現
6.2.1 相關軟件包
6.2.2 核心函數
6.2.3 數據集
6.3 應用案例
6.3.1 數據初探
6.3.2 對生成規則進行強度控製
6.3.3 一個實際應用
6.3.4 改變輸齣結果形式
6.3.5 關聯規則的可視化
6.4 本章匯總
第7章 聚類分析
7.1 概述
7.1.1 K-均值聚類
數據挖掘:R 語言實戰
VIII
7.1.2 K-中心點聚類
7.1.3 係譜聚類
7.1.4 密度聚類
7.1.5 期望最大化聚類
7.2 R 中的實現
7.2.1 相關軟件包
7.2.2 核心函數
7.2.3 數據集
7.3 應用案例
7.3.1 K-均值聚類
7.3.2 K-中心點聚類
7.3.3 係譜聚類
7.3.4 密度聚類
7.3.5 期望最大化聚類
7.4 本章匯總
第8章 判彆分析
8.1 概述
8.1.1 費希爾判彆
8.1.2 貝葉斯判彆
8.1.3 距離判彆
8.2 R 中的實現
8.2.1 相關軟件包
8.2.2 核心函數
8.2.3 數據集
8.3 應用案例
8.3.1 綫性判彆分析
8.3.2 樸素貝葉斯分類
8.3.3 K 最近鄰
8.3.4 有權重的K 最近鄰算法
8.4 推薦係統綜閤實例
8.4.1 kNN 與推薦
8.4.2 MovieLens 數據集說明
8.4.3 綜閤運用
8.5 本章匯總
目 錄
IX
第9章 決策樹
9.1 概述
9.1.1 樹形結構
9.1.2 樹的構建
9.1.3 常用算法
9.2 R 中的實現
9.2.1 相關軟件包
9.2.2 核心函數
9.2.3 數據集
9.3 應用案例
9.3.1 CART 應用
9.3.2 C4.5 應用
9.4 本章匯總
下篇 高級算法及應用
第10章 集成學習
10.1 概述
10.1.1 一個概率論小計算
10.1.2 Bagging 算法
10.1.3 AdaBoost 算法
10.2 R 中的實現
10.2.1 相關軟件包
10.2.2 核心函數
10.2.3 數據集
10.3 應用案例
10.3.1 Bagging 算法
10.3.2 Adaboost 算法
10.4 本章匯總
第11章 隨機森林
11.1 概述
11.1.1 基本原理
11.1.2 重要參數
11.2 R 中的實現
11.2.1 相關軟件包
數據挖掘:R 語言實戰
X
11.2.2 核心函數
11.2.3 可視化分析
11.3 應用案例
11.3.1 數據處理
11.3.2 建立模型
11.3.3 結果分析
11.3.4 自變量的重要程度
11.3.5 優化建模
11.4 本章匯總
第12章 支持嚮量機
12.1 概述
12.1.1 結構風險最小原理
12.1.2 函數間隔與幾何間隔
12.1.3 核函數
12.2 R 中的實現
12.2.1 相關軟件包
12.2.2 核心函數
12.2.3 數據集
12.3 應用案例
12.3.1 數據初探
12.3.2 建立模型
12.3.3 結果分析
12.3.4 預測判彆
12.3.5 綜閤建模
12.3.6 可視化分析
12.3.7 優化建模
12.4 本章匯總
第13章 神經網絡
13.1 概述
13.2 R 中的實現
13.2.1 相關軟件包
13.2.2 核心函數
13.3 應用案例
13.3.1 數據初探
目 錄
XI
13.3.2 數據處理
13.3.3 建立模型
13.3.4 結果分析
13.3.5 預測判彆
13.3.6 模型差異分析
13.3.7 優化建模
13.4 本章匯總
第14章 模型評估與選擇
14.1 評估過程概述
14.2 安裝Rattle 包
14.3 Rattle 功能簡介
14.3.1 Data――選取數據
14.3.2 Explore――數據探究
14.3.3 Test――數據相關檢驗
14.3.4 Transform――數據預處理
14.3.5 Cluster――數據聚類
14.3.6 Model――模型評估
14.3.7 Evaluate――模型評估
14.3.8 Log――模型評估記錄
14.4 模型評估相關概念
14.4.1 誤判率
14.4.2 正確/錯誤的肯定判斷、正確/錯誤的否定判斷
14.4.3 精確度、敏感度及特異性
14.5 Rattle 在模型評估中的應用
14.5.1 混淆矩陣
14.5.2 風險圖
14.5.3 ROC 圖及相關圖錶
14.5.4 模型得分數據集
14.6 綜閤實例
14.6.1 數據介紹
14.6.2 模型建立
14.6.3 模型結果分析
數據挖掘:R 語言實戰




前言/序言

  在大數據時代,數據挖掘無疑將是最炙手可熱的技術。數據挖掘的理論和方法正曰新月異地發展,數據挖掘的技術及工具,已經滲透到互聯網、金融、電商、管理、生産、決策等各個領域,數據挖掘的軟件也是層齣不窮,其中R是最引入關注的軟件。
  R是一個免費的開源軟件,它提供瞭首屈一指的統計計算和繪圖功能,尤其是大量的數據挖掘方麵的算法包,使得它成為一款優秀的、不可多得的數據挖掘工具軟件。
  本書的主要目的是嚮讀者介紹如何用R進行數據挖掘,通過大量的精選實例,循序漸進、全麵係統地講述R在數據挖掘領域的應用。
  本書以數據預處理、基本算法及應用和高級算法及應用這三篇展開。
  (1)上篇:數據預處理’
  由第1—5章組成,首先簡要介紹數據挖掘流程、算法和工具,然後介紹R中的數據分類和數據集,以及使用R獲取數據的多種靈活的方法。最後講述對數據進行探索性分析和預處理的方法。這些內容是使用R進行數據挖掘的最基礎內容。
  (2)中篇:基本算法及應用
  由第6—9章組成,主要講述數據挖掘的基本算法及應用,包括關聯分析、聚類分析、判彆分析和決策樹,這些算法也是數據挖掘使用最多最普遍的算法。R中提供瞭豐富的、功能強大的算法包和實現函數,數據挖掘的初級和中級用戶務必掌握。
  (3)下篇:高級算法及應用
  由第10—14章組成,主要講述數據挖掘的高級算法及應用,包括集成學習、隨機森林、支持嚮量機和神經網絡,以及使用R中的工具對數據挖掘的模型進行評估與選擇。對於中高級的用戶,可以深入學習一下本篇的內容。
  R的特點是入門非常容易,使用也非常簡單,因此本書不需要讀者具備R和數據挖掘的基礎知識。不管是R初學者,還是熟練的R用戶都能從書中找到對自己有用的內容,快速入門和提高。讀者既可以把本書作為學習如何應用R的一本優秀的教材,也可以作為數據挖掘的工具書。
  全書以實際問題、解決方案和對解決方案的討論為主綫來組織內容,脈絡清晰,並且各章自成體係。讀者可以從頭至尾逐章學習,也可以根據自己的需要進行學習,根據自己在實際中遇到的問題尋找解決方案。
  本書所編寫的源程序,都通過瞭反復調試,方便讀者使用。
  本書主要由黃文、王正林編寫,其他參與編寫的人員有付東旭、王思琪、鍾太平、劉擁軍、陳菜枚、李燦輝、鍾事沅、王曉麗、王龍躍、夏路生、鍾頌飛、鍾杜清、王殿祜等。在此對所有參與編寫的人員錶示感謝!對關心、支持我們的讀者錶示感謝!
  由於時間倉促,作者水平和經驗有限,書中錯漏之處在所難免,敬請讀者指正。
  編者
  2014年4月18日於北京


大數據時代的R語言·數據挖掘:R語言實戰 下載 mobi epub pdf txt 電子書 格式

大數據時代的R語言·數據挖掘:R語言實戰 mobi 下載 pdf 下載 pub 下載 txt 電子書 下載 2024

大數據時代的R語言·數據挖掘:R語言實戰 下載 mobi pdf epub txt 電子書 格式 2024

大數據時代的R語言·數據挖掘:R語言實戰 下載 mobi epub pdf 電子書
想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

用戶評價

評分

書,我的最愛,加油!!!沒到說

評分

好好,書不錯,好好讀讀!

評分

還沒細看,內容有點內啥

評分

還好,反正傢人喜歡就好 其他的無所謂瞭

評分

挺好的,活動價也挺劃算。

評分

還行,感覺中國人寫的比較符閤國人的閱讀習慣,同買的老外寫的感覺翻譯版看著怪怪的。。。

評分

這本書寫得很不錯,印刷也不錯,值得一買

評分

本書質量非常不錯,內容專業,我非常喜歡

評分

專業用書,開拓眼界,對數據處理有幫助。

類似圖書 點擊查看全場最低價

大數據時代的R語言·數據挖掘:R語言實戰 mobi epub pdf txt 電子書 格式下載 2024


分享鏈接




相關圖書


本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

友情鏈接

© 2024 book.qciss.net All Rights Reserved. 圖書大百科 版權所有