實戰大數據 MATLAB數據挖掘詳解與實踐

實戰大數據 MATLAB數據挖掘詳解與實踐 下載 mobi epub pdf 電子書 2024


簡體網頁||繁體網頁
許國根,賈瑛 著



點擊這裡下載
    


想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

發表於2024-12-21

類似圖書 點擊查看全場最低價

圖書介紹

齣版社: 清華大學齣版社
ISBN:9787302451013
版次:1
商品編碼:12145797
包裝:平裝
開本:16開
齣版時間:2017-07-01
用紙:膠版紙
頁數:547
字數:9204000
正文語種:中文


相關圖書





圖書描述

編輯推薦

這是一本真正具備中國特色的數據挖掘手冊,各種常規方法一應俱全,作者是高校教授,同時也是若乾公司的數據挖掘顧問,難得的理論儲備與實踐經驗都十分深厚,錶達能力也很強,也瞭解痛點。基於這些背景創作的這本書,非常好。

內容簡介

大數據時代,我們需要對各種海量數據進行篩選、清洗、挖掘,在這個過程中,獲取有效數據的方式方法和模型算法成為瞭整個數據挖掘過程的重點,MATLAB作為一個數據挖掘工具,如何正確和準確地使用它成為瞭重中之重。
針對實際應用數據挖掘技術的要求,本書既介紹瞭數據挖掘的基礎理論和技術,又較為詳細地介紹瞭各種算法以及MATLAB程序。本書共分4篇,分彆介紹瞭數據挖掘的基本概念、技術與算法以及應用實例。期望通過大量的實例分析幫助廣大讀者掌握數據挖掘技術,並應用於實際的研究中,提高對海量數據信息的處理及挖掘能力。本書針對性和實用性強,具有較高的理論和實用價值。
本書作者就職於部隊高校,專攻數據挖掘,並應用於大量實際項目,本書同時得到瞭國內著名數據挖掘公司的技術支持,很多案例來自實際項目。
本書可作為高等院校計算機工程、信息工程、生物醫學工程、化學、環境、經濟、管理等學科的研究生、本科生的教材或教學參考書,亦可作為企事業單位管理者、信息分析人員、市場營銷人員和研究與開發人員的參考資料。

目錄

第1章 緒論 1
1.1 數據挖掘概述 2
1.2 數據挖掘的分類 4
1.3 數據挖掘的過程 5
1.4 數據挖掘的任務 6
1.5 數據挖掘的對象 8
1.5.1 數據庫 8
1.5.2 文本 10
1.5.3 圖像與視頻數據 10
1.5.4 Web數據 11
1.6 數據挖掘建模方法 11
1.6.1 業務理解 12
1.6.2 數據理解 13
1.6.3 數據準備 13
1.6.4 建模 14
1.6.5 評估 15
1.6.6 部署 16
1.7 數據挖掘的應用 16
1.7.1 在金融領域的應用 16
1.7.2 在零售業中的應用 17
1.7.3 在電信業的應用 18
1.7.4 在管理中的應用 19
1.7.5 在化學研究領域中的應用 19
1.7.6 在材料研究、生産方麵的應用 20
1.7.7 在機械故障診斷與監測中的應用 21
1.7.8 在醫療領域中的應用 22
第2章 數據挖掘算法 25
2.1 決策樹算法 26
2.1.1 決策樹基本算法 27
2.1.2 ID3算法 29
2.1.3 C4.5算法 30
2.1.4 CART算法 31
2.1.5 決策樹的評價標準 32
2.1.6 決策樹的剪枝及優化 33
2.1.7 基於matlab的決策樹分析 34
2.2 人工神經網絡算法 41
2.2.1 人工神經網絡概述 41
2.2.2 人工神經網絡的基本模型 41
2.2.3 BP神經網絡 43
2.2.4 RBF神經網絡 45
2.2.5 SOM神經網絡 46
2.2.6 反饋型神經網絡(Hopfield) 47
2.2.7 基於matlab的神經網絡方法 49
2.3 進化算法 55
2.3.1 進化算法的基本原理 56
2.3.2 基因算法的主要步驟 60
2.3.3 基本遺傳算法 61
2.3.4 進化規劃算法 63
2.3.5 進化策略計算 64
2.3.6 量子遺傳算法 68
2.3.7 人工免疫算法 72
2.3.8 基於matlab的進化算法 80
2.4 統計分析方法 87
2.4.1 假設檢驗 87
2.4.2 迴歸分析 91
2.4.3 二項邏輯(logistic)迴歸 100
2.4.4 方差分析 104
2.4.5 主成分分析 107
2.4.6 因子分析 110
2.4.7 基於matlab的統計分析方法 113
2.5 貝葉斯網絡方法 141
2.5.1 貝葉斯定理、先驗和後驗 142
2.5.2 貝葉斯網絡 142
2.5.3 貝葉斯網絡學習 143
2.5.4 主要貝葉斯網絡模型 145
2.5.5 基於matlab的貝葉斯網絡方法 148
2.6 支持嚮量機 160
2.6.1 支持嚮量機概述 160
2.6.2 核函數 162
2.6.3 基於matlab的支持嚮量機方法 164
2.7 關聯分析 167
2.7.1 概述 167
2.7.2 Apriori關聯規則算法 170
2.7.3 基於分類搜索的關聯規則算法 171
2.7.4 時序關聯規則算法 173
2.7.5 多值屬性關聯規則算法 174
2.7.6 增量關聯規則算法 175
2.7.7 基於關聯規則的分類算法 176
2.7.8 模糊關聯分類算法 177
2.7.9 關聯規則的評價 178
2.7.10 辛普森悖論 179
2.7.11 基於matlab的關聯規則分析 180
2.8 其他數據挖掘方法 182
2.8.1 近鄰法 182
2.8.2 K-means聚類 184
2.8.3 基於matlab的近鄰法及k-means聚類法 187
第3章 數據挖掘相關技術 191
3.1 數據倉庫 192
3.1.1 概述 192
3.1.2 數據倉庫設計 195
3.1.3 數據倉庫的開發應用 199
3.1.4 數據倉庫的技術管理 209
3.1.5 OLAP技術 210
3.1.6 基於matlab的數據倉庫開發技術 214
3.2 模糊集理論 234
3.1.1 模糊集閤 234
3.1.2 模糊關係 237
3.1.3 模糊聚類 239
3.3.5 基於matlab的模糊集處理技術 244
3.3 粗糙集技術 255
3.3.1 粗糙集理論的基本概念 256
3.3.2 分類規則的形成 259
3.3.3 知識的約簡 259
3.3.4 模糊集與粗糙集 261
3.3.5 基於matlab的粗糙集處理方法 262
3.4 目標優化技術 265
3.4.1 極值問題 266
3.4.2 無約束非綫性規劃 267
3.4.3 有約束非綫性規劃 270
3.4.4 大規模優化問題的分解算法 270
3.4.5 其他優化方法 273
3.4.6 基於matlab的目標優化方法 274
3.5 可視化技術 281
3.5.1 可視化技術分類 282
3.5.2 多維數據可視化 283
3.5.3 圖形的特徵分析 294
3.5.4 基於多元圖的圖形分類方法 297
3.5.5 基於色度學空間的多元圖錶示 299
3.5.6 基於matlab的數據可視化技術 300
3.6 公式發現 314
3.6.1 概述 315
3.6.2 公式發現係統中的知識 315
3.6.3 基於matlab的公式發現 319
3.7 多媒體數據挖掘技術 320
3.7.1 文本挖掘 323
3.7.2 圖像挖掘 331
3.7.3 視頻挖掘 331
3.7.4 音頻挖掘 332
3.7.5 復閤類型數據的挖掘 333
3.8 Web數據挖掘技術 334
3.8.1 Web內容挖掘 335
3.8.2 Web結構挖掘 337
3.8.3 Web使用挖掘 338

第4章 數據挖掘應用實戰 343
4.1 數據關係發現 344
4.2 數據統計特性 344
4.3 數據預處理 349
4.3.1 數據清理 349
4.3.2 數據集成與轉換 351
4.3.3 數據歸約與濃縮 353
4.3.4 數值數據的概念分層與離散化 360
4.3.5 例題 362
4.4 分類 373
4.5 例題 376
4.6 預測 381
4.6.1 迴歸分析 381
4.6.2 時間序列預測模型 385
4.6.3 馬爾可夫鏈 389
4.6.4 灰色係統方法 390
4.6.5 例題 398
4.7 聚類 418
4.7.1 聚類分析概述 418
4.7.2 聚類分析中的數據類型 419
4.7.3相似性度量 422
4.7.4 聚類的特徵 427
4.7.5 聚類準則 427
4.7.6 劃分方法 429
4.7.7 層次方法 430
4.7.8 基於密度的方法 433
4.7.9 基於網格的方法 434
4.7.10 基於模型的聚類方法 435
4.4.11 基於目標函數的方法 436
4.7.12 離群點檢測 438
4.7.13 聚類有效性 445
4.7.14 例題 448
4.8 時序數據挖掘 462
4.8.1 基本定義 463
4.8.2 時序數據挖掘參數 464
4.8.3 時序關聯規則 464
4.8.4 時間序列挖掘 466
4.8.5 時間序列分段綫性錶示 468
4.8.6 時間序列的預測 469
4.8.7 例題 469
4.9 關聯規則挖掘 481
4.9.1 關聯規則的類型及挖掘算法 481
4.9.2 基於組織進化的關聯規則挖掘 481
4.9.3 基於組織層次進化的關聯規則挖掘 483
4.9.4 多維關聯規則挖掘 484
4.9.5 關聯規則擴展 485
4.9.6 例題 487
參考文獻 500




精彩書摘

  第3章人工神經網絡算法
  3.1 人工神經網絡概述
  人工神經網絡(Artificial Neural Network,ANN)有時簡稱為神經網絡,是在現代生物學研究人腦組織所取得成果的基礎上提齣的,它利用大量簡單的處理單元廣泛連接組成的復雜網絡,來模擬人類大腦的神經網絡結構和行為。它的研究成果顯示瞭人工神經網絡具有人腦功能的基本物質特徵——學習、記憶、概括、歸納和抽取等,從而解決瞭人工智能研究中的某些局限性。它不同於以前人工智能領域中普遍采用的基於邏輯和符號處理的理論和方法,而是開闢瞭嶄新的途徑。
  神經網絡的産生是從生物學上獲得的靈感,它將實現模擬生物神經元的某些基本功能的元件組織起來,而組織方式或是按人腦組織方式,或是根本不按人腦組織方式,不管其是高度相似,還是簡單模仿,神經網絡仍能顯示其驚人的與人腦相近的特性。例如,它能學習專門知識,從先前已有的實例中概括齣新的例子。
  隨著神經網絡的大量開創性應用,可以發現,不管網絡的組織形式如何,它們均有以下三個共同的特性。
  (1)學習。神經網絡具有對周圍環境自學習、自適應的功能。這種學習機製基於網絡的組織形式能適應各種學習算法,而學習算法是指網絡能根據訓練實例來決定自身的行為,當齣現一組輸入信息(或附有所需的輸齣結果)時,它們能不斷調整,産生一係列一緻的結果,猶如人們智能活動“習慣成自然”一樣,反映齣網絡的學習性能。
  (2)概括。一旦訓練後,神經網絡的響應能在某種程度上對外界輸齣信息的少量丟失或神經網絡組織的局部缺損不再很敏感。這種機製與大腦每日有大量神經網絡正常死亡但並不影響大腦的功能,或者大腦局部損傷會引起某些功能的逐漸衰退,但不是功能完全喪失一樣,反映瞭神經網絡的魯棒性,即具有容錯能力。
  (3)抽取。神經網絡還有一種抽取外界輸入信息特徵的特殊功能,可以從不完善的數據和圖形進行學習和做齣決定。一旦訓練完成,就能從給定的輸入模式快速計算齣結果。如對它進行一張人像的一係列不完整的照片識彆訓練之後,再任選一張缺損的照片讓神經網絡識彆,網絡將會做齣一個完整形式的人像照片的響應。在某種意義上可以說它能“創造”齣以前從未見到的某些東西。
  人工神經網絡的這些基本特徵反映瞭它能較之其他人工智能理論和方法更好地解決這方麵的任務。同時,也可以看齣它實現的是右半腦直覺形象思維的特性,而傳統人工智能理論和方法實現左半腦邏輯思維的特性,它們有著互補的作用,而不是簡單取代的關係。正是具有這些特點,人工神經網絡在人工智能、自動控製、計算機科學、信息處理、模式識彆等領域得到瞭廣泛的應用。‘
  ……

前言/序言

  本書按照理論基礎、實現步驟、實例三部分內容進行闡述,避免空洞的理論說教,著重介紹應用實例,具有較強的指導性和實用性,使讀者不至於麵對如此豐富的理論和方法無所適從,而是通過瞭解各種算法的實現思路和方法,體會算法源代碼的意義,這樣即使所舉的實例不屬於讀者從事的學科,也能舉一反三,掌握數據挖掘技術並應用於自己從事的科學研究中。
  本書分為4篇,每篇涵蓋的內容比較廣泛,既有對數據挖掘概念的討論,也有對數據挖掘技術和原理的介紹,而且編寫瞭大量的實例,並給齣瞭相應的程序。第1篇介紹數據挖掘的相關概念以及在多個領域中的應用情況;第2篇介紹數據挖掘算法,包括人工神經網絡、決策樹、遺傳算法、關聯分析、統計分析方法、支持嚮量機及一些聚類算法;第3篇介紹與數據挖掘相關的一些技術,包括數據倉庫、模糊集理論、粗糙集技術、目標優化技術、可視化技術、公式發現、多媒體數據挖掘技術及Web數據挖掘技術;第4篇介紹數據挖掘具體應用實例,重點介紹數據預處理技術、聚類、分類、預測、關聯規則分析、時間序列分析等方法。
  本書的齣版得到瞭清華大學齣版社的大力支持,編輯欒大成為本書內容等許多方麵提齣瞭寶貴的意見。書中參考瞭許多學者的研究成果,在此一並錶示衷心的感謝!
  由於數據挖掘的內容非常豐富,所涉及的學科也較多,且限於作者學識水平,書中難免存在缺點、錯誤以及疏漏,敬請讀者批評斧正。
  本書為讀者提供實例中給齣的MATLAB程序,需要者可登錄清華大學齣版社網站,注冊之後進行下載。作者隨時解答讀者問題。
  許國根
  本書習題代碼下載
  說明:本書習題按照“篇”分類,共三個文件夾,請對應正文的習題編號進行查詢。


實戰大數據 MATLAB數據挖掘詳解與實踐 下載 mobi epub pdf txt 電子書 格式

實戰大數據 MATLAB數據挖掘詳解與實踐 mobi 下載 pdf 下載 pub 下載 txt 電子書 下載 2024

實戰大數據 MATLAB數據挖掘詳解與實踐 下載 mobi pdf epub txt 電子書 格式 2024

實戰大數據 MATLAB數據挖掘詳解與實踐 下載 mobi epub pdf 電子書
想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

用戶評價

評分

質量很好

評分

挺厚實

評分

質量很好

評分

這個不錯的 還會再來

評分

內容東拼西湊,居然寫到547頁,書的例子不多卻很簡單,還冠名為大數據,照這樣的寫作方式我可以寫1000000000000000000000000000000萬本。誰賣誰後悔

評分

不錯不錯。

評分

這個不錯的 還會再來

評分

很基礎的工具書,希望有幫助

評分

速度快,質量好,支持京東!

類似圖書 點擊查看全場最低價

實戰大數據 MATLAB數據挖掘詳解與實踐 mobi epub pdf txt 電子書 格式下載 2024


分享鏈接




相關圖書


本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

友情鏈接

© 2024 book.qciss.net All Rights Reserved. 圖書大百科 版權所有