內容簡介
本書共11章,將高效機器學習的理論、設計原則以及實際應用有機結閤,深入探討瞭機器學習的主要課題,包括知識發現、分類、遺傳算法、神經網絡、內核方法和生物啓發技術等。讀者可從中瞭解機器學習技術可以解決的相關問題和相應解決方案的實現,以及新係統的設計方法。本書講解由淺入深,適閤算法工程師、高校工科專業的學生、IT專業人員以及機器學習愛好者,為他們設計和創建全新有效的機器學習係統提供知識和實踐指導。
作者簡介
Rahul Khanna 英特爾公司專注於節能算法開發的平颱架構師。在過去17年裏,他從事服務器係統軟件技術的研發工作,包括平颱自動化、電力/熱力優化技術、可靠性、優化和預測方法。他已經編寫瞭與能量優化、平颱無綫互連、傳感器網絡、互連可靠性、預測建模、運動估計和安全的大量技術論文和圖書。他擁有17項專利。他是英特爾高速互連內置自測試IBIST方法的聯閤發明人。他的研究興趣包括基於機器學習的電力/熱力優化算法,窄信道高速無綫互連,稠密傳感器網絡中的信息檢索。他是IEEE成員;並且由於其在平颱技術改進領域的貢獻,3次獲得英特爾成就奬。
Mariette Awad 貝魯特美國大學電子和計算機工程係助理教授。她從佛濛特大學大學獲得電子工程博士學位,曾是弗吉尼亞聯邦大學、麻省理工學院客座教授。她還曾在IBM公司係統和技術團隊擔任無綫産品工程師。她的研究興趣包括機器學習、數據分析和能耗感知計算。
目錄
目 錄
Efficient Learning Machines:Theories,Concepts,and Applications for Engineers and System Designers
譯者序
作者簡介
技術評審簡介
緻謝
第1章 機器學習1
1.1 關鍵術語2
1.2 機器學習的步驟4
1.3 機器學習算法6
1.4 流行的機器學習算法9
1.4.1 C4.59
1.4.2 k均值9
1.4.3 支持嚮量機10
1.4.4 Apriori算法10
1.4.5 估計最大化11
1.4.6 PageRank算法11
1.4.7 AdaBoost12
1.4.8 k近鄰算法13
1.4.9 樸素貝葉斯14
1.4.10 分類迴歸樹14
1.5 數據挖掘研究中的挑戰性問題14
1.5.1 針對高維數據和高速數據流的擴展15
1.5.2 挖掘序列數據和時間序列數據15
1.5.3 從復雜數據中挖掘復雜知識15
1.5.4 分布式數據挖掘與挖掘多代理數據15
1.5.5 數據挖掘過程的相關問題16
1.5.6 安全性、隱私性和數據完整性16
1.5.7 處理非靜態、不平衡和代價敏感的數據16
1.6 總結16
參考文獻16
第2章 機器學習與知識發現18
2.1 知識發現20
2.1.1 分類20
2.1.2 聚類20
2.1.3 降維21
2.1.4 協同過濾21
2.2 機器學習:分類算法21
2.2.1 邏輯迴歸21
2.2.2 隨機森林22
2.2.3 隱馬爾可夫模型23
2.2.4 多層感知機24
2.3 機器學習:聚類算法26
2.3.1 k均值聚類26
2.3.2 模糊k均值(模糊c均值)26
2.3.3 流k均值算法27
2.4 機器學習:降維28
2.4.1 奇異值分解28
2.4.2 主成分分析29
2.4.3 Lanczos算法31
2.5 機器學習:協同過濾32
2.5.1 基於用戶的協同過濾32
2.5.2 基於項目的協同過濾32
2.5.3 權值-λ-正規化的交替最小二乘法33
2.6 機器學習:相似矩陣34
2.6.1 Pearson相關係數34
2.6.2 Spearman等級相關係數34
2.6.3 歐氏距離35
2.6.4 Jaccard相似係數35
2.7 總結35
參考文獻36
第3章 支持嚮量機分類37
3.1 從幾何角度看待SVM37
3.2 SVM的主要性能38
3.3 硬間隔SVM41
3.4 軟間隔SVM43
3.5 核SVM44
3.6 多分類SVM47
3.7 SVM用於非平衡數據集49
3.8 提升SVM計算需求51
3.9 案例研究:SVM用於手寫識彆53
3.9.1 預處理54
3.9.2 特徵提取54
3.9.3 分層的、三級SVM55
3.9.4 實驗結果56
3.9.5 復雜度分析57
參考文獻59
第4章 支持嚮量迴歸63
4.1 SVR概述63
4.2 SVR:概念、數學模型和圖形錶示64
4.3 核SVR和不同的損失函數:數學模型和圖形錶示68
4.4 貝葉斯綫性迴歸69
4.5 案例研究:非對稱SVR電源預測72
參考文獻75
第5章 隱馬爾可夫模型76
5.1 離散的馬爾可夫過程76
5.1.1 定義178
5.1.2 定義278
5.1.3 定義378
5.2 HMM簡介78
5.2.1 HMM的要點80
5.2.2 HMM的三種基本問題80
5.2.3 HMM基本問題的解決81
5.3 連續觀測HMM86
5.3.1 多元高斯混閤模型88
5.3.2 示例:工作負載相位識彆88
5.3.3 監視和觀測89
5.3.4 工作負載和相位89
5.3.5 相位探測的混閤模型91
參考文獻98
第6章 仿生計算:群體智能100
6.1 應用101
6.1.1 演化硬件101
6.1.2 仿生網絡103
6.1.3 數據中心優化105
6.2 仿生計算算法106
6.3 群體智能106
6.3.1 蟻群優化算法107
6.3.2 粒子群優化算法109
6.3.3 人工蜂群算法111
6.4 細菌覓食優化算法113
6.5 人工免疫係統114
6.6 數據中心的分布式管理116
6.6.1 工作負載特徵116
6.6.2 熱度優化117
6.6.3 負載均衡117
6.6.4 算法模型118
參考文獻120
第7章 深度神經網絡122
7.1 ANN簡介122
7.1.1 早期的ANN結構123
7.1.2 經典的ANN124
7.1.3 ANN訓練和反嚮傳播算法127
7.2 DBN概述128
7.3 受限玻爾茲曼機130
7.4 DNN訓練算法131
7.5 DNN相關研究133
7.5.1 DNN應用134
7.5.2 利用並行實現加快DNN訓練135
7.5.3 類似於DBN的深度網絡135
參考文獻136
第8章 皮質算法141
8.1 皮質算法入門141
8.1.1 皮質算法的結構141
8.1.2 皮質算法的訓練143
8.2 權重更新145
8.3 案例研究:改進的皮質算法在阿拉伯語口語數字化中的應用149
8.3.1 基於熵的權重更新規則149
8.3.2 實驗驗證150
參考文獻153
第9章 深度學習156
9.1 層級時序存儲概述156
9.2 層級時序存儲的演化157
9.2.1 稀疏分布錶徵160
9.2.2 算法實現160
9.2.3 空間池160
9.2.4 時間池162
9.3 相關工作163
9.4 脈衝神經網絡概述164
9.4.1 Hodgkin-Huxley模型165
9.4.2 integrate-and-fire模型165
9.4.3 leaky integrate-and-fire模型165
9.4.4 Izhikevich模型166
9.4.5 Thorpe’s模型166
精彩書摘
數據中心在處理電力傳輸、能源消耗、熱量管理、安全性、存儲性能、服務保證以及動態資源分配關鍵問題時所處的環境是復雜的。這些挑戰與提供有效的協調性以提高數據中心的穩定性和效率相關。變動的需求和大型數據中心的工作負載特性使得維持工作負載性能、冷卻效率和能源目標(在下麵的章節討論)的任務變得復雜。在如此龐大的係統集群中,多目標優化策略通過避免重復分配促動器,提供約束、時序粒度、方法類型、控製序列的復雜組閤來達到預期的服務水平。然而,組閤解空間可能非常大,無法在有限時間內收斂到全局最優。因此,集中式的數據中心管理係統可能無法在限定的時間內實現較好地擴展,因此可能無法提供一個最佳管理解決方案。
SI已成為一個有前途的領域,它可以用來構建分布式的管理策略,並産生不受集中控製的可擴展的解決方案。以下各節將介紹可為工作負載配置識彆閤適目標的控製係統,主要包括如下基本控製元件:
控製過程:該控製過程實現瞭反饋控製環路,這用於約束給定策略下服務器計算集群的溫度和功率。最優的處理過程運行在策略約束和足夠的能量供應範圍內,從而實現最高的性能效率和最低的冷卻效率。
適應度函數:適應度函數評估瞭最有利工作負載的配置,它是基於現有知識庫的預期需求和可用性的資源。
知識庫:知識庫為一個由代理傳感器産生的調查數據組成的有限的數據庫。這方麵的知識有助於確定最閤適的工作負載配置。由於係統是動態變化的,根據自定義數據保留策略,較新的數據會代替舊的數據。知識數據庫增加瞭數據的保留程度以此可能調高解決方案的適應性,同時不斷減少對現有的解決方案無益的數據。
控製參數:控製參數定義瞭最優決策的界限,決定瞭在選定的計算節點上的工作負載的配置。
群代理:代理群通過在分散和自組織的係統中扮演特定的角色來參與到係統優化過程中。這些代理相互之間以及與環境之間相協調,最終産生全局的智能行為。
……
高效機器學習:理論、算法及實踐 下載 mobi epub pdf txt 電子書 格式