發表於2024-12-30
《機器學習在綫:解析阿裏雲機器學習平颱》以機器學習中的典型案例為主綫,條分縷析梳理阿裏雲的平颱功能,講解如何用阿裏雲的機器學習平颱來實現各類應用,包括商傢作弊檢測、生存預測、信用風險預測、用戶購買行為預測等,並完整地介紹瞭機器學習的基本原理與實踐技巧。
以機器學習中的典型案例為主綫,條分縷析梳理阿裏雲的平颱功能,講解如何用阿裏雲的機器學習平颱來實現各類應用,包括商傢作弊檢測、生存預測、信用風險預測、用戶購買行為預測等,並完整地介紹瞭機器學習的基本原理與實踐技巧。
第1章 阿裏雲機器學習 1
1.1 産品特點 1
1.2 名詞解釋 2
1.3 構建機器學習實驗 3
1.3.1 新建實驗 3
1.3.2 使用組件搭建工作流 4
1.3.3 運行實驗、查看結果 5
1.3.4 模型部署、在綫預測 6
第2章 商傢作弊行為檢測 7
2.1 數據探索 8
2.2 建模、預測和評估 15
2.3 嘗試其他分類模型 19
2.4 判斷商傢作弊 24
第3章 生存預測 27
3.1 數據集一 27
3.1.1 特徵分析 28
3.1.2 生存預測 33
3.2 數據集二 36
3.2.1 隨機森林模型 39
3.2.2 樸素貝葉斯模型 47
第4章 信用風險預測 50
4.1 整體流程 53
4.1.1 特徵啞元化 54
4.1.2 特徵重要性 57
4.2 模型效果評估 61
4.3 減少模型特徵的個數 62
第5章 用戶購買行為預測 65
5.1 數據探索 66
5.2 思路 68
5.2.1 用戶和品牌的各種特徵 69
5.2.2 二分類模型訓練 71
5.3 計算訓練數據集 71
5.3.1 原始數據劃分 72
5.3.2 計算特徵 74
5.3.3 計算標簽 89
5.4 二分類模型訓練 90
5.4.1 正負樣本配比 90
5.4.2 邏輯迴歸算法 92
5.4.3 隨機森林算法 94
第6章 聚類與分類 96
6.1 數據可視化 97
6.2 K-Means聚類 98
6.2.1 聚類、評估流程 100
6.2.2 聚成兩類 101
6.2.3 聚成三類 103
6.3 K最近鄰算法 104
6.3.1 使用KNN算法進行分類 105
6.3.2 算法比較 108
6.4 多分類模型 109
6.4.1 使用樸素貝葉斯算法 109
6.4.2 使用邏輯迴歸多分類算法 112
6.4.3 使用隨機森林算法 115
6.4.4 各多分類模型效果對比 118
第7章 葡萄酒品質預測 119
7.1 數據探索 120
7.2 綫性迴歸 123
7.3 GBDT迴歸 125
第8章 文本分析 127
8.1 分詞 128
8.2 詞頻統計 130
8.3 單詞的區分度 131
8.4 字符串比較 133
8.5 抽取關鍵詞、關鍵句 139
8.5.1 原理簡介 139
8.5.2 完整流程 141
8.6 主題模型 146
8.6.1 LDA模型 147
8.6.2 新聞的主題模型 149
8.6.3 數據預處理 150
8.6.4 主題與原始分類的關係 153
8.7 單詞映射為嚮量 160
8.7.1 相近單詞 162
8.7.2 單詞聚類 165
8.8 組件使用小結 168
第9章 基於用戶退貨描述的賠付預測 170
9.1 思路 171
9.2 訓練集的特徵生成 173
9.3 測試集的特徵生成 180
9.4 模型訓練、預測、評估 181
9.5 提高召迴率 185
第10章 情感分析 189
10.1 詞袋模型 190
10.1.1 訓練集的特徵生成 192
10.1.2 測試集的特徵生成 196
10.1.3 模型訓練、預測、評估 197
10.2 詞嚮量模型 200
10.2.1 特徵生成 201
10.2.2 模型訓練 206
第11章 影片推薦 211
11.1 協同過濾 212
11.2 整體流程 213
11.3 預處理,過濾齣好評信息 215
11.4 計算影片間的相似度 215
11.5 計算用戶可能喜歡的影片 221
11.6 查看推薦效果 224
第12章 支持深度學習框架 227
12.1 TensorFlow組件簡介 227
12.2 Softmax模型 231
12.3 深度神經網絡 234
附錄A 237
前言
飛速發展的互聯網、物聯網每時每刻都在産生大量的數據,數據的價值也因此被提升到前所未有的高度:越來越多的人投身數據分析的領域,希望通過機器學習及深度學習,從數據中獲取更大的價值。另一方麵,雲計算的蓬勃發展極大地擴展瞭數據的存儲能力,它使計算可以同時使用成百上韆颱機器,快速解決問題,而在計算完成後,又能及時釋放掉資源,控製成本。
在這樣的大背景下,機器學習算法平颱也獲得瞭飛速發展,積纍瞭大量高效的機器學習算法組件,基於這些組件我們可以快速實現業務流程,解決具體問題。在為本書定書名時,受到王堅博士《在綫》一書的影響,覺得用“在綫”一詞來說明目前機器學習平颱的狀態非常恰當:豐富的算法功能可以在綫使用、不需要購買硬件、不需要安裝配置各種環境;數據和計算資源一直處在“在綫”狀態,不必擔心數據太大或計算資源不足的問題。
阿裏雲機器學習算法平颱不僅在阿裏集團內部使用,也已對阿裏集團外部開放,讀者可以通過阿裏雲官網試用或使用本書中介紹的功能。
機器學習平颱提供瞭一個舞颱,主角是其上麵的近百種算法。本書的重點放在這些算法的使用上——通過實際的數據和具體的場景,幫助讀者理解各算法所擅長處理的問題;另外,本書是根據機器學習的知識點由淺入深來逐步組織的,以降低閱讀本書的門檻,使讀者對所學的內容能産生清晰的印象。
在具體章節的組織上,阿裏雲機器學習平颱的介紹占兩個章節,即第1章和附錄A。第1章為平颱簡介,在內容組織上盡量減少文字說明,將最基本的內容用圖例來錶示;附錄A介紹瞭些瑣碎但重要的事情,像如何試用、如何上傳數據以及預處理函數的詳細說明。第2章至第12章是按照機器學習的知識點逐步深入的思路來編排的。分類模型是機器學習理論和應用方麵的重頭,首先是數值類型特徵的二分類模型、擴展特徵的類型、多分類模型;之後介紹聚類模型;然後是迴歸模型;再後麵介紹文本分析領域的應用(主題模型、嚮量化、關鍵詞等),根據文本描述進行預測、情感分析,並以電影數據為例,搭建推薦係統。深度學習的內容放在第12章,圍繞TensorFlow框架組件,介紹瞭一個能體現TensorFlow特點的Softmax模型的例子,然後介紹瞭使用深度學習DNN分類器的例子。
機器學習平颱降低瞭我們使用機器學習知識的門檻,將各個算法作為組件,即使不瞭解其背後的理論知識,讀者仍然可以仿照書中實例,將組件連接起來解決一些實際問題。希望本書能幫助讀者在機器學習的實踐中學習。
最後,感謝一起研發阿裏雲機器學習平颱的各位同事!感謝傢人的理解和支持!
楊旭
2017年7月
機器學習在綫:解析阿裏雲機器學習平颱 下載 mobi pdf epub txt 電子書 格式 2024
機器學習在綫:解析阿裏雲機器學習平颱 下載 mobi epub pdf 電子書很好的專業書籍,慢慢仔細研究,完瞭再追加評論
評分性價比高物流迅速值得購買
評分書的紙張質量不太好啊
評分挺好的,不過就是介紹怎麼用機器學習平颱工具的書
評分紙質差,印刷字跡模糊,像盜版書
評分質量不錯,物流也很快
評分質量不錯,值得購買,物流很快
評分學習阿裏機器學習平颱。
評分剛剛拿到手上,還沒來得及細看。隻是大緻翻瞭翻。實戰性強,內容可以。
機器學習在綫:解析阿裏雲機器學習平颱 mobi epub pdf txt 電子書 格式下載 2024