內容介紹
內容介紹
內容介紹
本書是一本討論大數據理論及應用實踐的專著,從討論理論界的前沿觀點開始,之後轉嚮討論這些理論在日常商業活動中的實踐應用。 本書首先介紹瞭大數據分析的業務應用場景、分析建模過程和主要任務,以及模型商用的關鍵點;接著講述瞭數據收集、抽樣和預處理的實施要點;之後係統性地討論瞭各種模型技術及其應用,包括預測分析、描述分析、生存分析、社交網絡分析等。在完成瞭這些理論知識和模型技術方法鋪墊之後,就進入到實踐應用部分,包括把分析活動轉化為生産力的關鍵事項,以及各種應用實例。 本書幫助讀者係統地梳理瞭各類模型方法的技術要點和應用要點,包括綫性迴歸、Logistic迴歸、決策樹、聚類、關聯規則、序列規則、神經網絡、支持嚮量機、套袋算法、Boosting算法、隨機森林算法、生存分析等;本書還介紹瞭大量的應用實例,如信用風險建模、欺詐檢測、營銷響應提升模型、客戶流失預測、自動推薦、網頁分析、社交媒體分析,以及業務流程分析等。因此,對於從事大數據分析相關工作的人士來說,本書是一本難得的實務指南;對於高等院校相關專業的師生來說,本書是一本非常好的課外閱讀材料,特彆是書中關於如何把分析變成生産力的章節部分,相信一定能給他們很多的啓發和思考。
作者介紹
作者介紹
巴特?貝森斯(Bart Baesens)是比利時魯汶大學的副教授,英國南安普敦大學的講師,以及國際zhiming的數據分析資深顧問。他是網絡分析、客戶關係管理和欺詐偵測等領域傑齣的研究實踐者。他在多種世界zhiming期刊(如《機器學習》(Machine Learning)和《管理科學》(Management Science)上發錶瞭多篇論文,還是《信用風險管理精要》(牛津大學齣版社,2008年齣版)一書的作者。
關聯推薦
關聯推薦
深度挖掘如何把大數據分析變成生産力,側重於案例研究和行動方案,而非聚焦算法模型的技術細節。可口可樂歐洲公司首席信息官、eBay公司高級總監聯袂鼎力推薦!
目錄
目錄
目錄
1 第1章 大數據及其分析
1.1 大數據的業務應用場景
1.2 基本的專業術語
1.3 分析過程模型
1.4 分析建模活動中的任務及角色
1.5 分析技術
1.6 分析模型的要求
1.7 本章參考文獻
13 第2章 數據采集、抽樣和預處理
2.1 數據源的類型
2.2 數據抽樣
2.3 數據類型
2.4 數據可視化及探索性統計分析
2.5 缺失值的處理
2.6 異常值檢測及處理
2.7 數據標準化
2.8 粗分類(Categorization)處理
2.9 WOE值的計算
2.10 變量的選擇
2.11 細分
2.12 本章參考文獻
35 第3章 預測分析
3.1 定義目標變量
3.2 綫性迴歸
3.3 Logistic迴歸
3.4 決策樹
3.5 神經網絡
3.6 支持嚮量機
3.7 集成算法
3.7.1 套袋算法(Bagging)
3.7.2 Boosting方法
3.7.3 隨機森林
3.8 多類分類技術
3.8.1 多類Logistic迴歸
3.8.2 多類決策樹
3.8.3 多類神經網絡
3.8.4 多類支持嚮量機
3.9 預測模型的評估
3.9.1 數據集的分割
3.9.2 分類模型的性能評估
3.9.3 迴歸模型的性能評估
3.10 本章參考文獻
89 第4章 描述性分析
4.1 關聯規則
4.1.1 基本概念及假設
4.1.2 支持度和置信度
4.1.3 關聯規則的挖掘
4.1.4 提升度的度量
4.1.5 關聯規則的後處理
4.1.6 關聯規則的擴展
4.1.7 關聯規則的應用
4.2 序列規則
4.3 細分技術
4.3.1 分層聚類
4.3.2 K-Means聚類
4.3.3 自組織映射圖(SOM)
4.3.4 聚類解決方案的應用及解釋
4.4 本章參考文獻
107 第5章 生存分析
5.1 生存分析的基本概念和函數
5.2 卡普蘭·梅爾分析
5.3 參數法生存分析
5.4 比例風險迴歸模型
5.5 生存分析模型的擴展
5.6 生存分析模型的評估
5.7 本章參考文獻
123 第6章 社交網絡分析
6.1 社交網絡的定義
6.2 社交網絡的度量
6.3 社交網絡學習
6.4 關係近鄰分類器
6.5 概率關係近鄰分類器
6.6 關係邏輯迴歸
6.7 共同模式推斷
6.8 自中心網絡(EGO NETS)
6.9 偶圖/二分圖
6.10 本章參考文獻
137 第7章 從分析到生産力
7.1 模型的後驗測試
7.1.1 分類模型的後驗測試
7.1.2 迴歸模型的後驗測試
7.1.3 聚類模型的後驗測試
7.1.4 設計後驗測試方案
7.2 參照管理
7.3 數據質量
7.4 軟件工具
7.5 隱私保護
7.6 模型設計相關文檔
7.7 公司治理
7.8 本章參考文獻
167 第8章 實踐與案例
8.1 信用風險建模
8.2 欺詐檢測
8.3 淨響應提升建模
8.4 流失預測
8.4.1 流失預測模型
8.4.2 流失預測流程
8.5 推薦係統
8.5.1 協同過濾推薦
8.5.2 基於內容的推薦
8.5.3 基於人口統計信息的推薦
8.5.4 基於知識的推薦
8.5.5 組閤推薦
8.5.6 推薦係統的評價
8.5.7 案例介紹
8.6 網頁分析
8.6.1 網頁數據收集
8.6.2 Web KPI指標
8.6.3 從Web KPI到行動洞察力
8.6.4 導航分析
8.6.5 搜索引擎營銷分析
8.6.6 A/B測試和多變量測試
8.7 社會化媒體分析
8.7.1 社交網站:B2B廣告工具
8.7.2 情感分析
8.7.3 網絡分析
8.8 業務流程分析
8.8.1 流程智能
8.8.2 流程挖掘和分析
8.8.3 形成閉環:全流程的整閤數據分析
8.9 本章參考文獻
231 譯者後記
作者介紹
作者介紹
巴特?貝森斯(Bart Baesens)是比利時魯汶大學的副教授,英國南安普敦大學的講師,以及國際zhiming的數據分析資深顧問。他是網絡分析、客戶關係管理和欺詐偵測等領域傑齣的研究實踐者。他在多種世界zhiming期刊(如《機器學習》(Machine Learning)和《管理科學》(Management Science)上發錶瞭多篇論文,還是《信用風險管理精要》(牛津大學齣版社,2008年齣版)一書的作者。
關聯推薦
關聯推薦
深度挖掘如何把大數據分析變成生産力,側重於案例研究和行動方案,而非聚焦算法模型的技術細節。可口可樂歐洲公司首席信息官、eBay公司高級總監聯袂鼎力推薦!
目錄
目錄
目錄
1 第1章 大數據及其分析
1.1 大數據的業務應用場景
1.2 基本的專業術語
1.3 分析過程模型
1.4 分析建模活動中的任務及角色
1.5 分析技術
1.6 分析模型的要求
1.7 本章參考文獻
13 第2章 數據采集、抽樣和預處理
2.1 數據源的類型
2.2 數據抽樣
2.3 數據類型
2.4 數據可視化及探索性統計分析
2.5 缺失值的處理
2.6 異常值檢測及處理
2.7 數據標準化
2.8 粗分類(Categorization)處理
2.9 WOE值的計算
2.10 變量的選擇
2.11 細分
2.12 本章參考文獻
35 第3章 預測分析
3.1 定義目標變量
3.2 綫性迴歸
3.3 Logistic迴歸
3.4 決策樹
3.5 神經網絡
3.6 支持嚮量機
3.7 集成算法
3.7.1 套袋算法(Bagging)
3.7.2 Boosting方法
3.7.3 隨機森林
3.8 多類分類技術
3.8.1 多類Logistic迴歸
3.8.2 多類決策樹
3.8.3 多類神經網絡
3.8.4 多類支持嚮量機
3.9 預測模型的評估
3.9.1 數據集的分割
3.9.2 分類模型的性能評估
3.9.3 迴歸模型的性能評估
3.10 本章參考文獻
89 第4章 描述性分析
4.1 關聯規則
4.1.1 基本概念及假設
4.1.2 支持度和置信度
4.1.3 關聯規則的挖掘
4.1.4 提升度的度量
4.1.5 關聯規則的後處理
4.1.6 關聯規則的擴展
4.1.7 關聯規則的應用
4.2 序列規則
4.3 細分技術
4.3.1 分層聚類
4.3.2 K-Means聚類
4.3.3 自組織映射圖(SOM)
4.3.4 聚類解決方案的應用及解釋
4.4 本章參考文獻
107 第5章 生存分析
5.1 生存分析的基本概念和函數
5.2 卡普蘭·梅爾分析
5.3 參數法生存分析
5.4 比例風險迴歸模型
5.5 生存分析模型的擴展
5.6 生存分析模型的評估
5.7 本章參考文獻
123 第6章 社交網絡分析
6.1 社交網絡的定義
6.2 社交網絡的度量
6.3 社交網絡學習
6.4 關係近鄰分類器
6.5 概率關係近鄰分類器
6.6 關係邏輯迴歸
6.7 共同模式推斷
6.8 自中心網絡(EGO NETS)
6.9 偶圖/二分圖
6.10 本章參考文獻
137 第7章 從分析到生産力
7.1 模型的後驗測試
7.1.1 分類模型的後驗測試
7.1.2 迴歸模型的後驗測試
7.1.3 聚類模型的後驗測試
7.1.4 設計後驗測試方案
7.2 參照管理
7.3 數據質量
7.4 軟件工具
7.5 隱私保護
7.6 模型設計相關文檔
7.7 公司治理
7.8 本章參考文獻
167 第8章 實踐與案例
8.1 信用風險建模
8.2 欺詐檢測
8.3 淨響應提升建模
8.4 流失預測
8.4.1 流失預測模型
8.4.2 流失預測流程
8.5 推薦係統
8.5.1 協同過濾推薦
8.5.2 基於內容的推薦
8.5.3 基於人口統計信息的推薦
8.5.4 基於知識的推薦
8.5.5 組閤推薦
8.5.6 推薦係統的評價
8.5.7 案例介紹
8.6 網頁分析
8.6.1 網頁數據收集
8.6.2 Web KPI指標
8.6.3 從Web KPI到行動洞察力
8.6.4 導航分析
8.6.5 搜索引擎營銷分析
8.6.6 A/B測試和多變量測試
8.7 社會化媒體分析
8.7.1 社交網站:B2B廣告工具
8.7.2 情感分析
8.7.3 網絡分析
8.8 業務流程分析
8.8.1 流程智能
8.8.2 流程挖掘和分析
8.8.3 形成閉環:全流程的整閤數據分析
8.9 本章參考文獻
231 譯者後記
大數據分析 數據科學應用場景與實踐精髓 下載 mobi epub pdf txt 電子書 格式