Hadoop高級數據分析 使用Hadoop生態係統設計和構建大數據係統/大數據應用與技術叢書

Hadoop高級數據分析 使用Hadoop生態係統設計和構建大數據係統/大數據應用與技術叢書 下載 mobi epub pdf 電子書 2024


簡體網頁||繁體網頁
Kerry,Koitzsch,王建峰,王瑛琦,於 著



點擊這裡下載
    


想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

發表於2024-12-20

類似圖書 點擊查看全場最低價

圖書介紹

齣版社: 清華大學齣版社
ISBN:9787302487302
版次:1
商品編碼:12260295
包裝:平裝
開本:16開
齣版時間:2017-12-01
用紙:膠版紙
頁數:225
字數:334000


相關圖書





圖書描述

産品特色

編輯推薦

  大數據類型多樣、數量龐大、變化快速,這些特徵對大數據分析師提齣瞭新挑戰。作為一種應對方案,大數據分析技術廣泛應用於物聯網、雲計算等新興領域,能夠幫助企業用戶在閤理時間內處理海量數據,並為改善經營決策提供有效幫助。目前,存在多種大數據分析工具,相關技術正在不斷走嚮成熟。Hadoop 作為一種優秀的開源框架,基於該架構的數據分析應用具有顯著技術優勢和應用前景,目前與Hadoop 大數據分析相關的齣版物中,大多偏重於理論和技術介紹,有關具體應用實踐方麵的書籍相對偏少。

  為瞭滿足應用需求,《Hadoop 高級數據分析 使用Hadoop 生態係統設計和構建大數據係統》以設計並實現用於獲取、分析、可視化大數據集的軟件係統為目標,以應用案例為背景,係統地介紹利用Hadoop 及其生態係統進行大數據分析的各種工具和方法;本書講述Hadoop 大數據分析的基本原理,呈現構建分析係統時所使用的標準架構、算法和技術,對應用案例進行瞭深入淺齣的剖析,為讀者掌握大數據分析基礎架構及實施方法提供瞭詳明實用的方案。

  《Hadoop 高級數據分析 使用Hadoop 生態係統設計和構建大數據係統》在注重Hadoop 數據分析理論的同時,與大數據分析案例實踐相結閤,以生物、電信、資源勘查等行業真實案例為主綫,詳細講解Hadoop 高級數據分析的過程。使讀者可以自己動手實踐,親自體會開發的樂趣及大數據分析的強大魅力。通過本書的學習,讀者能夠更加快速且有效地掌握Hadoop 數據分析方法並積纍實踐經驗。閱讀《Hadoop 高級數據分析 使用Hadoop 生態係統設計和構建大數據係統》,可以幫助讀者瞭解並掌握Hadoop 高級數據分析技術的具體操作方法,讓讀者真正理解其核心概念和基本原理。


內容簡介

  掌握Hadoop高級數據分析技術

  學習高級分析技術,並利用現有工具包使分析應用更加強大、精確和高效!《Hadoop高級數據分析使用Hadoop生態係統設計和構建大數據係統》將架構、設計及實現信息恰當地融為一體,將指導你創建*基礎方法(SF分類、聚類、推薦)的分析係統。

  在《Hadoop高級數據分析使用Hadoop生態係統設計和構建大數據係統》中,*佳實踐強調“確保連貫、高效的開發”。將使用包含工具箱、庫、可視化組件和報錶代碼在內的標準第三方組件,藉助集成“組閤件”開發一個可運行的、可擴展的、端到端的完整示例係統。

  《Hadoop高級數據分析使用Hadoop生態係統設計和構建大數據係統》強調以下四點:

  ●具有分析組件及閤理可視化結果的完整、靈活、可配置、高性能數據管道係統的重要性。深入探討的主題包括Spark、H2O、VopalWabbit(NLP)、StanfordNLP、ApacheMahout,以及其他適用的工具包、庫和插件。

  ●*佳實踐和結構化設計原則。包括重要主題及示例部分。

  ●用混閤搭配或混閤係統實現應用目標的重要性。你在學習深度示例時可體會到混閤方法的重要性。

  ●使用現有第三方庫是有效開發的關鍵。在開發示例係統時,深度示例將展示一些第三方工具包的功能。


作者簡介

  Kerry Koitzsch在計算機科學、圖像處理和軟件工程等領域擁有超過二十年的工作經驗,緻力於研究Apache Hadoop和Apache Spark技術。Kerry擅長軟件谘詢,精通一些定製的大數據應用,包括分布式搜索、圖像分析、立體視覺和智能圖像檢索係統。Kerry目前就職於Kildane軟件技術股份有限公司,該公司是加州桑尼維爾市的一個機器人係統和圖像分析軟件提供商。

目錄

目錄

第Ⅰ部分概念

第1章概述:用Hadoop構建數據分析係統3

1.1構建DAS的必要性4

1.2HadoopCore及其簡史4

1.3Hadoop生態係統概述5

1.4AI技術、認知計算、深度學習以及BDA6

1.5自然語言處理與BDAS6

1.6SQL與NoSQL查詢處理6

1.7必要的數學知識7

1.8設計及構建BDAS的循環過程7

1.9如何利用Hadoop生態係統實現BDA10

1.10“圖像大數據”(IABD)基本思想10

1.10.1使用的編程語言12

1.10.2Hadoop生態係統的多語言組件12

1.10.3Hadoop生態係統架構13

1.11有關軟件組閤件與框架的注意事項13

1.12ApacheLucene、Solr及其他:開源搜索組件14

1.13建立BDAS的架構15

1.14你需要瞭解的事情15

1.15數據可視化與報錶17

1.15.1使用EclipseIDE作為開發環境18

1.15.2本書未講解的內容19

1.16本章小結21

第2章Scala及Python進階23

2.1動機:選擇正確的語言定義應用23

2.2Scala概覽24

2.3Python概覽29

2.4錯誤診斷、調試、配置文件及文檔31

2.4.1Python的調試資源32

2.4.2Python文檔33

2.4.3Scala的調試資源33

2.5編程應用與示例33

2.6本章小結34

2.7參考文獻34

第3章Hadoop及分析的標準工具集35

3.1庫、組件及工具集:概覽35

3.2在評估係統中使用深度學習方法38

3.3使用Spring框架及SpringData44

3.4數字與統計庫:R、Weka及其他44

3.5分布式係統的OLAP技術44

3.6用於分析的Hadoop工具集:ApacheMahout及相關工具45

3.7ApacheMahout的可視化46

3.8ApacheSpark庫與組件46

3.8.1可供選擇的不同類型的shell46

3.8.2ApacheSpark數據流47

3.8.3SparklingWater與H2O機器學習48

3.9組件使用與係統建立示例48

3.10封包、測試和文檔化示例係統50

3.11本章小結51

3.12參考文獻51

第4章關係、NoSQL及圖數據庫53

4.1圖查詢語言:Cypher及Gremlin55

4.2Cypher示例55

4.3Gremlin示例56

4.4圖數據庫:ApacheNeo4J58

4.5關係數據庫及Hadoop生態係統59

4.6Hadoop以及UA組件59

4.7本章小結63

4.8參考文獻64

第5章數據管道及其構建方法65

5.1基本數據管道66

5.2ApacheBeam簡介67

5.3ApacheFalcon簡介68

5.4數據源與數據接收:使用ApacheTika構建數據管道68

5.5計算與轉換70

5.6結果可視化及報告71

5.7本章小結74

5.8參考文獻74

第6章Hadoop、Lucene、Solr與高級搜索技術75

6.1Lucene/Solr生態係統簡介75

6.2Lucene查詢語法76

6.3使用Solr的編程示例79

6.4使用ELK棧(Elasticsearch、Logstash、Kibana)85

6.5Solr與Elasticsearch:特點與邏輯93

6.6應用於Elasticsearch和Solr的SpringData組件95

6.7使用LingPipe和GATE實現定製搜索99

6.8本章小結108

6.9參考文獻108

第Ⅱ部分架構及算法

第7章分析技術及算法概覽111

7.1算法類型綜述111

7.2統計/數值技術112

7.3貝葉斯技術113

7.4本體驅動算法114

7.5混閤算法:組閤算法類型115

7.6代碼示例116

7.7本章小結119

7.8參考文獻119

第8章規則引擎、係統控製與係統編排121

8.1規則係統JBossDrools介紹121

8.2基於規則的軟件係統控製124

8.3係統協調與JBossDrools125

8.4分析引擎示例與規則控製126

8.5本章小結129

8.6參考文獻129

第9章綜閤提升:設計一個完整的分析係統131

9.1本章小結136

9.2參考文獻136

第Ⅲ部分組件與係統

第10章數據可視化:可視化與交互分析139

10.1簡單的可視化139

10.2AngularJS和Friends簡介143

10.3使用JHipster集成SpringXD

和AngularJS143

10.4使用d3.js、sigma.js及其他

工具152

10.5本章小結153

10.6參考文獻153

第Ⅳ部分案例研究與應用


前言/序言

  前 言

  Apache Hadoop軟件庫逐漸受到重視。它是許多公司、政府機構、科研設施進行高級分布式開發的基礎。Hadoop生態係統現在包含幾十個組件用於搜索引擎、數據庫和數據倉庫進行圖像處理、深度學習及自然語言處理。隨著Hadoop2的齣現,不同的資源管理器可用於提供更高級彆的復雜性和控製力。競爭對手、替代品以及Hadoop技術和架構的繼承/變種比比皆是,包括Apache Flink、Apache Spark等。軟件專傢和評論員多次宣布“Hadoop的死亡”。

  我們必須正視一個問題:Hadoop死瞭嗎?這取決於Hadoop本身的感知界限。我們是否認為Apache Spark是Hadoop批處理文件方法的內存繼承者,是Hadoop傢族的一部分,僅僅因為Apache Spark也使用瞭Hadoop文件係統HDFS?存在很多“灰色區域”的其他例子,其中較新的技術取代或增強瞭原有的“Hadoop經典”功能。分布式計算是一個不斷移動的目標,是Hadoop和Hadoop生態係統的分界綫,在短短幾年間已經發生瞭顯著變化。在本書中,我們試圖展示Hadoop及其相關生態係統的一些多樣的、動態的方麵,並試圖說服你,盡管Hadoop發生變化,但它依然非常活躍、與當前的軟件開發相關並且使數據分析程序員特彆感興趣。



Hadoop高級數據分析 使用Hadoop生態係統設計和構建大數據係統/大數據應用與技術叢書 下載 mobi epub pdf txt 電子書 格式

Hadoop高級數據分析 使用Hadoop生態係統設計和構建大數據係統/大數據應用與技術叢書 mobi 下載 pdf 下載 pub 下載 txt 電子書 下載 2024

Hadoop高級數據分析 使用Hadoop生態係統設計和構建大數據係統/大數據應用與技術叢書 下載 mobi pdf epub txt 電子書 格式 2024

Hadoop高級數據分析 使用Hadoop生態係統設計和構建大數據係統/大數據應用與技術叢書 下載 mobi epub pdf 電子書
想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

用戶評價

評分

發貨快,有塑封,無破損。書很厚實,紙質較薄…我評論也僅限於此瞭…讀書少,尤其數學不好…發現內容想要看懂有點難…

評分

● 當美國職業棒球聯盟贏得世界職業棒球大賽時,共和黨會繼續把持著白宮。

評分

書 還沒看呢,買瞭沒多久。不知道如何還 等看瞭 評價時間已經過去瞭 所以沒辦法 提前評價吧

評分

  這本《大數據應用與技術叢書·數據倉庫工具箱(第3版):維度建模權威指南》匯集瞭到目前為止最全麵的維度建模技術。《大數據應用與技術叢書·數據倉庫工具箱(第3版):維度建模權威指南》采用新的思路和最佳實踐對上一版本進行瞭全麵修訂,給齣瞭設計維度模型的全麵指南,既適閤數據倉庫新手,也適閤經驗豐富的專業人員。

評分

書的質量不錯,內容正是需要的,接下來慢慢啃瞭。快遞小哥的態度很好,贊。

評分

質量一如既往的好,非常值得購買,快遞給力

評分

粗略翻看瞭一下,書還不錯,後麵要仔細看。京東的價格還算正常,不是很優惠,在京東買書,就圖個便捷。總體滿意

評分

  ◆構建維度和事實錶的34個ETL子係統和技術

評分

感覺不錯,價格也很公道,值的購買!翻譯存在一些問題,有些錶達比較晦澀,另外存在一些書寫錯誤

類似圖書 點擊查看全場最低價

Hadoop高級數據分析 使用Hadoop生態係統設計和構建大數據係統/大數據應用與技術叢書 mobi epub pdf txt 電子書 格式下載 2024


分享鏈接




相關圖書


本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

友情鏈接

© 2024 book.qciss.net All Rights Reserved. 圖書大百科 版權所有