Hadoop權威指南:大數據的存儲與分析(第4版)+HBase權威指南+Hive編程指南

Hadoop權威指南:大數據的存儲與分析(第4版)+HBase權威指南+Hive編程指南 下載 mobi epub pdf 電子書 2025

想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
店鋪: 藍墨水圖書專營店
齣版社: 清華大學齣版社
ISBN:9787302465133
商品編碼:19864790881
齣版時間:2017-07-01

具體描述

套裝三冊:

HBase權威指南


Hive編程指南


Hadoop權威指南:大數據的存儲與分析(第4版)修訂版


9787302465133 9787115333834 9787115318893



本書結閤理論和實踐,由淺入深,全方位介紹瞭Hadoop這一高性能的海量數據處理和分析平颱。全書5部分24章,第Ⅰ部分介紹Hadoop基礎知識,主題涉及Hadoop、MapReduce、Hadoop分布式文件係統、YARN、Hadoop的I/O操作。第Ⅱ部分介紹MapReduce,主題包括MapReduce應用開發;MapReduce的工作機製、MapReduce的類型與格式、MapReduce的特性。第Ⅲ部分介紹Hadoop的運維,主題涉及構建Hadoop集群、管理Hadoop。第Ⅳ部分介紹Hadoop相關開源項目,主題涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供瞭三個案例,分彆來自醫療衛生信息技術服務商塞納(Cerner)、微軟的人工智能項目ADAM(一種大規模分布式深度學習框架)和開源項目Cascading(一個新的針對MapReduce的數據處理API)。

本書是一本專業、全麵的Hadoop參考書和工具書,闡述瞭Hadoop生態圈的新發展和應用,程序員可以從中探索海量數據集的存儲和分析,管理員可以從中瞭解Hadoop集群的安裝和運維。



第Ⅰ部分Hadoop基礎知識

第1章初識Hadoop3

1.1數據!數據!3

1.2數據的存儲與分析5

1.3查詢所有數據6

1.4不僅僅是批處理7

1.5相較於其他係統的優勢8

1.6ApacheHadoop發展簡史12

1.7本書包含的內容16

第2章關於MapReduce19

2.1氣象數據集19

2.2使用Unix工具來分析數據21

2.3使用Hadoop來分析數據22

2.4橫嚮擴展31

2.5HadoopStreaming37

第3章Hadoop分布式文件係統42

3.1HDFS的設計42

3.2HDFS的概念44

3.3命令行接口50

3.4Hadoop文件係統52

3.5Java接口56

3.6數據流68

3.7通過distcp並行復製76

第4章關於YARN78

4.1剖析YARN應用運行機製79

4.2YARN與MapReduce1相比82

4.3YARN中的調度85

用戶評價

評分

評分

評分

評分

評分

評分

評分

評分

評分

相關圖書

本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.qciss.net All Rights Reserved. 圖書大百科 版權所有