編輯推薦
適讀人群 :《Hadoop生態係統》廣大讀者。 本書將幫助你決定Hadoop中哪些組件適閤完成你的項目。
內容簡介
《Hadoop生態係統》本書每一章都介紹瞭不同的主題(例如核心技術或數據傳輸),並且解釋瞭為什麼特定組件適用或不適用特定的需求。對於數據處理來說,使用Hadoop是一個全新的挑戰,但如果有瞭這本便利的參考書,你將很容易領會使用Hadoop的精妙所在。
主要包括如下主題:核心技術,Hadoop分布式文件係統(HDFS)、MapReduce、YARN和Spark。數據庫和數據管理,Cassandra、HBase、MongoDB和Hive。序列化,Avro、JSON和Parquet。管理和監視,Puppet、Chef、Zookeeper和Oozie。分析輔助,Pig、Mahout和MLLib。數據傳輸,Scoop、Flume、distcp和Storm。安全、訪問控製和審計,Sentry、Kerberos和Knox。雲計算和虛擬化,Serengeti、Docker和Whirr。
作者簡介
Kevin Sitto,是Pivotal Software公司的領域解決方案工程師,主要為客戶提供谘詢服務,幫助客戶理解和描述大數據需求。
Marshall Presser,是Pivotal Data Engineering集團的成員。他幫助客戶使用Hadoop、關係數據庫和內存數據網格來解決復雜的分析問題。
目錄
前言 1
第1章關鍵技術 7
1.1 Hadoop分布式文件係統(HDFS) 8
1.2 MapReduce . 11
1.3 YARN 13
1.4 Spark . 15
第2章數據庫及數據管理 17
2.1 Cassandra .19
2.2 HBase 21
2.3 Accumulo .24
2.4 Memcached . 26
2.5 Blur .28
2.6 Solr . 30
2.7 MongoDB 32
2.8 Hive 34
2.9 Spark SQL ( 前身是 Shark) 36
2.10 Giraph . 38
第3章序列化 41
3.1 Avro 43
3.2 JSON 46
3.3 Protocol Buffers (protobuf) . 48
3.4 Parquet 50
第4章管理與監控. 53
4.1 Ambari 54
4.2 HCatalog 56
4.3 Nagios 58
4.4 Puppet 59
4.5 Chef 61
4.6 ZooKeeper 63
4.7 Oozie . 66
4.8 Ganglia . 68
第5章分析輔助 . 69
5.1 MapReduce 接口69
5.2 分析庫 70
5.3 Pig 72
5.4 Hadoop Streaming 74
5.5 Mahout 76
5.6 MLLib 78
5.7 Hadoop 圖像處理接口(HIPI) 80
5.8 SpatialHadoop 81
第6章數據傳輸 . 83
6.1 Sqoop .85
6.2 Flume .87
6.3 DistCp 89
6.4 Storm . 90
第7章安全、訪問控製和審計 93
7.1 Sentry. 95
7.2 Kerberos 97
7.3 Knox 99
第8章雲計算和虛擬化 101
8.1 Serengeti. 103
8.2 Docker105
8.3 Whirr 107
Hadoop生態係統 下載 mobi epub pdf txt 電子書 格式
評分
☆☆☆☆☆
安裝師傅很好,比平時便宜很多的,京東物流速度也好快
評分
☆☆☆☆☆
書很厚,還沒有看,紙質不錯
評分
☆☆☆☆☆
有瞭京東就沒在實體店買過書瞭,為什麼?你說呢。
評分
☆☆☆☆☆
書剛收到,正準備看,昨天買的今天就到瞭,京東快遞很快!!
評分
☆☆☆☆☆
很滿意這次購物,這次買的書感覺可以看一年瞭,非常劃算
評分
☆☆☆☆☆
好好好好好好好好好好好好好好好
評分
☆☆☆☆☆
很低調我我居然抱抱睡覺嗲迴去為地底世界
評分
☆☆☆☆☆
說實在話,質量很好,一直在京東買東西,這幾天給我女朋友買瞭很多東西,都在京東買的,最看中物流速度
評分
☆☆☆☆☆
不錯不錯啊,很值得很簡單