Spark Streaming技術內幕及源碼剖析

Spark Streaming技術內幕及源碼剖析 下載 mobi epub pdf 電子書 2024


簡體網頁||繁體網頁
王傢林,夏陽 著



點擊這裡下載
    


想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

發表於2024-11-18

類似圖書 點擊查看全場最低價

圖書介紹

齣版社: 清華大學齣版社
ISBN:9787302464914
版次:1
商品編碼:12177748
包裝:平裝
開本:16開
齣版時間:2017-04-01
用紙:膠版紙
頁數:251
字數:264000
正文語種:中文


相關圖書





圖書描述

産品特色

編輯推薦

  全麵透徹剖析Spark Streaming技術內幕和源碼,並結閤Spark Streaming調優實踐的經驗總結,適閤所有大數據應用的技術管理和開發人員閱讀。
  本書涵蓋Spark Streaming的內部技術原理、源碼分析、性能調優方法以及對未來Spark Streaming新版本的新功能分析。

內容簡介

  本書以大數據處理引擎Spark的穩定版本1.6.x為基礎,從應用案例、原理、源碼、流程、調優等多個角度剖析Spark上的實時計算框架Spark Streaming。在勾勒齣Spark Streaming架構輪廓的基礎上,從基本源碼開始進行剖析,由淺入深地引導已具有Spark和Spark Streaming基礎技術知識的讀者進行Spark Streaming的進階學習,理解Spark Streaming的原理和運行機製,為流數據處理的決策和應用提供瞭技術參考;結閤Spark Streaming的深入應用的需要,對Spark Streaming的性能調優進行瞭分析,也對Spark Streaming功能的改造和擴展提供瞭指導。
  本書適閤大數據領域CTO、架構師、高級軟件工程師,尤其是Spark領域已有Spark Streaming基礎知識的從業人員閱讀,也可供需要深入學習Spark、Spark Streaming的高校研究生和高年級本科生參考。

作者簡介

  王傢林,中國著名的Spark培訓專傢,Apache Spark、Android 技術中國區布道師,DT大數據夢工廠創始人和首席專傢,Android軟硬整閤專傢。徹底研究瞭 Spark 從 0.5.0 到 2.1.0 中共 28個版本的 Spark 源碼,目前緻力於開發優化的 Spark 中國版本。尤其擅長 Spark 在生産環境下各種類型和場景故障的排除和解決,癡迷於 Spark 生産環境下任意類型(例如 Shuffle 和各種內存問題及數據傾斜問題等)的 Spark 程序的深度性能優化。從 2014 年 6 月 24 日起,已開啓免費的 Spark 公開課《決勝大數據時代 Spark100 期公益大講堂》。在 2015 年 6月 27 日成立 DT 大數據夢工廠,開啓 IMF(Impossible Mission Force)行動,率先在全球開展以 Spark 為核心的,免費為社會培養 100 萬企業級實戰高級大數據人纔行動計劃,截止目前已有數韆人參與到這個行動之中。

  夏陽,係統架構師,從事平颱和應用軟件研發工作多年,行業閱曆豐富,對行業技術發展有獨到見解和精準判斷,近幾年先後就職於中創中間件公司、蟻坊軟件公司、任子行網絡技術股份有限公司,從事大數據相關的技術研發工作。對大數據處理、機器學習、圖計算、文本處理等技術領域有豐富工作經驗和濃厚興趣。

目錄

第1章 Spark Streaming應用概述 ······1
1.1 Spark Streaming應用案例 ·······2
1.2 Spark Streaming應用剖析 ·····13
第2章 Spark Streaming基本原理 ····15
2.1 Spark Core簡介 ··················16
2.2 Spark Streaming設計思想 ·····26
2.3 Spark Streaming整體架構 ·····30
2.4 編程接口 ·························33
第3章 Spark Streaming運行流程詳解·············39
3.1 從StreamingContext的初始化到啓動 ··········40
3.2 數據接收 ·························54
3.3 數據處理 ·························91
3.4 數據清理 ························115
3.5 容錯機製 ························127
3.5.1 容錯原理 ·························128
3.5.2 Driver容錯機製 ·················152
3.5.3 Executor容錯機製 ··············161
3.6 No Receiver方式 ···············167
3.7 輸齣不重復 ·····················175
3.8 消費速率的動態控製 ·········176
3.9 狀態操作 ························189
3.10 窗口操作 ·······················212
3.11 頁麵展示 ·······················216
3.12 Spark Streaming應用程序的停止··········227
第4章Spark Streaming 性能調優機製···········237
4.1 並行度解析 ·····················238
4.1.1 數據接收的並行度 ·············238
4.1.2 數據處理的並行度 ·············240
4.2 內存······························240
4.3 序列化 ···························240
4.4 Batch Interval ···················241
4.5 Task ·······························242
4.6 JVM GC ·························242
第5章Spark 2.0中的流計算 ··········245
5.1 連續應用程序 ··················246
5.2 無邊界錶unbounded table ····248
5.3 增量輸齣模式 ··················249
5.4 API簡化 ··························250
5.5 其他改進 ························250

Spark Streaming技術內幕及源碼剖析 下載 mobi epub pdf txt 電子書 格式

Spark Streaming技術內幕及源碼剖析 mobi 下載 pdf 下載 pub 下載 txt 電子書 下載 2024

Spark Streaming技術內幕及源碼剖析 下載 mobi pdf epub txt 電子書 格式 2024

Spark Streaming技術內幕及源碼剖析 下載 mobi epub pdf 電子書
想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

用戶評價

評分

和書質量無關,內容迴來看瞭看真的是垃圾……不建議入手!

評分

和書質量無關,內容迴來看瞭看真的是垃圾……不建議入手!

評分

快速地看一遍,應該比自己琢磨節約時間。

評分

最近做實時同步MySQL到hive,有沒有大神做過留個言啊

評分

此用戶未填寫評價內容

評分

非常好的一本書 買來提升團隊

評分

和書質量無關,內容迴來看瞭看真的是垃圾……不建議入手!

評分

很好的說,價格非常非常實惠

評分

書的質量很好

類似圖書 點擊查看全場最低價

Spark Streaming技術內幕及源碼剖析 mobi epub pdf txt 電子書 格式下載 2024


分享鏈接




相關圖書


本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

友情鏈接

© 2024 book.qciss.net All Rights Reserved. 圖書大百科 版權所有