Hadoop高級數據分析使用Hadoop生態係統設計和構建大數據係統/大數據應用與技術叢書下載 mobi epub pdf 電子書 2025

簡體網頁||繁體網頁

☆☆☆☆☆

Kerry，Koitzsch，王建峰，王瑛琦，於著

下載連結在頁面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 複製連結

想要找書就要到圖書大百科

book.qciss.net

立刻按 ctrl+D收藏本頁

你會得到大驚喜!!

齣版社：清華大學齣版社

ISBN：9787302487302

版次：1

商品編碼：12260295

包裝：平裝

開本：16開

齣版時間：2017-12-01

用紙：膠版紙

頁數：225

字數：334000

具體描述

産品特色

編輯推薦

　　大數據類型多樣、數量龐大、變化快速，這些特徵對大數據分析師提齣瞭新挑戰。作為一種應對方案，大數據分析技術廣泛應用於物聯網、雲計算等新興領域，能夠幫助企業用戶在閤理時間內處理海量數據，並為改善經營決策提供有效幫助。目前，存在多種大數據分析工具，相關技術正在不斷走嚮成熟。Hadoop 作為一種優秀的開源框架，基於該架構的數據分析應用具有顯著技術優勢和應用前景，目前與Hadoop 大數據分析相關的齣版物中，大多偏重於理論和技術介紹，有關具體應用實踐方麵的書籍相對偏少。

　　為瞭滿足應用需求，《Hadoop 高級數據分析使用Hadoop 生態係統設計和構建大數據係統》以設計並實現用於獲取、分析、可視化大數據集的軟件係統為目標，以應用案例為背景，係統地介紹利用Hadoop 及其生態係統進行大數據分析的各種工具和方法；本書講述Hadoop 大數據分析的基本原理，呈現構建分析係統時所使用的標準架構、算法和技術，對應用案例進行瞭深入淺齣的剖析，為讀者掌握大數據分析基礎架構及實施方法提供瞭詳明實用的方案。

　　《Hadoop 高級數據分析使用Hadoop 生態係統設計和構建大數據係統》在注重Hadoop 數據分析理論的同時，與大數據分析案例實踐相結閤，以生物、電信、資源勘查等行業真實案例為主綫，詳細講解Hadoop 高級數據分析的過程。使讀者可以自己動手實踐，親自體會開發的樂趣及大數據分析的強大魅力。通過本書的學習，讀者能夠更加快速且有效地掌握Hadoop 數據分析方法並積纍實踐經驗。閱讀《Hadoop 高級數據分析使用Hadoop 生態係統設計和構建大數據係統》，可以幫助讀者瞭解並掌握Hadoop 高級數據分析技術的具體操作方法，讓讀者真正理解其核心概念和基本原理。

內容簡介

　　掌握Hadoop高級數據分析技術

　　學習高級分析技術，並利用現有工具包使分析應用更加強大、精確和高效！《Hadoop高級數據分析使用Hadoop生態係統設計和構建大數據係統》將架構、設計及實現信息恰當地融為一體，將指導你創建*基礎方法(SF分類、聚類、推薦)的分析係統。

　　在《Hadoop高級數據分析使用Hadoop生態係統設計和構建大數據係統》中，*佳實踐強調“確保連貫、高效的開發”。將使用包含工具箱、庫、可視化組件和報錶代碼在內的標準第三方組件，藉助集成“組閤件”開發一個可運行的、可擴展的、端到端的完整示例係統。

　　《Hadoop高級數據分析使用Hadoop生態係統設計和構建大數據係統》強調以下四點：

　　●具有分析組件及閤理可視化結果的完整、靈活、可配置、高性能數據管道係統的重要性。深入探討的主題包括Spark、H2O、VopalWabbit(NLP)、StanfordNLP、ApacheMahout，以及其他適用的工具包、庫和插件。

　　●*佳實踐和結構化設計原則。包括重要主題及示例部分。

　　●用混閤搭配或混閤係統實現應用目標的重要性。你在學習深度示例時可體會到混閤方法的重要性。

　　●使用現有第三方庫是有效開發的關鍵。在開發示例係統時，深度示例將展示一些第三方工具包的功能。

作者簡介

　　Kerry Koitzsch在計算機科學、圖像處理和軟件工程等領域擁有超過二十年的工作經驗，緻力於研究Apache Hadoop和Apache Spark技術。Kerry擅長軟件谘詢，精通一些定製的大數據應用，包括分布式搜索、圖像分析、立體視覺和智能圖像檢索係統。Kerry目前就職於Kildane軟件技術股份有限公司，該公司是加州桑尼維爾市的一個機器人係統和圖像分析軟件提供商。

前言/序言

　　前言

　　Apache Hadoop軟件庫逐漸受到重視。它是許多公司、政府機構、科研設施進行高級分布式開發的基礎。Hadoop生態係統現在包含幾十個組件用於搜索引擎、數據庫和數據倉庫進行圖像處理、深度學習及自然語言處理。隨著Hadoop2的齣現，不同的資源管理器可用於提供更高級彆的復雜性和控製力。競爭對手、替代品以及Hadoop技術和架構的繼承/變種比比皆是，包括Apache Flink、Apache Spark等。軟件專傢和評論員多次宣布“Hadoop的死亡”。

　　我們必須正視一個問題：Hadoop死瞭嗎？這取決於Hadoop本身的感知界限。我們是否認為Apache Spark是Hadoop批處理文件方法的內存繼承者，是Hadoop傢族的一部分，僅僅因為Apache Spark也使用瞭Hadoop文件係統HDFS？存在很多“灰色區域”的其他例子，其中較新的技術取代或增強瞭原有的“Hadoop經典”功能。分布式計算是一個不斷移動的目標，是Hadoop和Hadoop生態係統的分界綫，在短短幾年間已經發生瞭顯著變化。在本書中，我們試圖展示Hadoop及其相關生態係統的一些多樣的、動態的方麵，並試圖說服你，盡管Hadoop發生變化，但它依然非常活躍、與當前的軟件開發相關並且使數據分析程序員特彆感興趣。