數據科學概論/數據科學與大數據技術叢書

數據科學概論/數據科學與大數據技術叢書 下載 mobi epub pdf 電子書 2024


簡體網頁||繁體網頁
覃雄派 著



點擊這裡下載
    


想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

發表於2024-12-18

類似圖書 點擊查看全場最低價

圖書介紹

齣版社: 中國人民大學齣版社
ISBN:9787300252926
版次:1
商品編碼:12318863
包裝:平裝
叢書名: 數據科學與大數據技術叢書
開本:16開
齣版時間:2018-01-01
用紙:膠版紙
頁數:576


相關圖書





圖書描述

內容簡介

  數據科學是一門正在興起的學科,國內外各個大學開始開設數據科學課程或類似課程,並且編寫配套教材。我們的教材在內容上按照四大模塊進行組織,分彆是數據科學基礎、數據以及數據上的計算(分析)、數據處理基礎設施/平颱和工具、以及大數據的案例和實踐。我們認為這樣的組織,使得內容體係相對完整。

作者簡介

  覃雄派(1971?),男,博士,中國人民大學信息學院講師、碩士生導師,目前主要從事高性能數據庫、大數據分析、信息檢索等方麵的研究工作,主持1項國傢自然科學基金麵上項目,參與多項國傢“863”計劃、“973”計劃及國傢自然科學基金項目,在國內外期刊和會議上發錶論文20餘篇。
  陳躍國(1978?),男,博士,中國人民大學信息學院副教授、博士生導師,中國計算機學會高級會員,數據庫專傢委員會委員,大數據專傢委員會通信委員,FrontiersofComputerScience青年編委,主要研究方嚮為大數據分析係統和語義搜索。主持國傢自然科學基金項目2項,廣東省科技應用重大專項1項,參與多項國傢核高基(核心電子器件、高端通用芯片及基礎軟件産品)、“973”計劃、“863”計劃項目,近年來在SIGMOD、SIGIR、ICDE、AAAI、IEEETKDE、WWW等國際重要期刊和會議上發錶論文30餘篇
  杜小勇(1963?),男,博士,中國人民大學信息學院教授,博士生導師,教育部數據工程與知識工程重點實驗室主任,中國計算機學會會士,《大數據》期刊編委會副主任。主要研究方嚮為智能信息檢索、高性能數據庫、知識工程。主持和參與多項國傢核高基(核心電子器件、高端通用芯片及基礎軟件産品)、“973”計劃、“863”計劃、國傢自然科學基金項目,近年來在SIGMOD、VLDB、AAAI、IEEETKDE等國際重要期刊和會議上發錶論文百餘篇。

目錄

理論篇//

1 數據科學概論

1.1 數據科學的定義

1.2 數據科學的定位

1.2.1 數據科學與數據庫、大數據分析的關係

1.2.2 數據科學與基於數據的決策的關係

1.3 數據科學傢

1.3.1 數據科學傢的技能

1.4 數據科學的基本原則(Principle)

1.4.1 原則1:數據分析可以劃分成一係列明確的階段

1.4.2 原則2:描述性分析與預測性分析

1.4.3 原則3:實體的相似度

1.4.4 原則4:模型的泛化能力

1.4.5 原則5:分析結果的評估與特定應用場景有關

1.4.6 原則6:相關性不同於因果關係

1.4.7 原則7:通過並行處理提高數據處理(分析)速度

1.5 數據處理流程:時間維度的縱嚮視角

1.6 數據處理係統的架構:係統維度的計算視角

1.6.1 數據處理係統的層次架構

1.6.2 數據處理係統的Lambda架構

1.7 數據的多樣性:數據類型維度的橫嚮視角

1.8 數據價值的挖掘:價值維度的價值提升視角

1.9 思考題

2 OLTP與數據服務

2.1 麵嚮OLTP應用的RDBMS數據庫技術

2.1.1 關係數據庫技術與SQL查詢語言

2.1.2 利用索引加快數據訪問

2.1.3 數據庫的事務處理、恢復技術與安全保證

2.1.4 並行數據庫與分布式數據庫

2.2 麵嚮數據服務的NoSQL數據庫技術

2.2.1 NoSQL數據庫技術

2.2.2 CAP理論

2.2.3 Key-Value數據庫

2.2.4 Column Family數據庫

2.2.5 Document數據庫

2.2.6 Graph數據庫

2.3 NewSQL數據庫技術

2.3.1 VoltDB數據庫

2.3.2 Google Spanner數據庫

2.4 思考題

3 OLAP與結構化數據分析

3.1 聯機分析處理(OLAP)與結構化數據分析

3.1.1 從操作型的業務數據庫嚮數據倉庫抽取、轉換和裝載數據

3.1.2 數據倉庫與星型模型

3.1.3 聯機分析處理OLAP

3.1.4 三種類型的OLAP係統

3.2 高性能OLAP係統的關鍵技術

3.2.1 列存儲技術

3.2.2 位圖索引技術

3.2.3 內存數據庫技術

3.2.4 MPP並行數據庫

3.3 結構化數據分析工具介紹

3.3.1 MPP(Shared-Nothing)數據庫、基於列存儲的關係數據庫

3.3.2 SQL on Hadoop係統

3.3.3 性能比較

3.4 思考題

......


數據科學概論/數據科學與大數據技術叢書 下載 mobi epub pdf txt 電子書 格式

數據科學概論/數據科學與大數據技術叢書 mobi 下載 pdf 下載 pub 下載 txt 電子書 下載 2024

數據科學概論/數據科學與大數據技術叢書 下載 mobi pdf epub txt 電子書 格式 2024

數據科學概論/數據科學與大數據技術叢書 下載 mobi epub pdf 電子書
想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

用戶評價

評分

評分

評分

評分

評分

評分

評分

評分

評分

類似圖書 點擊查看全場最低價

數據科學概論/數據科學與大數據技術叢書 mobi epub pdf txt 電子書 格式下載 2024


分享鏈接




相關圖書


本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

友情鏈接

© 2024 book.qciss.net All Rights Reserved. 圖書大百科 版權所有