數據科學導論：Python語言實現（原書第2版）下載 mobi epub pdf 電子書 2025

簡體網頁||繁體網頁

☆☆☆☆☆

[意] 阿爾貝托·博斯凱蒂（Alberto Boschetti）盧卡·馬薩羅（Luca Massar 著，於俊偉譯

下載連結在頁面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 複製連結

想要找書就要到圖書大百科

book.qciss.net

立刻按 ctrl+D收藏本頁

你會得到大驚喜!!

齣版社：機械工業齣版社

ISBN：9787111589860

版次：2

商品編碼：12330225

品牌：機工齣版

包裝：平裝

叢書名：數據科學與工程技術叢書

開本：16開

齣版時間：2018-04-01

用紙：膠版紙

頁數：222

具體描述

編輯推薦

本書首先介紹如何設置基本的數據科學工具箱，然後帶你進入數據改寫和預處理階段，這一部分主要是闡明所有與核心數據科學活動相關的數據分析過程，如數據加載、轉換、修復以及數據探索和處理等。通過主要的機器學習算法、圖形分析技術，以及所有易於錶現結果的可視化工具，實現對數據科學的概述。

本書對上一版內容進行瞭全麵拓展和更新，涵蓋新版的Jupyter Notebook、NumPy、pandas和Scikit-learn等的新改進。此外，還介紹瞭深度學習（藉助在Theano和Tensorflow平颱上運行的Keras庫）、漂亮的可視化（使用Seaborn和 ggplot）和Web部署（使用bottle）等新內容。

本書行文過程以數據科學項目為主體，輔以整潔的代碼和簡化的示例，能幫助你理解與項目相關的潛在原理和實際數據集。

內容簡介

本書由兩位資深的數據科學傢所著，是他們多年數據科學實踐經驗的總結，通過對上一版內容的更新和擴展，其介紹瞭新版Python的特點及安裝方法，繼而全麵又係統地講解瞭數據科學分析和開發的相關工具、實踐以及簡單示例。通過閱讀本書，你將深入瞭解Python核心概念，成為高效數據科學實踐者。

本書共七部分內容，包括六章和一個附錄。第1章介紹Jupyter Notebook的使用方法；第2章對數據科學流程進行概述，並詳細分析用於數據準備和處理的關鍵工具；第3章討論改進結果的數據操作技術；第4章深入研究Scikit-learn中的主要機器學習算法；第5章進行圖的探索和聚集分析；第6章介紹一些可視化工具的使用方法；附錄則是一些Python示例和說明，重點介紹Python語言的特點。

作者簡介

阿爾貝托·博斯凱蒂（Alberto Boschetti）　數據科學傢、信號處理和統計學方麵的專傢。他擁有通信工程專業博士學位，現在倫敦居住和工作。基於所從事的項目，他每天都要麵對包括自然語言處理、機器學習和概率圖模型等方麵的挑戰。他對工作充滿激情，經常參加學術聚會、研討會等學術活動，緊跟數據科學技術發展的前沿。

盧卡·馬薩羅（Luca Massaron）　數據科學傢、市場研究總監，是多元統計分析、機器學習和客戶洞察方麵的專傢，有十年以上解決實際問題的經驗，使用推理、統計、數據挖掘和算法為利益相關者創造瞭巨大的價值。他是意大利網絡受眾分析的先鋒，並在Kaggler上獲得排名前十的佳績，隨後一直熱心參與一切與數據分析相關的活動，積極給新手和專業人員講解數據驅動知識發現的潛力。他崇尚大道至簡，堅信理解數據科學的本質能帶來巨大收獲。

前言/序言

前　　言

“韆裏之行，始於足下。”——老子（公元前604—531）數據科學屬於一門相對較新的知識領域，它成功融閤瞭綫性代數、統計建模、可視化、計算語言學、圖形分析、機器學習、商業智能、數據存儲和檢索等眾多學科。

Python編程語言在過去十年已經徵服瞭科學界，現在是數據科學實踐者不可或缺的工具，也是每一個有抱負的數據科學傢的必備工具。Python為數據分析、機器學習和算法求解提供瞭快速、可靠、跨平颱、成熟的開發環境。無論之前在數據科學應用中阻止你掌握Python的原因是什麼，我們將通過簡單的分步化解和示例導嚮的方法幫你解決，幫助你在演示數據集和實際數據集上使用最直接有效的Python工具。

作為第2版，本書對第1版內容進行瞭更新和擴展。以最新的Jupyter Notebook（包括可互換內核，一個真正支持多種編程語言的數據科學係統）為基礎，本書包含瞭NumPy、pandas和Scikit-learn等庫的所有主要更新。此外，本書還提供瞭不少新內容，包括深度學習（基於Theano和Tensorflow的Keras）、漂亮的數據可視化（Seaborn和ggplot）和Web部署（使用bottle）等。本書首先使用單源方法，展示如何在最新版Python（3.5）中安裝基本的數據科學工具箱，這意味著本書中的代碼可以在Python 2.7上重用。接著，將引導你進入完整的數據改寫和預處理階段，主要闡述用於數據分析、探索或處理的數據加載、變換、修復等關鍵數據科學活動。最後，本書將完成數據科學精要的概述，介紹主要的機器學習算法、圖分析技術和可視化方法，其中，可視化工具將更易於嚮數據科學專傢或商業用戶展示數據處理結果。

本書內容第1章介紹Jupyter Notebook，演示怎樣使用程序手冊中的數據。

第2章對數據科學流程進行概述，詳細分析進行數據準備和處理所使用的關鍵工具，這些工具將在采用機器學習算法和建立假設實驗計劃之前使用。

第3章討論所有可能有助於結果改進甚至提升的數據操作技術。

第4章深入研究Scikit-learn包中的主要機器學習算法，例如綫性模型、支持嚮量機、樹集成和無監督聚類技術等。

第5章介紹圖的概念，它可以錶示為偏離預測或目標的有趣矩陣。這是目前數據科學界的研究熱點，期待利用圖的技術來研究復雜的社交網絡。

第6章介紹使用matplotlib進行可視化的基本方法，以及如何使用pandas進行探索性數據分析（EDA），如何使用Seaborn和Bokeh實現漂亮的可視化，還包括如何建立提供所需要信息的Web服務器。

附錄包括一些Python示例和說明，重點介紹Python語言的主要特點，這些都是從事數據科學工作必須瞭解的。

閱讀準備本書用到的Python及其他數據科學工具（從IPython到Scikit-learn）都能在網上免費下載。要運行本書附帶的源代碼，需要一颱裝有Windows、Linux或Mac OS等操作係統的計算機。本書將分步介紹Python解釋器的安裝過程，以及運行示例所需要的工具和數據。

讀者對象如果你有誌於成為數據科學傢，並擁有一些數據分析和Python方麵的基礎知識，本書將助你在數據科學領域快速入門。對於有R語言或Matlab編程經驗的數據分析人員，本書也可以作為一個全麵的參考書，提高他們在數據操作和機器學習方麵的技能。

代碼下載你可以從http://www.packtpub.com通過個人賬號下載你所購買書籍的樣例源碼。你也可以訪問華章圖書官網http://www.hzbook.com，通過注冊並登錄個人賬號下載本書的源代碼。

彩圖下載我們還提供瞭一個PDF文件，其中包含本書中使用的截圖和彩圖，可以幫助讀者更好地瞭解輸齣的變化。文件可以從以下地址下載：http://www.packtpub.com/sites/default/files/downloads/PythonDataScienceEssentialsSecondEdition_colorImages.pdf。