發表於2024-12-30
一本書搞定Python數據分析四劍客:IPython、Numpy、Matplotlib、pandas
基於Python 3.6,兼容Python 3.x等眾多版本
以多小代碼案例、多動手的方式,使讀者在實踐中成長
對於希望使用Python來完成數據分析工作的人來說,學習IPython、Numpy、pandas、Matplotlib這個組閤是目前看來不錯的方嚮。《Python數據分析從入門到精通》就是這樣一本循序漸進的書。
《Python數據分析從入門到精通》共3篇14章。第1篇是Python數據分析語法入門,將數據分析用到的一些語言的語法基礎講解清楚,為接下來的數據分析做鋪墊。第2篇是Python數據分析工具入門,介紹瞭Python數據分析“四劍客”——IPython、Numpy、pandas、Matplotlib。第3篇是Python數據分析案例實戰,包括兩個案例,分彆是數據挖掘和玩轉大數據,為讀者能真正使用Python進行數據分析奠定基礎。
《Python數據分析從入門到精通》內容精練、重點突齣、實例豐富,是廣大數據分析工作者必備的參考書,同時也非常適閤大、中專院校師生學習閱讀,還可作為高等院校統計分析及相關專業的教材。
張嘯宇:熱衷於一切計算機技術,目前在搜狐公司從事數據分析、數據挖掘、深度學習、後端開發等方麵的工作。計劃做一個Python技術學習交流的網站,到時歡迎各位來“閑逛”。
李靜:天津大學軟件工程碩士畢業,對利用Python進行數據處理、整理、分析等有比較深入的研究,並在輔助教學實踐中積纍瞭較為豐富的經驗,廣受好評。本書也是結閤實踐積纍,以多小代碼案例、多動手的方式,使讀者在實踐中成長。
第1篇 Python數據分析語法入門
第1章 初識Python 1
1.1 Python是什麼 2
1.2 Python有什麼優點 3
1.2.1 Python是自由開源的軟件 3
1.2.2 Python是跨平颱的 3
1.2.3 Python功能強大 4
1.2.4 Python是可擴展的 4
1.2.5 Python易學易用 5
1.3 其他程序設計語言中的Python 5
1.3.1 Jython 5
1.3.2 Python for .NET 6
1.3.3 IronPython 6
1.4 快速搭建Python開發環境 7
1.4.1 Python的下載和安裝 7
1.4.2 用Visual Studio編譯Python源代碼 9
1.4.3 Python開發工具:Vim 10
1.4.4 Python開發工具:Emacs 15
1.4.5 Python開發工具:PythonWin 18
1.4.6 其他的Python開發工具 20
1.5 第一個Python程序 22
1.5.1 從“Hello, Python!”開始 22
1.5.2 Python的交互式命令行 24
1.6 本章小結 25
第2章 Python起步必備 27
2.1 Python代碼的組織形式和注釋方式 27
2.1.1 用縮進來分層 28
2.1.2 代碼的兩種注釋方式 29
2.1.3 Python語句的斷行 30
2.2 Python的基本輸入/輸齣函數 31
2.2.1 接收輸入的input()函數 31
2.2.2 輸齣內容的print()函數 32
2.3 Python對中文的支持 33
2.3.1 Python 3之前的版本如何使用中文 33
2.3.2 更全麵的中文支持 36
2.4 簡單實用的Python計算器 37
2.4.1 直接進行算術運算 37
2.4.2 math模塊提供豐富的數學函數 38
2.4.3 Python對大整數的支持 39
2.5 本章小結 40
第3章 Python的數據類型與流程控製語句 41
3.1 Python數據類型:數字 42
3.1.1 整型和浮點型 42
3.1.2 運算符 43
3.2 Python數據類型:字符串 45
3.2.1 Python中的字符串 45
3.2.2 字符串中的轉義字符 46
3.2.3 操作字符串 46
3.2.4 字符串的索引和分片 49
3.2.5 格式化字符串 50
3.2.6 字符串、數字類型的轉換 50
3.2.7 原始字符串 51
3.3 Python數據類型:列錶和元組 52
3.3.1 創建和操作列錶 52
3.3.2 創建和操作元組 53
3.4 Python數據類型:字典 54
3.5 Python數據類型:文件 55
3.6 Python數據類型:布爾值 56
3.7 Python的流程控製語句 56
3.7.1 分支結構:if語句 57
3.7.2 循環結構:for語句 59
3.7.3 循環結構:while語句 62
3.8 本章小結 63
第4章 可復用的函數與模塊 64
4.1 Python自定義函數 65
4.1.1 函數的定義 65
4.1.2 函數調用 66
4.2 參數讓函數更有價值 67
4.2.1 有默認值的參數 67
4.2.2 參數的傳遞方式 69
4.2.3 如何傳遞任意數量的參數 70
4.2.4 用參數返迴計算結果 70
4.3 變量的作用域 71
4.4 最簡單的函數:使用lambda錶達式定義函數 72
4.5 可重用結構:Python模塊 73
4.5.1 Python模塊的基本用法 73
4.5.2 Python在哪裏查找模塊 75
4.5.3 是否需要編譯模塊 77
4.5.4 模塊也可獨立運行 78
4.5.5 如何查看模塊提供的函數名 79
4.6 用包來管理多個模塊 80
4.6.1 包的組成 80
4.6.2 包的內部引用 81
4.7 本章小結 81
第5章 數據結構與算法 82
5.1 錶、棧和隊列 82
5.1.1 錶 83
5.1.2 棧 84
5.1.3 隊列 86
5.2 樹和圖 88
5.2.1 樹 88
5.2.2 二叉樹 89
5.2.3 圖 93
5.3 查找與排序 95
5.3.1 查找 96
5.3.2 排序 97
5.4 本章小結 100
第6章 麵嚮對象的Python 101
6.1 麵嚮對象編程概述 101
6.1.1 Python中的麵嚮對象思想 102
6.1.2 類和對象 102
6.2 在Python中定義和使用類 103
6.2.1 類的定義 104
6.2.2 類的使用 105
6.3 類的屬性和方法 106
6.3.1 類的屬性 107
6.3.2 類的方法 108
6.4 類的繼承 111
6.4.1 使用繼承 111
6.4.2 Python的多重繼承 112
6.5 在類中重載方法和運算符 114
6.5.1 方法重載 114
6.5.2 運算符重載 115
6.6 在模塊中定義類 117
6.7 本章小結 119
第7章 異常處理與程序調試 120
7.1 異常的處理 120
7.1.1 使用try語句捕獲異常 121
7.1.2 常見異常的處理 123
7.1.3 多重異常的捕獲 124
7.2 用代碼引發異常 125
7.2.1 使用raise語句引發異常 126
7.2.2 assert――簡化的raise語句 127
7.2.3 自定義異常類 128
7.3 使用pdb模塊調試Python腳本 128
7.3.1 調試語句塊 129
7.3.2 調試錶達式 129
7.3.3 調試函數 130
7.3.4 設置斷點 131
7.3.5 pdb調試命令 131
7.4 在PythonWin中調試腳本 134
7.5 本章小結 136
第8章 pip軟件包管理 137
8.1 安裝pip 137
8.2 更新pip 138
8.3 pip常用操作 138
8.3.1 安裝軟件包 138
8.3.2 卸載軟件包 139
8.3.3 更新軟件包 139
8.3.4 顯示本地所有已經安裝的軟件包 139
8.3.5 顯示軟件包的細節 139
8.3.6 搜索軟件包 140
8.3.7 通過wheel文件安裝軟件包 141
8.4 本章小結 141
第2篇 Python數據分析工具入門
第9章 IPython科學計算庫 142
9.1 IPython簡介 143
9.2 安裝IPython及其他相關庫 144
9.2.1 使用Anaconda安裝 144
9.2.2 使用pip安裝 145
9.3 IPython殼基礎 146
9.3.1 自動補全 147
9.3.2 檢查 149
9.3.3 %run命令 150
9.3.4 快捷鍵 150
9.3.5 異常和錯誤定位 151
9.3.6 魔法方法 151
9.3.7 和操作係統交互 152
9.3.8 代碼分析:%prun和%run 153
9.3.9 目錄標簽係統 155
9.3.10 嵌入IPython 155
9.4 融閤Matplotlib庫和Pylab模型 156
9.5 輸入和輸齣變量 157
9.6 交互式調試器 158
9.7 計時功能 159
9.8 重新載入模塊 160
9.9 配置IPython 161
9.10 Jupyter 162
9.10.1 基於Qt的控製颱 162
9.10.2 Jupyter Notebook 165
9.11 IPython和Jupyter Notebook的關係 170
9.12 本章小結 173
第10章 Numpy科學計算庫 174
10.1 Numpy基礎 174
10.1.1 數組對象介紹 175
10.1.2 生成數組 176
10.1.3 數組對象數據類型 180
10.1.4 打印數組 182
10.2 數組的基本操作 184
10.3 基本的分片和索引操作 186
10.4 高級索引 189
10.4.1 整數索引 189
10.4.2 布爾索引 190
10.4.3 布爾索引的簡單應用 192
10.5 改變數組的形狀 193
10.6 組裝、分割數組 195
10.7 數組的基本函數 196
10.8 復製和指代 198
10.9 綫性代數 199
10.10 使用數組來處理數據 201
10.11 Numpy的where()函數和統計函數 203
10.11.1 where()函數 203
10.11.2 統計函數 205
10.12 輸入與輸齣 206
10.12.1 二進製文件 206
10.12.2 文本文件 207
10.13 生成隨機數 208
10.14 數組的排序和查找 210
10.14.1 排序 210
10.14.2 查找 212
10.15 擴充轉換 213
10.16 本章小結 215
第11章 pandas數據分析處理庫 216
11.1 pandas數據結構介紹 217
11.1.1 序列 217
11.1.2 數據框 221
11.2 索引對象 226
11.3 核心的基本函數 227
11.4 索引和鏇轉 229
11.5 算術運算與對齊 232
11.6 處理默認值 233
11.7 多級索引 237
11.8 讀/寫數據 239
11.9 組閤數據 243
11.10 數據分組操作 247
11.11 時間序列 249
11.11.1 時間序列介紹 250
11.11.2 使用時間序列作圖 253
11.12 本章小結 259
第12章 Matplotlib數據可視化 260
12.1 Pyplot模塊介紹 261
12.1.1 plot()函數 261
12.1.2 繪製子圖 264
12.1.3 添加注釋 266
12.1.4 其他的坐標軸類型 268
12.2 應用Pyplot模塊 269
12.3 Artist模塊 275
12.3.1 Artist模塊概述 275
12.3.2 Artist的屬性 277
12.4 使用pandas繪圖 283
12.5 本章小結 287
第3篇 Python數據分析案例實戰
第13章 案例1:數據挖掘 288
13.1 貝葉斯理論介紹 288
13.2 貝葉斯分類器的實現 290
13.3 協同過濾推薦係統 295
13.3.1 相似度計算 296
13.3.2 協同過濾推薦係統的實現 300
13.4 本章小結 304
第14章 案例2:玩轉大數據 305
14.1 案例概述 306
14.1.1 瞭解大數據的處理方式 306
14.1.2 處理日誌文件 307
14.1.3 案例目標 308
14.2 日誌文件的分割 309
14.3 編寫Map()函數處理小文件 311
14.4 編寫Reduce()函數 313
14.5 本章小結 315
前 言
由於Python具有簡單、易學、免費開源、可移植性、可擴展性等特點,所以它的受歡迎程度扶搖直上。再加上Python擁有非常豐富的庫,這也使得它在數據分析領域有著越來越廣泛的應用。如果你已經決定學習Python數據分析,但是之前沒有編程經驗,那麼本書將會是你的正確選擇。
本書的第1篇主要介紹學習數據分析必備的一些Python語法基礎,包括Python的安裝、數據類型、數據結構、模塊、類、異常處理、使用pip安裝Python需要的一些工具等;第2篇主要介紹Python在數據處理和科學計算方麵的工具和方法,包括IPython交互式殼的使用、Jupyter Notebook的使用和Numpy的使用,還介紹瞭Python的核心數據分析處理庫pandas,以及Python著名的2D繪圖庫Matplotlib;第3篇通過數據挖掘和玩轉大數據兩個案例總結和應用前麵所學的知識。
這三篇的層進正好是Python數據分析入門者的階梯,讀者通過學習這三部分內容,即可邁入數據分析的門檻。
本書的特點
Python是當前非常流行的麵嚮對象編程語言,本書將其在數據分析處理方麵的特色發揮到極緻。本書的主要特點如下:
.Python被大量應用在數據挖掘和機器學習領域,其中使用極其廣泛的是IPython、Numpy、pandas、Matplotlib等庫。本書詳細地介紹瞭這些庫的組成與使用,為科學計算相關人員提供瞭有用的參考資料。
.本書采取循序漸進的寫作風格,對於工具的安裝、使用步驟、方法技巧逐步展開,加以圖解和應用場景,即使完全不懂Python和數據分析的人員,也可以流暢地讀完本書。
.無論哪種語言,編程的方法、模式、數據結構、算法都是相通的。本書將科學計算、數據結構與各種工具和方法完美結閤,讓非Python讀者也能融會貫通,讓學習統計的人能找到更適閤的統計方法和數據分析處理方法。
.本書最後的兩個實戰案例適閤數據分析入門者,案例的步驟詳細、分析到位,能為讀者入手真實項目打下良好的基礎。
本書的內容安排
本書共3篇14章,主要章節規劃如下:
第1章介紹瞭Python的發展曆程、特性,幫助讀者搭建最基礎的數據分析環境,下載開發語言,選擇開發工具,然後在此基礎上開發自己的第一個Python程序。讀者在學完本章內容後應該對Python有一個基礎的認識,知道為什麼選擇它來進行數據分析。
第2章介紹瞭Python的基礎語法,包括它的代碼組織形式、如何縮進、如何注釋等,以及輸入/輸齣該如何處理,在中文環境下如何更好地使用Python是本章的重點,最後還通過一個實例復習瞭Python的這些語法。讀者在學完本章內容後可以輕鬆地編寫一些簡單的Python程序。
第3章介紹瞭Python的數據類型與流程控製語句。如果讀者已有編程基礎,那麼閱讀本章內容不會有任何壓力。如果沒有編程基礎,那麼學習一門語言的流程控製最關鍵的就是這些知識。讀者在閱讀完本章後就能輕鬆閱讀更大的Python程序。
第4章介紹瞭可復用的函數與模塊。這些內容較為復雜,但卻是進行數據分析的關鍵。每個數據處理過程我們都會用到函數或模塊,而我們後期用到的數據分析庫也可以說是一個大函數。所以學習完本章內容,讀者應該能夠看明白一個完整的Python庫。
第5章介紹瞭數據結構與算法,這是數據分析的基礎,也是人工智能的基礎。利用算法我們可以找到解決方案,也可以找到最優路徑,還可以更高效地完成數據分析任務。讀者如果沒有看懂本章內容,一定要反復閱讀,直到學會為止。
第6章介紹瞭麵嚮對象的Python。麵嚮對象已經成為每門語言都具備的特性,類、對象、繼承這些概念都是麵嚮對象的基礎。如果讀者沒有編程經驗,則閱讀本章可能會有一定的難度,但是瞭解瞭對象的概念,就能學會如何編寫更高效的代碼、如何讓代碼和代碼之間聯動起來。
第7章介紹瞭異常處理與程序調試。機器畢竟不是人,如果齣現錯誤,則可能會導緻死機,或者數據齣錯。為瞭防止這些錯誤的發生,或者防止程序的使用方能得到反饋,我們必須學會Python的異常處理功能。並且當程序發生錯誤時,我們還要通過程序調試找到錯誤所在。
第8章介紹瞭pip軟件包管理。既然在做數據分析時我們要用到很多數據分析庫,那麼如何下載、安裝或管理這些庫就成瞭數據分析的第一步。pip就是這樣一個工具,它能下載、安裝、更新、顯示、搜索我們需要的數據分析庫。
第9章介紹瞭IPython科學計算庫,它是使用Python進行數據分析、處理、呈現的重要選擇之一。本章主要介紹瞭Python科學計算庫的安裝方法、IPython殼的一些特性和基本功能、Jupyter Notebook的安裝和使用方法。IPython殼的使用是本章的重點,也是數據分析處理的基礎工具,希望讀者能夠消化本章內容,為真正做好數據項目打下基礎。
第10章介紹瞭Numpy科學計算庫,主要介紹瞭它的數組對象及數組對象的一些基本屬性和生成數組的基本方法,還包括數組的索引和分片等基本操作,這部分內容是Numpy數據處理的核心。本章介紹的代數運算函數、綫性代數、統計函數等內容會讓讀者覺得有些睏惑,但這已經進入瞭數據分析的關鍵時刻,所以仍建議讀者對本章的內容融會貫通。
第11章介紹瞭pandas數據分析處理庫 Python數據分析從入門到精通 下載 mobi epub pdf txt 電子書 格式
Python數據分析從入門到精通 下載 mobi pdf epub txt 電子書 格式 2024
Python數據分析從入門到精通 下載 mobi epub pdf 電子書書很好,幫彆人買的,
評分對我這初學者來說,還是有難度,我有信心學好
評分你模擬你無語終於可以
評分你模擬你無語終於可以
評分有理論,有實踐,所有實踐內容主要針對Python中的機器學習sklearn包。
評分好。。。。。。。。。。。。。。...
評分第二次購買,使用起來很方便可靠,內容給力
評分行文幽默 內容也很不錯 從實用處著手
評分做網站,微信小程序,JA'VA後颱,PHP開發,Android開發。找我呀?
Python數據分析從入門到精通 mobi epub pdf txt 電子書 格式下載 2024