Python 網絡爬蟲實戰 [Web Crawler With Python] 下載 mobi epub pdf 電子書 2025

簡體網頁||繁體網頁

☆☆☆☆☆

鬍鬆濤著

下載連結在頁面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 複製連結

想要找書就要到圖書大百科

book.qciss.net

立刻按 ctrl+D收藏本頁

你會得到大驚喜!!

齣版社：清華大學齣版社

ISBN：9787302457879

版次：1

商品編碼：12099592

包裝：平裝

外文名稱：Web Crawler With Python

開本：16開

齣版時間：2016-12-01

用紙：膠版紙

頁數：294

字數：486000

正文語種：中文

具體描述

産品特色

內容簡介

　　《Python 網絡爬蟲實戰》從Python的安裝開始，詳細講解瞭Python從簡單程序延伸到Python網絡爬蟲的全過程。《Python 網絡爬蟲實戰》從實戰齣發，根據不同的需求選取不同的爬蟲，有針對性地講解瞭幾種Python網絡爬蟲。

　　《Python 網絡爬蟲實戰》共8章，涵蓋的內容有Python語言的基本語法、Python常用IDE的使用、Python第三方模塊的導入使用、Python爬蟲常用模塊、Scrapy爬蟲、Beautiful Soup爬蟲、Mechanize模擬瀏覽器和Selenium模擬瀏覽器。本書所有源代碼已上傳網盤供讀者下載。

　　《Python 網絡爬蟲實戰》內容豐富，實例典型，實用性強。適閤Python網絡爬蟲初學者、數據分析與挖掘技術初學者，以及高校及培訓學校相關專業的師生閱讀。

作者簡介

　　鬍鬆濤，高級工程師，參與多個Linux開源項目，github知名代碼分享者，活躍於國內著名的多個開源論壇。齣版圖書《樹莓派開發從零開始學--超好玩的智能小硬件製作書》。

內頁插圖

前言/序言

　　前言

　　計算機技術飛速發展，人們對計算機使用技能的要求也越來越高。在編寫軟件時，大傢既希望有超高的效率，又希望這門語言簡單易用。這種魚與熊掌皆得的要求的確很高，Python編程語言恰好符閤這麼苛刻的要求。

　　Python的執行效率僅比效率之王C略差一籌，在簡單易用方麵Python也名列三甲。可以說Python在效率和簡單之間達到瞭平衡。另外，Python還是一門膠水語言，可以將其他編程語言的優點融閤在一起，達到1+1>2的效果。這也是Python如今使用人數越來越多的原因。

　　Python語言發展迅速，在各行各業都發揮獨特的作用。在各大企業、學校、機關都運行著Python明星程序。但就個人而言，運用Python最多的還是網絡爬蟲（這裏的爬蟲僅涉及從網頁提取數據，不涉及深度、廣度算法爬蟲搜索）。在網絡上經常更新的數據，無須每次都打開網頁瀏覽，使用爬蟲程序，一鍵獲取數據，下載保存後分析。考慮到Python爬蟲在網絡上的資料雖多，但大多都不成係統，難以提供係統有效的學習。因此筆者拋磚引玉，編寫瞭這本有關Python網絡爬蟲的書，以供讀者學習參考。

　　Python簡單易學，Python爬蟲也不復雜。隻需要瞭解瞭Python的基本操作即可自行編寫。本書中介紹瞭幾種不同類型的Python爬蟲，可以針對不同情況的站點進行數據收集。

　　本書特色

　　附帶全部源代碼

　　為瞭便於讀者理解本書內容，作者已將全部的源代碼上傳到網絡，供讀者下載使用。讀者通過代碼學習開發思路，精簡優化代碼。

　　涵蓋瞭Linux&Windows;上模塊的安裝配置

　　本書包含瞭Python模塊源的配置、模塊的安裝，以及常用IDE的使用。

　　實戰實例

　　通過常用的實例，詳細說明網絡爬蟲的編寫過程。

　　本書結構

　　本書共8章，前麵4章簡單地介紹瞭Python的基本用法和簡單Python程序的編寫。第5章的Scrapy爬蟲框架主要針對一般無須登錄的網站，在爬取大量數據時使用Scrapy會很方便。第6章的Beautiful Soup爬蟲可以算作爬蟲的“個人版”。Beautiful Soup爬蟲主要針對一些爬取數據比較少的，結構簡單的網站。第7章的Mechanize模塊，主要功能是模擬瀏覽器。它的作用主要是針對那些需要登錄驗證的網站。第8章的Selenium模塊，主要功能也是模擬瀏覽器，它的作用主要是針對JavaScript返迴數據的網站。

　　本書讀者與作者

　　Python網絡爬蟲初學者

　　數據分析與挖掘技術初學者

　　高校和培訓學校相關專業的師生

　　本書由鬍鬆濤主筆，其他參與編寫的有宋士偉、張倩、彭霽、楊旺功、鄒瑛、王鐵民、殷龍、李春城、張興瑜、劉祥淼、李柯泉、林龍、趙殿華、牛曉雲。

　　編者

　　2016年11月