Python网络数据采集

Python网络数据采集 pdf epub mobi txt 电子书 下载 2025

[美] 米切尔(RyanMitchell)著陶俊杰 著
想要找书就要到 图书大百科
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
店铺: 文轩网旗舰店
出版社: 人民邮电出版社
ISBN:9787115416292
商品编码:10297799911
出版时间:2016-03-01

具体描述

作  者:(美)米切尔(Ryan Mitchell) 著;陶俊杰,陈小莉 译 定  价:59 出 版 社:人民邮电出版社 出版日期:2016年03月01日 页  数:200 装  帧:平装 ISBN:9787115416292

网络上的数据量越来越大,单靠浏览网页获取信息越来越困难,如何有效地提取并利用信息已成为一个巨大的挑战。本书采用简洁强大的Python语言,全面介绍网络数据采集技术,教你从不同形式的网络资源中自由地获取数据。你将学会如何使用Python脚本和网络API一次性采集并处理成千上万个网页上的数据。本书适合熟悉Python的程序员、安全专业人士、网络管理员阅读。书中不仅介绍了网络数据采集的基本原理,还深入探讨了更不错的主题,比如分析原始数据、用网络爬虫测试网站等。此外,书中还提供了详细的代码示例,以等

译者序   ix
前言   xi
部分  创建爬虫
第1章  初见网络爬虫   2
1.1  网络连接   2
1.2  BeautifulSoup简介   4
1.2.1  安装BeautifulSoup   5
1.2.2  运行BeautifulSoup   7
1.2.3  可靠的网络连接   8
第2章  复杂HTML解析   11
2.1  不是一直都要用锤子   11
2.2  再端一碗BeautifulSoup   12
2.2.1  BeautifulSoup的find()和findAll()   13
2.2.2  其他BeautifulSoup对象   15
2.2.3  导航树   16
2.3  正则表达式   19
2.4  正则表达式和BeautifulSoup   23
2.5  获取属性   24
2.6  Lambda表达式   24
2.7  超YUEBeautifulSoup   25
部分目录

内容简介

本书采用简洁强大的Python语言,介绍了网络数据采集,并为采集新式网络中的各种数据类型提供了全面的指导。靠前部分重点介绍网络数据采集的基本原理:如何用Python从网络服务器请求信息,如何对服务器的响应进行基本处理,以及如何以自动化手段与网站进行交互。第二部分介绍如何用网络爬虫测试网站,自动化处理,以及如何通过更多的方式接入网络。 (美)米切尔(Ryan Mitchell) 著;陶俊杰,陈小莉 译 Ryan Mitchell,数据科学家、软件工程师,目前在波士顿LinkeDrive公司负责开发公司的API和数据分析工具。此前,曾在Abine公司构建网络爬虫和网络机器人。她经常做网络数据采集项目的咨询工作,主要面向金融和零售业。另著有Instant Web Scraping with Java。

用户评价

评分

文轩的价格比较实惠。。。

评分

以例子讲解,入门简单,适合初学者

评分

此用户未填写评价内容

评分

学习网络数据抓取,必备图书,前提要越好Python。

评分

这本书算是比较系统的讲解网络爬虫的基础教程,所用的系统版本是Python3。不足之处在于作者写代码稍显随意,明明用下划线连接的变量名更有利于阅读,偏偏作者就是很任性的用驼峰式的变量名。并且有一个贯穿全文的问题,调用bs4时一直没有指定解析器。但不管怎么说,本书终究还是目前所能找到的最好的Python3爬虫入门书了

评分

还可以,没看呢

评分

很好,这个系列买了好多本啦

评分

好书

评分

发货速度很快,书籍不错。

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.qciss.net All Rights Reserved. 图书大百科 版权所有