网络上的数据量越来越大,单靠浏览网页获取信息越来越困难,如何有效地提取并利用信息已成为一个巨大的挑战。本书采用简洁强大的Python语言,全面介绍网络数据采集技术,教你从不同形式的网络资源中自由地获取数据。你将学会如何使用Python脚本和网络API一次性采集并处理成千上万个网页上的数据。本书适合熟悉Python的程序员、安全专业人士、网络管理员阅读。书中不仅介绍了网络数据采集的基本原理,还深入探讨了更不错的主题,比如分析原始数据、用网络爬虫测试网站等。此外,书中还提供了详细的代码示例,以等
●译者序 ix内容简介
本书采用简洁强大的Python语言,介绍了网络数据采集,并为采集新式网络中的各种数据类型提供了全面的指导。靠前部分重点介绍网络数据采集的基本原理:如何用Python从网络服务器请求信息,如何对服务器的响应进行基本处理,以及如何以自动化手段与网站进行交互。第二部分介绍如何用网络爬虫测试网站,自动化处理,以及如何通过更多的方式接入网络。 (美)米切尔(Ryan Mitchell) 著;陶俊杰,陈小莉 译 Ryan Mitchell,数据科学家、软件工程师,目前在波士顿LinkeDrive公司负责开发公司的API和数据分析工具。此前,曾在Abine公司构建网络爬虫和网络机器人。她经常做网络数据采集项目的咨询工作,主要面向金融和零售业。另著有Instant Web Scraping with Java。文轩的价格比较实惠。。。
评分以例子讲解,入门简单,适合初学者
评分此用户未填写评价内容
评分学习网络数据抓取,必备图书,前提要越好Python。
评分这本书算是比较系统的讲解网络爬虫的基础教程,所用的系统版本是Python3。不足之处在于作者写代码稍显随意,明明用下划线连接的变量名更有利于阅读,偏偏作者就是很任性的用驼峰式的变量名。并且有一个贯穿全文的问题,调用bs4时一直没有指定解析器。但不管怎么说,本书终究还是目前所能找到的最好的Python3爬虫入门书了
评分还可以,没看呢
评分很好,这个系列买了好多本啦
评分好书
评分发货速度很快,书籍不错。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.qciss.net All Rights Reserved. 图书大百科 版权所有