Python计算机视觉编程

Python计算机视觉编程 pdf epub mobi txt 电子书 下载 2025

[美] Jan,Erik,Solem 著,朱文涛,袁勇 译
图书标签:
  • Python
  • 计算机视觉
  • 图像处理
  • OpenCV
  • 深度学习
  • 机器学习
  • 图像识别
  • 目标检测
  • 图像分析
  • 编程
想要找书就要到 图书大百科
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 人民邮电出版社
ISBN:9787115352323
版次:1
商品编码:11485222
包装:平装
丛书名: 图灵程序设计丛书
开本:16开
出版时间:2014-06-01
用纸:胶版纸
页数:265
正文语种:中文

具体描述

产品特色

编辑推荐

  

  美国计算机视觉类图书前列!


  

  专门用Python讲解计算机视觉编程

内容简介

  《Python计算机视觉编程》是计算机视觉编程的实践指南,依赖Python语言讲解了基础理论与算法,并通过大量示例细致分析了对象识别、基于内容的图像搜索、光学字符识别、光流法、跟踪、三维重建、立体成像、增强现实、姿态估计、全景创建、图像分割、降噪、图像分组等技术。另外,书中附带的练习还能让读者巩固并学会应用编程知识。
  《Python计算机视觉编程》适合的读者是:有一定编程与数学基础,想要了解计算机视觉的基本理论与算法的学生,以及计算机科学、信号处理、物理学、应用数学和统计学、神经生理学、认知科学等领域的研究人员和从业者。

作者简介

  Jan Erik Solem,瑞典隆德大学副教授(数学成像小组),Polar Rose公司创始人兼CTO,计算机视觉研究者,Python爱好者,技术图书作家,经常出席各种计算机视觉、图像分析、机器智能等国际会议并发表演讲。他主要关注3D重建、变分问题与优化、图像分割与识别、形状分析,有多年Python计算机视觉教学、研究和行业应用经验,技术博客为http://www.janeriksolem.net。另著有Computing with Python: An Introduction to Python for Science and Engineering一书。

内页插图

精彩书评

   “本书介绍了各种图像分析工具,是了解计算机视觉编程的读物。”
  ——James A. Cox,美国《中西部书评》(Midwest Book Review)总编辑

目录

推荐序 XI
前言 XIII

第1章 基本的图像操作和处理 1
1.1 PIL:Python图像处理类库 1
1.1.1 转换图像格式 2
1.1.2 创建缩略图 3
1.1.3 复制和粘贴图像区域 3
1.1.4 调整尺寸和旋转 3
1.2 Matplotlib 4
1.2.1 绘制图像、点和线 4
1.2.2 图像轮廓和直方图 6
1.2.3 交互式标注 7
1.3 NumPy 8
1.3.1 图像数组表示 8
1.3.2 灰度变换 9
1.3.3 图像缩放 11
1.3.4 直方图均衡化 11
1.3.5 图像平均 13
1.3.6 图像的主成分分析(PCA) 14
1.3.7 使用pickle模块 16
1.4 SciPy 17
1.4.1 图像模糊 18
1.4.2 图像导数 19
1.4.3 形态学:对象计数 22
1.4.4 一些有用的SciPy模块 23
1.5 高级示例:图像去噪 24
练习 28
代码示例约定 29

第2章 局部图像描述子 31
2.1 Harris角点检测器 31
2.2 SIFT(尺度不变特征变换) 39
2.2.1 兴趣点 39
2.2.2 描述子 39
2.2.3 检测兴趣点 40
2.2.4 匹配描述子 43
2.3 匹配地理标记图像 47
2.3.1 从Panoramio下载地理标记图像 47
2.3.2 使用局部描述子匹配 50
2.3.3 可视化连接的图像 52
练习 54

第3章 图像到图像的映射 57
3.1 单应性变换 57
3.1.1 直接线性变换算法 59
3.1.2 仿射变换 60
3.2 图像扭曲 61
3.2.1 图像中的图像 63
3.2.2 分段仿射扭曲 67
3.2.3 图像配准 70
3.3 创建全景图 76
3.3.1 RANSAC 77
3.3.2 稳健的单应性矩阵估计 78
3.3.3 拼接图像 81
练习 84

第4章 照相机模型与增强现实 85
4.1 针孔照相机模型 85
4.1.1 照相机矩阵 86
4.1.2 三维点的投影 87
4.1.3 照相机矩阵的分解 89
4.1.4 计算照相机中心 90
4.2 照相机标定 91
4.3 以平面和标记物进行姿态估计 93
4.4 增强现实 97
4.4.1 PyGame和PyOpenGL 97
4.4.2 从照相机矩阵到OpenGL格式 98
4.4.3 在图像中放置虚拟物体 100
4.4.4 综合集成 102
4.4.5 载入模型 104
练习 106

第5章 多视图几何 107
5.1 外极几何 107
5.1.1 一个简单的数据集 109
5.1.2 用Matplotlib绘制三维数据 111
5.1.3 计算F:八点法 112
5.1.4 外极点和外极线 113
5.2 照相机和三维结构的计算 116
5.2.1 三角剖分 116
5.2.2 由三维点计算照相机矩阵 118
5.2.3 由基础矩阵计算照相机矩阵 120
5.3 多视图重建 122
5.3.1 稳健估计基础矩阵 123
5.3.2 三维重建示例 125
5.3.3 多视图的扩展示例 129
5.4 立体图像 130
练习 135

第6章 图像聚类 137
6.1 K-means聚类 137
6.1.1 SciPy聚类包 138
6.1.2 图像聚类 139
6.1.3 在主成分上可视化图像 140
6.1.4 像素聚类 142
6.2 层次聚类 144
6.3 谱聚类 152
练习 157

第7章 图像搜索 159
7.1 基于内容的图像检索 159
7.2 视觉单词 160
7.3 图像索引 164
7.3.1 建立数据库 164
7.3.2 添加图像 165
7.4 在数据库中搜索图像 167
7.4.1 利用索引获取候选图像 168
7.4.2 用一幅图像进行查询 169
7.4.3 确定对比基准并绘制结果 171
7.5 使用几何特性对结果排序 172
7.6 建立演示程序及Web应用 176
7.6.1 用CherryPy创建Web应用 176
7.6.2 图像搜索演示程序 176
练习 179

第8章 图像内容分类 181
8.1 K邻近分类法(KNN) 181
8.1.1 一个简单的二维示例 182
8.1.2 用稠密SIFT作为图像特征 185
8.1.3 图像分类:手势识别 187
8.2 贝叶斯分类器 190
8.3 支持向量机 195
8.3.1 使用LibSVM 196
8.3.2 再论手势识别 198
8.4 光学字符识别 199
8.4.1 训练分类器 200
8.4.2 选取特征 200
8.4.3 多类支持向量机 201
8.4.4 提取单元格并识别字符 202
8.4.5 图像校正 205
练习 206

第9章 图像分割 209
9.1 图割(Graph Cut) 209
9.1.1 从图像创建图 211
9.1.2 用户交互式分割 216
9.2 利用聚类进行分割 218
9.3 变分法 224
练习 226

第10章 OpenCV 227
10.1 OpenCV的Python接口 227
10.2 OpenCV基础知识 228
10.2.1 读取和写入图像 228
10.2.2 颜色空间 228
10.2.3 显示图像及结果 229
10.3 处理视频 232
10.3.1 视频输入 232
10.3.2 将视频读取到NumPy数组中 234
10.4 跟踪 234
10.4.1 光流 235
10.4.2 Lucas-Kanade算法 237
10.5 更多示例 243
10.5.1 图像修复 243
10.5.2 利用分水岭变换进行分割 244
10.5.3 利用霍夫变换检测直线 245
练习 246

附录A 安装软件包 247
A.1 NumPy和SciPy 247
A.1.1 Windows 247
A.1.2 Mac OS X 247
A.1.3 Linux 248
A.2 Matplotlib 248
A.3 PIL 248
A.4 LibSVM 249
A.5 OpenCV 249
A.5.1 Windows和Unix 249
A.5.2 Mac OS X 249
A.5.3 Linux 250
A.6 VLFeat 250
A.7 PyGame 250
A.8 PyOpenGL 250
A.9 Pydot 251
A.10 Python-graph 251
A.11 Simplejson 252
A.12 PySQLite 252
A.13 CherryPy 252

附录B 图像集 253
B.1 Flickr 253
B.2 Panoramio 254
B.3 牛津大学视觉几何组 255
B.4 肯塔基大学识别基准图像 255
B.5 其他 256
B.5.1 Prague Texture Segmentation Datagenerator与基准 256
B.5.2 微软研究院Grab Cut数据集 256
B.5.3 Caltech 101 256
B.5.4 静态手势数据库 256
B.5.5 Middlebury Stereo数据集 256

附录C 图片来源 257
C.1 来自Flickr的图像 257
C.2 其他图像 258
C.3 插图 258

参考文献 259
索引 263

前言/序言

  推荐序
  计算机视觉是一门实践性很强的课程,虽然已经有了不少教科书,但大多数都只重视其中的理论和算法,很少有实践指导书。因而对于学习者而言,如果希望在实践中学习,往往需要编写大量的程序。在这方面,本书的出版可以算是一个有效的补充,相信本书将成为计算机视觉学习者的一个重要参考。
  作为一本面向计算机视觉编程的书,本书涉及了这一学科中相对成熟并且被以往实践验证有效的部分典型算法,因而具有很好的实用性。例如第2 章描述子部分选择了Harris 角点检测器和SIFT 描述子及其实现加以介绍;第3 章则以全景图的创建为例,给出了RANSAC 的实现;第9 章图像分割中讨论了Graph Cut 的实现等。这些方法大多数具有很好的通用性,因而为读者提供了一种实现范例。
  本书的另一个特点是对介绍的单一方法,通过综合运用提升学习者灵活应用这些方法的能力。例如第4 章给出的增强现实的例子,以及第8 章给出的数独图像校正的例子。这些例子能够帮助进一步提升学习者对前述方法的感性认识。
  与早期计算机视觉领域多数程序都是由C/C++ 写就的情形不同。随着计算机硬件速度越来越快,研究者在考虑选择实现算法语言的时候会更多地考虑编写代码的效率和易用性,而不是像早年那样把算法的执行效率放在首位。这直接导致近年来越来越多的研究者选择Python 来实现算法。与此同时,Python 的开放性使不同领域的研究者能够有机会在Python 中加入他们需要的特性,甚至可以纳入Python 的标准库,这也大大吸引了众多研究者对Python 的参与。
  本书的第三个特点是提供了与OpenCV 接口的介绍。这为利用OpenCV 中的资源提供了方便的途径。
  今天在计算机视觉领域,越来越多的研究者使用Python 开展研究。本书中文版的出版一方面能够鼓励更多的研究者采用这一语言,另一方面则为Python 的学习者提供了一种尝试不同领域算法的机会。
  中国计算机学会副秘书长 陈熙霖
  2014.4.21


《Python计算机视觉编程》:解锁图像的奥秘,开启智能的未来 在信息爆炸的时代,图像和视频已成为我们获取信息、理解世界最直观、最丰富的方式。从社交媒体上的生活记录,到安防监控中的安全保障,再到自动驾驶汽车的“眼睛”,再到医疗影像的诊断辅助,计算机视觉技术正以前所未有的速度渗透到我们生活的方方面面,驱动着各行各业的深刻变革。而Python,凭借其简洁的语法、强大的库生态和活跃的社区支持,已然成为开发和应用计算机视觉技术的首选语言。 《Python计算机视觉编程》这本书,正是为渴望掌握这一前沿技术,希望将图像与代码巧妙结合的读者量身打造。它并非一本晦涩难懂的学术专著,而是一本兼具理论深度与实践指导的实用指南。本书旨在带领读者从零开始,一步步深入计算机视觉的迷人世界,理解其核心原理,并学会如何利用Python及其丰富的工具库,编写出能够“看懂”和“理解”图像的程序。 核心内容概览: 本书的内容设计紧密围绕着计算机视觉的核心任务和常用技术展开,力求全面且循序渐进。 第一部分:基础篇——认识图像与Python入门 在正式进入计算机视觉的复杂世界之前,我们首先需要建立坚实的基础。这一部分将从最基础的图像概念入手,解释像素、颜色空间、图像格式等基本构成元素,帮助读者建立对数字图像的直观认知。紧接着,本书将引导读者熟悉Python语言的核心特性,重点介绍那些在计算机视觉领域至关重要的库,如: NumPy: 作为Python科学计算的基础,NumPy提供了高效的多维数组对象和相关的数学函数,是处理图像数据的基石。我们将学习如何使用NumPy进行数组的创建、操作、切片和数学运算,为后续的图像处理打下坚实基础。 Matplotlib: 用于数据可视化,Matplotlib能够方便地绘制各种图表,包括显示图像、绘制直方图等,是理解图像数据分布和算法效果的重要工具。 PIL/Pillow: Python Imaging Library (PIL) 及其活跃的fork Pillow,是Python中最常用的图像处理库之一。我们将学习如何使用它进行图像的打开、保存、裁剪、缩放、颜色空间转换、滤镜应用等基础操作。 通过这一部分的学习,读者将能够熟练地使用Python读取、显示、保存和进行一些基础的图像变换,为后续更高级的视觉任务做好准备。 第二部分:图像处理进阶——提取视觉信息 掌握了基础之后,本书将深入探讨一系列核心的图像处理技术,这些技术是计算机视觉算法的基石,用于从原始图像中提取有用的视觉信息。 图像滤波与增强: 我们将学习各种滤波器的原理和应用,如高斯滤波、均值滤波用于去噪;Sobel、Canny算子用于边缘检测;拉普拉斯算子用于锐化。这些技术能够帮助我们改善图像质量,突出关键特征。 特征检测与描述: 识别图像中的关键点和描述其局部特征是许多计算机视觉任务的基础。本书将深入讲解SIFT、SURF、ORB等经典的特征检测算法,学习如何找到图像中的“兴趣点”并生成描述子,以便进行图像匹配和识别。 几何变换: 图像的缩放、旋转、平移、仿射变换和透视变换是图像处理中常见的操作,在图像拼接、校正、对齐等应用中至关重要。我们将学习如何理解这些变换的数学原理,并利用Python代码实现。 形态学操作: 腐蚀、膨胀、开运算、闭运算等形态学操作在二值图像处理中扮演着重要角色,能够用于去除噪声、连接断裂的边缘、填充孔洞等。 第三部分:计算机视觉核心算法——让机器“看见” 在掌握了图像处理的基本功之后,本书将聚焦于更具挑战性的计算机视觉核心算法,让读者理解机器如何“理解”图像的内容。 图像分割: 将图像划分成有意义的区域是理解图像内容的第一步。我们将探讨阈值分割、区域生长、Watershed算法等经典分割技术,以及利用图割等更高级的方法。 对象检测与识别: 如何在图像中找到特定的物体并识别它们?本书将介绍传统的方法,如Haar特征+Adaboost,以及现代深度学习方法的基础概念,例如如何利用预训练模型进行图像分类和目标检测。 图像配准与拼接: 将多张图像对齐并合成一张更大的图像,在全景图生成、三维重建等领域有广泛应用。我们将学习基于特征的图像配准技术,以及如何处理形变。 立体视觉与深度估计: 理解三维世界的关键在于获取深度信息。本书将介绍双目立体视觉的基本原理,如视差计算,以及如何从两张不同视角的图像恢复场景的深度。 第四部分:机器学习与深度学习在计算机视觉中的应用 随着人工智能的飞速发展,机器学习和深度学习已成为计算机视觉领域的主流技术。本书将适时引入这些强大的工具。 机器学习基础: 介绍监督学习、无监督学习的基本概念,以及SVM、K-Means等在图像分类、聚类中的应用。 深度学习入门: 介绍卷积神经网络(CNN)的核心概念,包括卷积层、池化层、激活函数等。我们将学习如何使用TensorFlow和PyTorch这两个主流的深度学习框架,构建和训练简单的CNN模型,用于图像分类任务。 预训练模型与迁移学习: 充分利用现有的大型预训练模型,如AlexNet、VGG、ResNet等,进行迁移学习,可以显著提升模型的性能和效率,即使在数据集较小的情况下也能取得不错的效果。 第五部分:实践项目与案例分析——学以致用 理论的学习最终需要通过实践来巩固。本书将包含一系列精心设计的实践项目,涵盖了计算机视觉的实际应用场景。 人脸检测与识别: 利用OpenCV等库实现实时人脸检测,并进一步探索人脸识别的基本流程。 图像风格迁移: 使用深度学习技术,将一张图像的内容与另一张图像的风格相结合。 物体追踪: 实现对视频序列中特定物体的连续追踪。 手势识别: 通过分析图像中的手部特征,实现对用户手势的识别。 缺陷检测: 在工业生产中,利用计算机视觉技术对产品进行自动化缺陷检测。 通过这些项目,读者将能够将所学的理论知识和技术融会贯通,亲身体验计算机视觉的强大之处,并为解决实际问题积累宝贵的经验。 本书的特色与优势: 循序渐进的教学设计: 从基础概念到高级算法,内容结构清晰,难度逐步提升,适合不同水平的读者。 丰富的代码示例: 提供大量可运行的Python代码,帮助读者理解抽象的算法原理,并鼓励动手实践。 聚焦实用性: 强调理论与实践的结合,通过实际项目案例,让读者快速掌握解决实际问题的能力。 技术前沿性: 覆盖了从传统图像处理到深度学习的最新发展,确保读者能够跟上技术潮流。 深入浅出的讲解: 避免使用过于晦涩的数学公式,而是通过直观的图示和易于理解的语言解释核心概念。 谁适合阅读本书? 计算机科学与工程专业的学生: 为学习计算机视觉、人工智能、模式识别等课程提供坚实的理论和实践基础。 软件工程师与开发者: 希望将计算机视觉技术集成到自己的产品或服务中,拓展技术栈。 数据科学家与人工智能爱好者: 渴望深入了解图像数据的处理和分析,掌握构建智能视觉系统的能力。 科研人员: 为在相关领域进行研究提供必要的知识和工具。 任何对计算机如何“看见”和“理解”世界充满好奇的读者。 结语: 《Python计算机视觉编程》是一扇通往智能世界的大门。通过本书的学习,你将不仅仅是掌握一门技术,更是获得一种全新的观察和理解世界的方式。你将能够赋予机器“眼睛”,让它们能够识别、分析、甚至“思考”图像和视频中的信息,从而开启属于你的创新与应用之路,在这个日新月异的科技时代,抓住机遇,创造未来。

用户评价

评分

从一个旁观者的角度来看,《Python计算机视觉编程》这本书的编排和内容呈现都显得相当专业。它不像市面上许多技术书籍那样,仅仅是API的堆砌,而是注重原理的讲解与实践的结合。书中对每一项技术的介绍,都伴随着深入浅出的理论阐述,并且辅以清晰的代码实现。我特别关注书中关于机器学习在计算机视觉中的应用部分,例如,对支持向量机(SVM)和K近邻(KNN)算法在图像分类中的应用进行了详细的介绍。通过阅读这本书,我不仅学会了如何使用这些算法,更重要的是,我理解了它们的工作原理以及在实际场景中的优缺点。书中对于模型训练和评估的讲解也非常细致,让我明白了如何构建一个有效的计算机视觉模型,并对其性能进行评估。另外,书中关于图像特征提取和选择的讨论,也让我受益匪浅,我明白了如何从图像中提取最具代表性的信息,以便后续的模型训练。这本书的整体风格严谨而不失趣味,非常适合那些希望系统学习计算机视觉技术的读者。

评分

对于初学者来说,计算机视觉可能是一个令人生畏的领域,充斥着大量的数学公式和复杂的算法。《Python计算机视觉编程》这本书,就像一位耐心而睿智的老师,一步步地引导我穿越迷雾。我非常喜欢作者的写作风格,他总是能够将抽象的概念具象化,并通过生动的比喻来解释复杂的数学原理。例如,在讲解图像卷积时,作者用了一个“扫描”的比喻,让我瞬间明白了核函数如何在图像上滑动并计算加权平均值。书中提供的代码示例也极具实践性,每一个例子都能够让我动手操作,亲身体验算法的效果。我记得我第一个成功运行的例子是图像的颜色空间转换,看着RGB图像变成灰度图像,再变成HSV图像,我能够清晰地看到不同颜色空间下的图像信息的变化。这本书并没有简单地罗列API,而是从原理出发,让我理解每一个函数背后的逻辑。此外,书中关于图像分割的部分,对我启发很大,让我明白了如何将图像分解成不同的区域,这在很多实际应用中都非常重要。这本书的价值在于它能够真正激发读者的学习兴趣,并培养独立解决问题的能力。

评分

这本书真的让我打开了新世界的大门!我一直对计算机视觉领域很感兴趣,但苦于没有合适的入门读物。偶然间发现了《Python计算机视觉编程》,简直是我的救星!刚开始拿到书,就被它厚实的内容吸引了,但打开后发现,语言风格非常亲切,一点也不像那些枯燥的技术手册。作者非常善于用通俗易懂的语言解释复杂的概念,而且每一个知识点都配有非常清晰的代码示例,这对我这种动手能力比较强的人来说,简直是福音。我记得我第一个实现的例子是图像的边缘检测,看着那些原本模糊不清的图像瞬间变得清晰锐利,那种成就感无法言喻!这本书涵盖的知识点非常全面,从基础的图像处理算法,到更高级的目标检测和图像识别,都有涉及。而且,它使用的Python语言,本身就非常灵活和易于学习,搭配上这本书的指导,让我能够快速地将理论知识转化为实际应用。我特别喜欢书中关于图像滤波的部分,解释得非常到位,让我明白了高斯模糊、均值滤波等等不同滤波方式的原理和应用场景。总的来说,这本书的逻辑清晰,循序渐进,即使是初学者也能轻松跟上。

评分

作为一名有一定Python基础的开发者,我一直在寻找能够深入探索计算机视觉领域的可行途径。《Python计算机视觉编程》这本书,准确地击中了我的痛点。它并没有停留在浅尝辄止的介绍,而是深入到算法的底层逻辑,并且用Python语言进行实现,这对于我理解计算机视觉的“黑魔法”非常有帮助。我尤其赞赏书中对OpenCV库的详细讲解,它几乎涵盖了OpenCV中绝大多数常用的功能,并且通过具体的例子进行了演示。例如,书中关于特征匹配的部分,详细讲解了SIFT、SURF等算法的原理,并通过代码展示了如何提取图像的关键点和描述符,然后进行匹配。这让我对图像的相似性度量和物体识别有了更深刻的认识。另外,书中对于图像变换的解释也十分到位,包括仿射变换、透视变换等,让我明白了如何对图像进行几何校正和视角调整。这本书的深度和广度都让我非常满意,它不仅教会了我如何“用”,更教会了我“为什么”。对于想要在计算机视觉领域进行更深入研究的读者来说,这本书绝对是值得投资的。

评分

说实话,我一直对计算机视觉有着强烈的好奇心,但总觉得门槛很高。《Python计算机视觉编程》这本书,彻底改变了我的看法。它提供了一个非常友好的入口,让我能够用Python这门易学易用的语言,去探索这个迷人的领域。书中的例子设计得非常巧妙,每一个例子都能够解决一个实际的问题,并且通过代码的逐步解析,让我理解每一步操作的意义。我记得我尝试了书中关于人脸检测的例子,看着程序能够准确地在图像中识别出人脸,并用方框标记出来,那种震撼感至今难忘。这本书的结构非常清晰,从基础的图像处理,到更复杂的应用,层层递进,让我能够循序渐进地掌握知识。我特别喜欢书中关于物体跟踪的章节,它详细介绍了卡尔曼滤波等跟踪算法,让我明白了如何实现对动态物体的持续追踪。这本书的实践性非常强,每一个章节都提供了可以直接运行的代码,让我能够边学边练,巩固所学知识。对于任何想要进入计算机视觉领域的人来说,这本书都是一个绝佳的选择,它能够让你在短时间内获得显著的进步。

评分

京东原版图书,质量好,送货快,有保证。

评分

很好

评分

挺好用的,用着还可以。

评分

很不错的书,虽然感觉上内容并不多

评分

!!!!!!!!!!!1

评分

实用,不错,对学习有帮助

评分

新的工具

评分

好评好评好评好评好评好评好评好评好评好评好评好评

评分

还没开始看,感觉不错

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.qciss.net All Rights Reserved. 图书大百科 版权所有