发表于2025-01-11
本书是数字视频处理的图书,深入阐述数字图像与视频处理技术。第2版更新了近80%的内容,全书章节调整为全新的8章,包括图像滤波、运动估计、视频分割、视频滤波、图像压缩和视频压缩等,尤其体现了在信号处理和计算机视觉方面的重要进展,以及3D、超高分辨率的视频和数字电影的新应用。
前言
本书于1995年出版了第1版,是第一本全面介绍数字视频处理的教材,当时根据视频处理领域的重要论题分成了25章,在一个学期的课程中,每章可以用一到两次课进行讲授。那个时期的数字视频技术和视频处理算法还不太成熟,数码摄像机和DVD刚刚商业化,数字电视标准正在制定,而数字电影还没有纳入议程。因此,与当今的技术水平相比,第1版中的一些方法/算法和技术已经过时,比如像素级回归的运动估计、矢量量化、不规则形状压缩、基于模型的编码等已不再先进,还有一些诸如模拟视频/电视和128K可视电话等技术则已经淘汰了。同时近20年来的重大进展显然也无法体现出来。
第1版出版至今已有20多年了,在当今这个数字化时代,数字视频已广泛应用于我们的日常生活。信号处理与计算机视觉领域的重大发展促进了视频处理算法的不断成熟,能够应用于不同用途的最常用又有效的算法与技术也更加清晰。因此,现在是本书推出新版的最好时机。本书围绕图像与视频处理的最新发展进行了精心编排,力图成为一本内容全面、结构严谨的教材。
第2版大幅度改进了内容与表述风格的组织方式,包含当今最先进的技术、最有效的算法和最新的知识。全书共分8章,每章对应一个主题,分别是多维信号处理、图像/视频基础、图像滤波、运动估计、视频分割、视频滤波、图像压缩、视频压缩。每个主题侧重介绍最有效的技术。与第1版相比,这一版不是简单的内容增补,而是一次全新的改写。
本书可作为高年级本科生或研究生的数字图像与视频处理课程的教材,要求读者预先掌握微积分、线性代数、概率论和一些基本的数字信号处理概念。具有计算机科学背景但不熟悉信号处理基本概念的读者,则可以跳过第1章,从第2章开始学习。尽管本书表述严谨,但仍然像一般教材一样从原理开始讲起,因此也可以用作产业界或学术界的工程师和研究人员自学的参考书。本书有助于读者理解图像和视频处理方法的理论基础,学习用最通用、最有效的算法解决常见的图像与视频处理问题。大部分章后提供习题集(部分习题集中还含有MATLAB练习),通过这些可加深读者对知识的理解和对方法的掌握。
数字视频处理就是对数字视频比特流的各种操作。所有数字视频应用都离不开压缩。此外,为了获得高质量图像或提取特定信息,数字视频应用也离不开广泛应用于格式转换、增强、复原、高分辨率重建等场合的滤波处理;有些应用还需要用到其他的处理,以实现运动估计、视频分割和3D场景分析。视频的帧与帧之间存在着大量的时间相关性(冗余),这使得视频处理不同于静态图像处理。可以将视频看成静态图像序列,并逐帧独立处理。但若采用基于帧间相关性的多帧联合处理技术,我们能够开发出更有效的视频处理算法,例如运动补偿滤波和预测。此外,某些任务(比如运动估计或动态场景分析)显然是无法基于单个图像来进行的。
本书的目的是为读者提供图像(单帧)和视频(多帧)处理方法的数学基础。特别是,本书还回答了以下基本问题:
●如何从噪声中分离出图像(信号)?●内插、复原和超分辨率重建之间是否有内在的联系?●对于不同的应用,该如何估计2D和3D运动?●如何将图像和视频分割成感兴趣区域?●如何跟踪视频中的对象?●与图像滤波相比,视频滤波问题是否更趋向于适定?●超分辨率重建为何能够实现?●能否从视频片段中得到高质量的静态图像?●图像和视频压缩为什么能够实现?●如何压缩图像和视频?●图像/视频压缩的最新国际标准是什么?●3D视频表示和压缩的最新标准是什么?图像和视频处理的大都是病态问题(欠定的和/或对噪声敏感的),并且它们的解都依赖于某些图像和视频模型。附录B讨论了用于病态问题解的图像建模方法。实际上,图像模型可以分成基于局部平滑、基于变换域稀疏和基于非局部自相似的种类。
图像处理算法大都使用了以上模型中的一种或多种。此外,视频模型还包括基于全局平移或块平移、参数化运动、运动(空间上)的平滑性、时域运动单调性(时域连续或平滑)、3D空时频域的平面支撑等类。
各章概述如下。
第1章回顾了多维信号、变换和系统的基础知识,它们是许多图像和视频处理方法的理论基础。该章还介绍了格上空时采样的体制(如逐行和隔行采样),以及采样格式转换理论。读者如果具有计算机科学背景但不熟悉信号处理概念,则可以跳过本章,直接从第2章开始学习。
第2章给出了数字图像与视频的基础知识。主要内容包括人类视觉、空间频率、彩色模型、模拟和数字视频表示、数字视频标准、3D立体/多视角视频表示、数字视频质量评估等基本概念,以及一些常见的数字视频应用,如数字电视、数字电影和网络视频流等。
第3章介绍了图像(静止帧)滤波类问题,比如图像重采样(抽取与内插)、梯度与边缘检测、增强、去噪、复原等。还介绍了线性移不变滤波器、自适应滤波器和非线性滤波器。附录B给出了求解病态逆问题的一般性框架。
第4章介绍了2D和3D运动估计方法。运动估计是数字视频处理的核心,因为运动是视频的显著特征,并且运动补偿滤波是利用时间冗余的最有效方法。再者,许多计算机视觉工作的第一步都是2D或3D运动估计与跟踪。2D运动估计一般分为稠密光流或稀疏对应估计两类,可以基于参数法和非参数法来实现。非参数法包括基于图像梯度的光流估计法、块匹配法、像素递归法、贝叶斯法和相位相关法。基于仿射模型或单应性的参数法可以用于图像配准或局部变形估计。3D运动/结构估计法一般都基于双帧极线约束法(主要针对立体对)或多帧因子分解法。欧几里得3D结构重建需要对所有相机进行标定,而投影重建法则无需标定。
第5章介绍了图像分割和变化检测,以及基于参数聚类法和贝叶斯法的主要运动或复杂运动分割。我们还讨论了运动估计与分割的同时实现问题。因为双视角运动估计技术对于图像梯度或对应点的估计精度很敏感,因此我们也对长的单目序列或立体像对中分割对象的运动跟踪进行了讨论,其结果更鲁棒。
第6章介绍了视频滤波,包括标准转换、去噪和超分辨率重建等内容。首先介绍了运动补偿滤波的基本原理,随后介绍了标准转换问题,包括帧速转换和去隔行等。视频帧的画面中经常存在颗粒,尤其在静止帧模式下观看时更加严重。为此,讨论了用于噪声抑制的运动自适应和运动补偿滤波。最后介绍了一种统一各种视频滤波问题的综合模型,可用于低分辨率视频获取和超分辨率重建。
第7章介绍了包括二值图像(传真)和灰度图像在内的静态图像压缩方法与标准,如JPEG和JPEG 2000等。还特别讨论了无损的图像压缩、有损的离散余弦变换(DCT)编码和小波变换编码等方法。
第8章讨论了视频压缩方法和标准,它们是实现数字电视、数字电影等数字视频应用的基础。在简要介绍了视频压缩的不同方法后,详细描述了MPEG��2、AVC/H.264和HEVC(高效视频编码)等标准,以及这些标准在可伸缩视频编码和立体和多视角视频编码方面的扩展。
本书是近20多年来我在数字图像与视频处理领域的教学结晶。本书内容丰富,结构合理,全面覆盖了图像滤波、运动估计、视频分割与跟踪、视频滤波、图像/视频压缩等方面的基本原理和最新成就。然而,一本书无法覆盖数字视频处理和计算机视觉领域所有的最新成就,因此本书只对最基本、最常用的技术和算法加以详解,而对更多的先进算法和最新研究成果只进行简介,并提供用于自学的参考文献。大部分章节最后都包含习题集(部分习题集还包含MATLAB练习),以便读者对所学到的方法进行练习。
教师可以通过申请获得教学资料。表P.1提供了一个教学建议,按照一个学期14周、每周两次课、每次课75分钟的方式进行组织,可在一个学期的数字图像与视频处理课程中讲完本书的全部内容。另一种方式是将本书内容分到两个学期中,这样有更多时间对每个主题的细节进行探讨:第一学期可以开设数字图像处理课程,讲解第1、2、3、7章中的内容;第二学期开设数字视频处理课程,讲解第4、5、6、8章的内容。
表P.1一学期课程的教学建议每次课的编号专题章/节12D信号与2D变换1.1节、1.2节22D系统、2D FIR滤波器、频率响应1.3节3格上空时采样1.4节、1.5节4数字图像/视频、人类视觉、视频质量第2章5矢量矩阵表示、图像模型、图像/视频处理中病态问题的表达附录A、附录B6抽取、内插、多分辨率金字塔3.2节7梯度估计、边缘/角检测3.3节8图像增强、点操作、钝化掩模、双边滤波3.1节、3.4节9噪声滤波:LSI滤波器(自适应、非线性、非局部滤波器)3.5节10图像复原:迭代法、POCS3.6节11运动建模、光流法、对应法4.1节、4.2节、4.3节12不同的方法:Lukas�睰anade、参数模型4.4节13块匹配、参数模型估计中的特征匹配、相位相关法4.5节、4.7节143D运动估计、对极几何4.8节15变化检测、视频分割5.2节、5.3节16运动跟踪5.4节、5.5节17运动补偿滤波、多帧联合去隔行、去噪6.1节、6.2节、6.3节18超分辨率重建6.5节19数据/图像压缩介绍、信息论概念、熵编码、算术编码7.1节20无损位平面编码、G3/G4、JBIG标准7.2节21预测数据编码、JPEG标准7.2节22DCT与JPEG图像压缩7.3节23小波变换、JPEG 2000图像压缩7.4节24MC�睤CT、MPEG��1、MPEG��28.1节、8.2节25MPEG��4 AVC/H.264标准8.3节26HEVC8.4节27可分级视频编码、DASH自适应流、抗误码8.5节283D/立体和多视角视频压缩8.6节显然,本书是信号处理和计算机科学相关组织研究成果的荟萃。每章都有很多引用并列出了相关参考文献,但肯定无法涵盖图像和视频领域科研与工业部门杰出研究者的所有成就。此外, 对于ISO和ITU组织中各位科学家经多年工作取得的图像与视频编码的显著成果,这里也难以一一致意。
最后,衷心感谢Xin Li (美国西弗吉尼亚大学,WVU)、 Eli Saber、Moncef Gabbouj、 Janusz Konrad和H.Joel Trussell在本书成稿过程中的贡献。同时感谢Prentice Hall出版社的Bernard Goodwin、 Kim Boedigheimer和 Julie Nahil的帮助与支持。
A.Murat Tekalp于土耳其伊斯坦布尔Koc大学
数字视频处理(原书第2版) 下载 mobi pdf epub txt 电子书 格式 2025
数字视频处理(原书第2版) 下载 mobi epub pdf 电子书数字视频处理(原书第2版) mobi epub pdf txt 电子书 格式下载 2025