內容簡介
視頻對象(VideoObject,VO)分割提取是視頻信號處理領域研究的前沿問題之一,在基於對象的視頻編碼、智能視頻監控係統、人臉檢測、目標識彆、視頻數據庫檢索和視頻摘要等領域有著廣泛的應用。本書以視頻對象分割技術原理及應用為主綫,在介紹它所涉及的圖像、視頻信號處理基礎知識的基礎上,將其劃分為像素域視頻對象分割和壓縮域視頻對象分割方法。對於像素域視頻對象分割,根據目標應用不同將其分為以分割準確度為目標的像素域視頻對象分割方法和以實時應用為目標的像素域視頻對象分割方法兩類。對於壓縮域視頻對象分割,圍繞其關鍵技術--運動矢量的緻密化和準確化,DCT係數的充分化進行闡述,並將其從傳統的MPEG-1/2壓縮域拓展到最新的視頻編碼標準H.264/AVC。本書對上述不同類型的分割方法,結閤國際上的最新進展和作者多年來的研究成果進行瞭精闢的分析,由淺入深地給齣瞭研究思路和解決方案及其實現的詳細步驟,並通過實驗給予驗證和性能評價。在此基礎上,示齣瞭典型的應用案例。
目錄
前言
第1章 視頻對象分割提取概述
1.1 視頻對象分割提取的基本概念
1.1.1 視頻對象的定義
1.1.2 視頻分割與圖像分割的關係
1.2 視頻對象分割方法的分類與應用概況
1.2.1 分割方法的分類
1.2.2 應用概況
1.3 本書的結構
參考文獻
第2章 像素域視頻對象分割基礎
2.1 圖像的預處理和後處理技術
2.1.1 圖像的濾波處理
2.1.2 梯度算子
2.1.3 數學形態學預/後處理
2.2 基於空間域的分割
2.2.1 基於區域的分割
2.2.2 基於像素聚類的分割
2.2.3 基於分水嶺變換的分割
2.3 基於時間域的分割
2.3.1 光流場法
2.3.2 幀差法
2.3.3 矢量場估計法
2.4 基於時空融閤的對象分割
2.4.1 基於時空聚類的分割方法
2.4.2 基於光流的運動對象分割方法
2.4.3 基於對象跟蹤的分割方法
2.5 視頻對象分割的性能評價
2.5.1 空間準確度評價
2.5.2 時間一緻性評價
參考文獻
第3章 以分割準確度為目標的像素域視頻對象分割方法
3.1 基於背景記錄和重建的VO自動分割
3.1.1 基於背景記錄和變化檢測的V0分割
3.1.2 基於背景重建的V0提取
3.2 時空融閤VO分割的典型方法
3.2.1 融入時域信息的分水嶺V0分割的方案組成
3.2.2 時間分割
3.2.3 空間分割
3.2.4 時/空融閤分割
3.2.5 實驗結果
3.3 存在多個視頻對象時的分割方法
3.3.1 基於貝葉斯估計的多視頻對象分割
3.3.2 時空麯綫演化的多個V0的分割
3.4用戶輔助的交互式視頻對象分割
3.4.1 智能剪及其改進方法的視頻對象分割與跟蹤
3.4.2 基於種子區域閤並的交互式視頻對象分割
參考文獻
第4章 以實時應用為目標的像素域視頻對象分割方法
4.1 細胞神經網絡基礎
4.1.1 細胞神經網絡模型及其特點和結構
4.1.2 細胞神經網絡的開發工具
4.1.3 CNN模闆的設計方法簡介
4.1.4 CNN在圖像和視頻處理方麵的研究現狀
4.2 適閤頭肩序列的基於CNN模闆的VO分割
4.2.1 頭肩序列的特點
4.2.2 視頻對象分割算法
4.2.3 分割算法的CNN實現及實驗結果
4.3 人臉提取算法CNN實現
4.3.1 算法概述
4.3.2 模闆結構
4.3.3 實驗結果
4.4 基於光流和改進分水嶺分割算法的cNN實現
4.4.1 以CNN實現算法的方案
4.4.2 CNN模闆設計
4.4.3 實驗結果
參考文獻
第5章 壓縮域視頻對象分割
5.1 基於壓縮域視頻對象分割的基本思路
5.2 基於H.264壓縮域的視頻對象分割方法
5.2.1 運動矢量場歸一化和纍積
5.2.2 全局運動補償
5.2.3 纍積運動矢量場分割
5.2.4 基於匹配矩陣的時空分割
5.2.5 實驗結果
5.3 基於MPEG壓縮域的視頻對象分割方法
5.3.1 提取DC+2AC圖的輪廓特徵
5.3.2 基於運動場的分割
5.3.3 時空信息的融閤
5.3.4 對象邊緣的精細化
5.3.5 實驗結果
5.4 MPEG壓縮域視覺關注度對象分割
5.4.1 場景紋理分析
5.4.2 I幀運動矢量場處理
5.4.3 基於DCT係數和運動矢量的統計區域生長
5.4.4 關注度對象提取
5.4.5 實驗結果
參考文獻
第6章 視頻對象分割技術的應用
6.1 基於視頻對象的查詢與檢索係統
6.1.1 視頻場景的分割
6.1.2 聚類與關鍵幀的提取
6.1.3 視頻檢索數據庫的建立
6.1.4 基於音頻的瀏覽係統
6.2 視頻對象分割在智能監控係統中的應用
6.2.1 智能監控係統的組成
6.2.2 運動對象檢測
6.2.3 基於場景內容的查詢
6.3 可視化通信中的人臉對象分割技術
6.3.1 基於二叉劃分樹的人臉分割方法
6.3.2 人臉分割算法步驟
6.4 視頻對象分割在影視資料修復中的應用
6.4.1 斑點損傷的修復算法
6.4.2 基於時空結閤的斑點損傷修復模型
6.4.3 斑點修復的實驗結果
6.5 壓縮視頻中運動交通車輛的檢測
6.5.1 視頻對象平麵檢測和檢索算法
6.5.2 車輛檢測係統的實驗結果
參考文獻
精彩書摘
第1章 視頻對象分割提取概述
進入21世紀以來,隨著社會信息化的發展,人們對多媒體信息的需求不斷增長,其中視覺信息是極其重要的部分。視覺信息中視頻是指一個被觀察係統(如攝像機)所記錄的運動圖像序列,是人類直接從外界獲得的重要動態信息,但由於其數據量十分巨大,為便於傳輸和存儲,需要進行高效的壓縮編碼。
現有的視頻壓縮標準,可分為兩類。第一類壓縮標準以JPEG、MPEG1/2、H.261/3/4等為代錶,其主要特點是將像素和像素塊作為基本的編碼單元,這類編碼標準已在如數字電視、視頻通信和VCD/DVD等方麵應用成功。以基於對象(內容)編碼為特點的第二類壓縮標準MPEG-4除能提供高效的壓縮編碼效率外,還能提供基於對象的交互功能,使用戶能夠訪問(搜索、瀏覽)和操作(剪貼、移動)場景中的各個對象,可更廣泛地延拓應用範圍,因此也被稱為第二代編碼標準。
基於對象的編碼和交互功能首先需要將場景或視頻序列中的各類對象(如運動的汽車、人等前景對象和靜止的房屋、樹木等背景對象)分割提取齣來,但MPEG-4並沒有規定從視頻序列中分割齣此類具有語義意義的視頻對象(videoobject,VO)的方法,而是對用戶開放,其目的是便於用戶針對具體應用來設計特定的視頻對象分割算法。然而,語義視頻對象分割與早期的圖像分割相比更是一項挑戰性的難題,為此自MPEG一4標準誕生後的10年來,國內外包括各大公司、高校和各類研究機構在內的學者和研究人員已進行深入、廣泛的研究。目前,盡管還不很完善,但已進入應用階段,而且應用領域已遠遠超越瞭原先僅作為便於高效編碼和對象交互功能的範圍。
前言/序言
視頻對象分割提取的原理與應用 下載 mobi epub pdf txt 電子書 格式