發表於2025-01-18
計算機視覺和機器模式識彆是當前熱門的研究領域, 目標檢測和識彆是其中的關鍵技術。本書以作者自身豐富的項目實踐經驗為基礎, 提供瞭一些優選的目標檢測和識彆方法, 特彆是基於統計和基於張量的目標檢測與識彆方法。本書力求理論與實踐密切結閤, 不僅以簡潔明瞭的方式提供瞭這些方法的理論綜述和必要的數學背景, 還提供瞭以C++編程語言為平颱的可用於指導或直接移植的實現代碼, 讀者可基於文中及網站給齣的代碼開發自己工作中所需的方法。本書的實踐領域主要涉及汽車應用, 包括用於路標識彆或駕駛監控的視覺係統。
Bogus?aw Cyganek博士:波蘭AGH科技大學電子學係研究員及講師,IEEE, IAPR和 SIAM會員。他的研究興趣包括計算機視覺、模式識彆以及可編程設備和嵌入式係統。他在各種期刊和學術會議單獨或與他人閤作發錶論文90餘篇,共齣版著作4種。 Bogus?aw Cyganek博士:波蘭AGH科技大學電子學係研究員及講師,IEEE, IAPR和 SIAM會員。他的研究興趣包括計算機視覺、模式識彆以及可編程設備和嵌入式係統。他在各種期刊和學術會議單獨或與他人閤作發錶論文90餘篇,共齣版著作4種。
目 錄
第1章 引言
1.1 計算機視覺的一個例子
1.2 全書內容概覽
參考文獻
第2章 計算機視覺中的張量方法
2.1 摘要
2.2 張量――一個數學對象
2.2.1 綫性空間的主要屬性
2.2.2 張量的概念
2.3 張量――數據對象
2.4 張量的基本屬性
2.4.1 張量指標和分量的符號
2.4.2 張量積
2.5 張量距離測量
2.5.1 張量距離概述
2.5.2 歐幾裏得圖像距離和標準化變換
2.6 張量場的濾波
2.6.1 張量數據的順序統計濾波
2.6.2 各嚮異性擴散濾波
2.6.3 擴散過程的實現
2.7 采用結構張量觀察圖像
2.7.1 二維圖像空間中的結構張量
2.7.2 空時結構張量
2.7.3 多通道和尺度空間結構張量
2.7.4 擴展結構張量
2.8 采用慣性張量和矩的目標錶示
2.9 張量的特徵分解和錶示
2.10張量不變量
2.11多視點幾何: 多焦點張量
2.12多綫性張量方法
2.12.1 多綫性代數的基本概念
2.12.2 高階奇異值分解(HOSVD)
2.12.3 HOSVD的計算
2.12.4 HOSVD誘導基
2.12.5 張量最佳秩1近似
2.12.6 張量的秩1分解
2.12.7 最佳秩(R1, R2, …, RP)近似
2.12.8 最佳秩(R1, R2,…, RP)近似的計算
2.12.9 子空間數據錶示
2.12.10非負矩陣因子分解
2.12.11非負矩陣因子分解的計算
2.12.12采用NMF的圖像錶示
2.12.13非負矩陣因子分解的實現
2.12.14非負張量因子分解
2.12.15目標識彆的多綫性方法
2.13結束語
2.13.1 本章小結
2.13.2 延伸閱讀
習題
參考文獻
第3章 分類方法和算法
3.1 摘要
3.2 分類框架
3.3 用於目標識彆的子空間方法
3.3.1 主成分分析
3.3.2 子空間模式分類
3.4 目標識彆的統計公式
3.4.1 參數化和非參數化方法
3.4.2 概率框架
3.4.3 貝葉斯決策規則
3.4.4 最大後驗分類方案
3.4.5 二元分類問題
3.5 參數化方法――混閤高斯
3.6 卡爾曼濾波器
3.7 非參數化方法
3.7.1 基於直方圖的技術
3.7.2 比較直方圖
3.7.3 多維直方圖的實現
3.7.4 Parzen方法
3.8 均值移位方法
3.8.1 均值移位簡介
3.8.2 連續自適應均值移位方法
3.8.3 均值移位跟蹤的算法方麵
3.8.4 CamShift方法的實現
3.9 神經網絡
3.9.1 概率神經網絡
3.9.2 概率神經網絡的實現
3.9.3 漢明神經網絡
3.9.4 漢明神經網絡的實現
3.9.5 形態神經網絡
3.10視覺模式識彆中的核
3.10.1 核函數
3.10.2 核的實現
3.11數據聚類
3.11.1 k均值方法
3.11.2 模糊c均值
3.11.3 核模糊c均值
3.11.4 聚類質量的測量
3.11.5 實現問題
3.12支持嚮量域描述
3.12.1 支持嚮量機的實現
3.12.2 一類分類器集成的體係結構
3.13本章附錄――用於模式分類的MATLAB和其他軟件包
3.14結束語
3.14.1 本章小結
3.14.2 延伸閱讀
習題
參考文獻
第4章 目標檢測和跟蹤
4.1 簡介
4.2 直接像素分類
4.2.1 基準數據采集
4.2.2 實例研究――人類皮膚檢測
4.2.3 實例研究――基於像素的路標檢測
4.2.4 采用分類器集成的基於像素的圖像分割
4.3 基本形狀檢測
4.3.1 綫段的檢測
4.3.2 凸形狀的UpWrite檢測
4.4 圖形檢測
4.4.1 從特徵點進行的規則形狀檢測
4.4.2 顯著點的聚類
4.4.3 自適應窗生長方法
4.4.4 圖形驗證
4.4.5 實例研究――路標檢測係統
4.5 實例研究――路標跟蹤和識彆
4.6 實例研究――用於目標跟蹤的框架
4.7 行人檢測
4.8 結束語
4.8.1 本章小結
4.8.2 延伸閱讀
習題
參考文獻
第5章 目標識彆
5.1 摘要
5.2 從張量相位直方圖和形態尺度空間進行的識彆
5.2.1 在形態尺度中張量相位直方圖的計算
5.2.2 張量相位直方圖的匹配
5.2.3 實例研究――在形態尺度空間中采用張量相位直方圖進行的目標識彆
5.3 基於不變量的識彆
5.3.1 實例研究――采用仿射不變矩的象形圖識彆
5.4 基於模闆的識彆
5.4.1 用於路標識彆的模闆匹配
5.4.2 用於模闆匹配的專用距離
5.4.3 采用對數極坐標和尺度空間進行的識彆
5.5 從可變形模型進行的識彆
5.6 分類器集成
5.7 實例研究――用於從變形原型中進行路標識彆的分類器集成
5.7.1 路標識彆係統的體係結構
5.7.2 用於警告標誌識彆的模塊
5.7.3 仲裁單元
5.8 基於張量分解的識彆
5.8.1 在由模式張量HOSVD分解所張成的子空間中進行的模式識彆
5.8.2 實例研究――基於采用可變形模式原型的張量分解的路標識彆係統
5.8.3 實例研究――采用張量分解方法進行的手寫數字識彆
5.8.4 張量子空間分類器的實現
5.9 用於駕駛員狀態監控的人眼識彆
5.10目標分類識彆
5.10.1 基於部分的目標識彆
5.10.2 采用視覺詞袋的識彆
5.11結束語
5.11.1 本章小結
5.11.2 延伸閱讀
習題
參考文獻
附錄A
譯 者 序
俗話說, 眼見為實。對於人和動物來說, 在場景中對目標進行檢測與識彆是一種很輕鬆自然的生存能力。然而, 對於諸如計算機這樣的機器來說, 怎樣纔能像人和動物一樣觀察目標, 甚至比人和動物觀察得更好、 檢測識彆得更快, 這成為計算機視覺和模式識彆領域的主要熱點問題。對於從事該領域研究的教師、 學生以及科研人員而言, 一本全麵翔實、 富有實踐價值的參考書是十分必要的。本書是波蘭AGH科技大學電子學係研究員及講師Bogus?aw Cyganek博士在2009年3月齣版其知名著作《三維計算機視覺技術及算法導論》(An Introduction to 3D Computer Vision Techniques and Algorithms)之後於2013年8月齣版的又一力作。本書齣版後, 因其內容係統全麵, 理論體係嚴謹, 講解深入淺齣, 理論與實踐結閤緊密, 獲得瞭讀者的普遍好評。本書具有以下幾個特色。首先, 本書內容全麵、 重點突齣。本書從張量的基本定義開始, 介紹瞭應用於計算機視覺和模式識彆任務的張量方法, 並概述瞭常見的各種分類方法, 還基於波蘭道路場景中的路標識彆應用闡明瞭目標檢測與跟蹤、 目標識彆的關鍵問題。全書以清晰簡潔的語言, 涵蓋瞭計算機視覺的幾個關鍵技術: 分類、 檢測、 跟蹤與識彆。其次, 本書的適用麵廣。它既適閤電子工程、 計算機科學、 計算機工程等專業的本科生作為教材使用, 也適閤圖像、 視頻信號處理, 模式識彆和計算機視覺方嚮的碩士、 博士研究生使用, 還可以作為相關專業的科研工作者參考用書。第三, 基於作者多年從事軟件開發的實踐經驗, 本書提供瞭具有很高參考價值的代碼和僞代碼。特彆是提供瞭一些C++語言的完整實現和用於矩陣和張量處理的MATLAB函數, 附錄中還給齣用於將串行代碼轉換為並行版本的OpenMP庫, 原書相關網站還提供瞭完整的軟件平颱、 彩色圖像以及其他有用的鏈接, 這都便於工程應用時參考使用, 尤其適閤高校的碩士、 博士研究生進行算法研究時參考使用。當然, 目標檢測、 跟蹤與識彆是圖像模式識彆和計算機視覺領域的研究熱點, 各種新算法和技術層齣不窮, 本書隻提供瞭迄今為止現代計算機視覺方法和算法的一個深入闡述。盡管如此, 譯者仍然認為本書是一本不可多得的優秀著作。全書由中原工學院的宋曉煒、 楊蕾和瞿博陽分工翻譯。其中, 前言、 第1章和第2章由宋曉煒翻譯, 第3章和第4章由楊蕾翻譯, 第5章和附錄由瞿博陽翻譯。全書由天津大學李鏘教授審校。另外, 研究生吳源昭、 牛林林、 劉清麗、 楊滿意、 蔡文靜等也參與瞭書稿的部分整理準備工作。感謝Bogus�baw Cyganek博士對中文譯書齣版方麵給予的閤作。感謝國傢自然科學基金項目(60902063, 61440031, 61305080)在本書翻譯過程中給予的支持。感謝電子工業齣版社對翻譯工作的大力支持, 正是他們的嚴謹細緻和辛勤付齣, 本書纔得以順利齣版。由於譯者學識所限, 疏漏乃至錯誤在所難免, 懇請廣大讀者及專傢不吝賜教, 提齣修改意見, 我們將不勝感激。
譯 者
2015年11月於鄭州
前 言
我們生活在一個技術革命的時代, 在這個時代中, 某一領域的進展常常會引發另一領域的突破。類似於19世紀的工業革命, 近幾十年可以稱為計算機革命的新紀元。多年來,我們已經見證瞭微芯片技術的快速發展, 該技術造成瞭成本逐年降低的、 持續增長的計算能力。圖形處理單元和現場可編程門陣列的並行計算係統的最新發展使之得以加強。所有這些硬件方麵的成就也開啓瞭尋求使計算機看得見並能理解它所見內容的新應用領域和可能性——這是計算機視覺領域的首要目標。然而, 雖然快速計算機在這方麵有很大幫助, 但是真正産生影響的是新的、 更好的處理方法及其實現。本書給齣瞭一些優選的目標檢測和識彆方法, 特彆強調瞭統計的以及對該領域較新的基於張量的方法。然而, 有趣且重要方法的數量正在快速增長, 這使得在一本書中很難提供對這些方法的全麵涵蓋。因此, 本書的目標略有不同, 即這裏所選擇的這些方法是我自己和我的同事在很多項目中使用過的、 並且在實踐中被證明是有用的方法。我們的主要領域涉及汽車應用, 其中我們嘗試開發用於道路標誌識彆或者駕駛員監控的視覺係統。當開始寫這本書的時候, 我的主要目的是: 不僅給齣這些方法的綜述, 還提供雖然簡明但是必要的數學背景。然而, 同樣重要的是所討論方法的實現。我深信詳盡理論與其實現的聯係是深入理解該主題的先決條件。就這方麵來說, 對實現平颱的選擇也不足為奇。貫穿本書並且在所附軟件庫中使用的C++編程語言是世界性的工業標準。這並不意味著不可以使用不同的編程平颱來完成實現, 可以將所提供的代碼示例用做指南或者用來直接移植。本書附有一個配套網址: www.wiley.com/go/cyganekobject, 其中包含瞭代碼和彩圖, 以及PPT、 勘誤錶和其他有用的鏈接。本書的完成是在我與閤作作者J. Paul Siebert緻力於三維圖像處理的前一本書之後, 我對現代計算機視覺方法著迷的結果。因此, 雖然這兩本書都可以單獨閱讀, 但在某種意義上可以將本書視為我們前一本書的延續。因此, 本書可供與計算機視覺和機器模式識彆相關的所有科學傢和行業從業者使用, 也可以用做對此快速發展領域感興趣的學生的教程。
Bogus?aw Cyganek
波蘭
緻 謝
寫一本書是一個巨大的任務。如果沒有朋友、 同事、 閤作夥伴以及許多其他人的幫助, 那將是不可能的, 有時我甚至不知道這些人的名字, 但我知道他們做齣瞭傑齣的工作來使本書誕生。我尤其感謝位於波蘭剋拉科夫(Kraków)的AGH科技大學以及學術計算機中心Cyfronet的許多同事。特彆感謝Ryszard Tadeusiewicz教授和Kazimierz Wiatr教授持續的鼓勵和支持。我還想要錶達對來自德國柏林洪堡大學和德國航空航天中心的Ralf Reulke教授以及他所在團隊的所有同事的感謝, 感謝在感興趣的科學領域中我們富有成效的傾力閤作。我非常感謝Wiley團隊, 他們的幫助使這本書的齣版成為可能。我想要錶達對Richard Davies、 Alex King、 Nicky Skinner、 Simone Taylor、 Liz Wingett和Nur Wahidah Binte Abdul Wahid、 Shubham Dixit、 Caroline McPherson的特彆感謝, 以及對我不知道他們名字但我知道他們為促使本書誕生做瞭傑齣工作的所有其他人的特彆感謝。再次非常感謝!我還要非常感謝世界各地的許多同事, 並且特彆是我前一本關於三維計算機視覺的書的讀者, 感謝他們的電子郵件、 提問、 建議、 缺陷報告以及我們所進行的所有討論。所有這些都幫助我開發更好的文本和軟件。在現在和將來我還要請求他們的支持。我想要好好錶達對波蘭共和國國傢科學中心CNC的感激之情, 感謝他們對在2007-2009年以及2011-2013年在閤同號no.DEC��2011/01/B/ST6/01994下進行的科研項目的經費支持, 這對本書做齣瞭很大貢獻。我還想錶達對AGH科技大學齣版社授權使用我前一本書的部分內容的感謝。最後, 我想要感謝我的傢人: 我的妻子Magda、 我的孩子Nadia和Kamil, 以及我的母親, 感謝他們在我完成本書的所有日子裏的容忍、 支持和鼓勵。
符號和縮寫
B 基矩陣
C 數據類的數目
C 係數矩陣
Cx 數據集{xi}的相關矩陣
D 數據矩陣
D 距離函數
E 統計期望
i,j,k,m,n 自由坐標, 矩陣指標
1n 所有元素設置為1的n×n維矩陣
In n×n維單位矩陣
I 圖像, 一幅圖像的強度信號
Ix, Iy 圖像I在x, y方嚮的空間導數
J 一係列中成分的數目
K 核矩陣
L 嚮量中分量的數目, 空間維度
M 聚類的數目, 圖像通道的數目
N (數據)點的數目
P 概率質量函數
p 概率密度函數
P, Q, C 張量中指標的數目(張量維度)
p, q 張量的協變和逆變度
R 主成分的數目
R 實數集
T 張量
T(k) 張量T的第k個展平模式
TC 緊湊結構張量
TE 擴展結構張量
t 時間坐標
W 嚮量空間
W* 雙嚮量空間
X 矩陣
XT X的轉置矩陣
Xi (一係列矩陣中)第i個矩陣
x, y 空間坐標
x 列嚮量
xi (一係列嚮量中)第i個嚮量
{xi} 對於給定範圍指標i的嚮量xi的集閤
x(k)i 對於矩陣Xi的第k列嚮量
x 歸一化列嚮量
x- 均值嚮量
x 正交殘差嚮量
xi 嚮量x的第i個分量
∑x 數據集{xi}的協方差矩陣
ρ 直方圖中的屜數目
Δ 直方圖中的屜寬度
Ω 分類標記的集閤
⊙ Khatri�睷ao積
�� 剋羅內剋(Kronecker)積
按元素的乘法[阿達馬
(Hadamard)積]
按元素的除法
嚮量的外積
∨ 最大積
∧ 最小積
× 形態外積
�� 任意
AD 各嚮異性擴散
ALS 交替
數字圖像目標檢測與識彆―理論與實踐 [Object Detection and Recognition in Digital Images] 下載 mobi pdf epub txt 電子書 格式 2025
數字圖像目標檢測與識彆―理論與實踐 [Object Detection and Recognition in Digital Images] 下載 mobi epub pdf 電子書京東商品我放心,物流很快,點贊!
評分很好用,功能很強大,物流也很快。
評分挺好的書
評分很好,但是對基礎知識要求有點高
評分京東商品我放心,物流很快,點贊!
評分這本書不錯,正好有我需要參考的內容,實例和程序也給瞭不少,京東送貨還挺快,給好評!
評分能不能彆隨意拆單啊,,,或者拆單也盡量把發票開一起呀,太麻煩瞭。
評分非常好的書 需要很紮實的基礎
評分好書~
數字圖像目標檢測與識彆―理論與實踐 [Object Detection and Recognition in Digital Images] mobi epub pdf txt 電子書 格式下載 2025