深度學習與計算機視覺+深度學習輕鬆學 2本 人工智能機器人視覺係統編程教程書

深度學習與計算機視覺+深度學習輕鬆學 2本 人工智能機器人視覺係統編程教程書 下載 mobi epub pdf 電子書 2025

葉韻,馮超 著
圖書標籤:
  • 深度學習
  • 計算機視覺
  • 人工智能
  • 機器人視覺
  • 圖像處理
  • 機器學習
  • 編程教程
  • Python
  • OpenCV
  • 神經網絡
想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
店鋪: 曠氏文豪圖書專營店
齣版社: 機械工業齣版社
ISBN:9787111573678
商品編碼:14739881119

具體描述

YL8930  9787111573678 9787121317132

深度學習與計算機視覺:算法原理、框架應用與代碼實現

全書共13章,分為2篇。第1篇基礎知識,介紹瞭人工智能發展裏程、計算機視覺概要、深度學習和計算機視覺中的基礎數學知識、神經網絡及其相關的機器學習基礎、捲積神經網絡及其一些常見結構,後對前沿的趨勢進行瞭簡單探討。第2篇實例精講,介紹瞭Python基礎、OpneCV基礎、簡單的分類神經網絡、圖像識彆、利用Caffe做迴歸、遷移學習和模型微調、目標檢測、度量學習和圖像風格遷移等常見的計算機視覺應用場景。從第5章開始包含瞭很多有趣和實用的代碼示例。從第7章開始的所有實例都基於當前流行的深度學習框架中的Caffe和MXNet。


序言 
前言 
第1篇 基礎知識
第1章 引言2
1.1 人工智能的新焦點——深度學習2
1.1.1 人工智能——神話傳說到影視漫畫2
1.1.2 人工智能的誕生3
1.1.3 神經科學的研究4
1.1.4 人工神經網絡的興起5
1.1.5 神經網絡的1次寒鼕6
1.1.6 神經網絡的1次復興8
1.1.7 神經網絡的第二次寒鼕9
1.1.8 2006年——深度學習的起點10
1.1.9 生活中的深度學習11
1.1.10 常見深度學習框架簡介12
1.2 給計算機一雙眼睛——計算機視覺14
1.2.1 計算機視覺簡史14
1.2.2 2012年——計算機視覺的新起點16
1.2.3 計算機視覺的應用17
1.2.4 常見計算機視覺工具包19
1.3 基於深度學習的計算機視覺19
1.3.1 從ImageNet競賽到AlphaGo戰勝李世石——計算機視覺**越人類19
1.3.2 GPU和並行技術——深度學習和計算視覺發展的加速器21
1.3.3 基於捲積神經網絡的計算機視覺應用22
第2章 深度學習和計算機視覺中的基礎數學知識27
2.1 綫性變換和非綫性變換27
2.1.1 綫性變換的定義27
2.1.2 高中教科書中的小例子28
2.1.3 點積和投影28
2.1.4 矩陣乘法的幾何意義(1)30
2.1.5 本徵嚮量和本徵值34
2.1.6 矩陣乘法的幾何意義(2)37
2.1.7 奇異值分解38
2.1.8 綫性可分性和維度39
2.1.9 非綫性變換42
2.2 概率論及相關基礎知識43
2.2.1 條件概率和獨立43
2.2.2 期望值、方差和協方差44
2.2.3 熵45
2.2.4 *大似然估計(Maximum Likelihood Estimation,MLE)47
2.2.5 KL散度(Kullback–Leibler divergence)49
2.2.6 KL散度和MLE的聯係49
2.3 維度的詛咒50
2.3.1 采樣和維度50
2.3.2 高維空間中的體積51
2.3.3 高維空間中的距離53
2.3.4 中心極限定理和高維樣本距離分布的近似54
2.3.5 數據實際的維度56
2.3.6 局部泛化58
2.3.7 函數對實際維度的影響59
2.3.8 PCA——什麼是主成分60
2.3.9 PCA——通過本徵嚮量和本徵值求主成分60
2.3.10 PCA——通過主成分分析降維61
2.3.11 PCA——歸一化和相關性係數63
2.3.12 PCA——什麼樣的數據適閤PCA64
2.3.13 其他降維手段65
2.4 捲積66
2.4.1 點積和捲積66
2.4.2 一維捲積67
2.4.3 捲積和互相關68
2.4.4 二維捲積和圖像響應69
2.4.5 捲積的計算70
2.5 數學優化基礎71
2.5.1 *小值和梯度下降72
2.5.2 衝量(Momentum)73
2.5.3 牛頓法75
2.5.4 學習率和自適應步長77
2.5.5 學習率衰減(Learning Rate Decay)78
2.5.6 AdaGrad:每個變量有自己的節奏78
2.5.7 AdaDelta的進一步改進79
2.5.8 其他自適應算法80
2.5.9 損失函數81
2.5.10 分類問題和負對數似然82
2.5.11 邏輯迴歸83
2.5.12 Softmax:將輸齣轉換為概率84
2.5.13 鏈式求導法則84
第3章 神經網絡和機器學習基礎87
3.1 感知機87
3.1.1 基本概念87
3.1.2 感知機和綫性二分類87
3.1.3 激活函數88
3.2 神經網絡基礎89
3.2.1 從感知機到神經網絡89
3.2.2 *簡單的神經網絡二分類例子90
3.2.3 隱層神經元數量的作用93
3.2.4 更加復雜的樣本和更復雜的神經網絡94
3.3 後嚮傳播算法95
3.3.1 求神經網絡參數的梯度95
3.3.2 計算圖(Computational Graph)95
3.3.3 利用後嚮傳播算法計算一個神經網絡參數的梯度97
3.3.4 梯度消失99
3.3.5 修正綫性單元(ReLU)100
3.3.6 梯度爆炸101
3.3.7 梯度檢查(gradient check)102
3.3.8 從信息傳播的角度看後嚮傳播算法103
3.4 隨機梯度下降和批量梯度下降104
3.4.1 全量數據(full-batch)梯度下降104
3.4.2 隨機梯度下降(SGD)和小批量數據(mini-batch)104
3.4.3 數據均衡和數據增加(data augmentation)106
3.5 數據、訓練策略和規範化108
3.5.1 欠擬閤和過擬閤108
3.5.2 訓練誤差和測試誤差109
3.5.3 奧卡姆剃刀沒有**午餐111
3.5.4 數據集劃分和提前停止112
3.5.5 病態問題和約束113
3.5.6 L2規範化(L2 Regularization)113
3.5.7 L1規範化(L1 Regularization)114
3.5.8 集成(Ensemble)和隨機失活(Dropout)115
3.6 監督學習、非監督學習、半監督學習和強化學習117
3.6.1 監督學習、非監督學習和半監督學習117
3.6.2 強化學習(reinforcement learning)118
第4章 深度捲積神經網絡120
4.1 捲積神經網絡120
4.1.1 基本概念120
4.1.2 捲積層和特徵響應圖121
4.1.3 參數共享123
4.1.4 稀疏連接124
4.1.5 多通道捲積125
4.1.6 激活函數125
4.1.7 池化、不變性和感受野126
4.1.8 分布式錶徵(Distributed Representation)128
4.1.9 分布式錶徵和局部泛化130
4.1.10 分層錶達131
4.1.11 捲積神經網絡結構131
4.2 LeNet——1個捲積神經網絡132
4.3 新起點——AlexNet133
4.3.1 網絡結構133
4.3.2 局部響應歸一化(Local Response Normalization,LRN)136
4.4 更深的網絡——GoogLeNet136
4.4.1 1×1捲積和Network In Network136
4.4.2 Inception結構138
4.4.3 網絡結構138
4.4.4 批規一化(Batch Normalization,BN)140
4.5 更深的網絡——ResNet142
4.5.1 睏難的深層網絡訓練:退化問題142
4.5.2 殘差單元142
4.5.3 深度殘差網絡144
4.5.4 從集成的角度看待ResNet144
4.5.5 結構更復雜的網絡146
第2篇 實例精講
第5章 Python基礎148
5.1 Python簡介148
5.1.1 Python簡史148
5.1.2 安裝和使用Python149
5.2 Python基本語法150
5.2.1 基本數據類型和運算150
5.2.2 容器153
5.2.3 分支和循環156
5.2.4 函數、生成器和類159
5.2.5 map、reduce和filter162
5.2.6 列錶生成(list comprehension)163
5.2.7 字符串163
5.2.8 文件操作和pickle164
5.2.9 異常165
5.2.10 多進程(multiprocessing)165
5.2.11 os模塊166
5.3 Python的科學計算包——NumPy167
5.3.1 基本類型(array)167
5.3.2 綫性代數模塊(linalg)172
5.3.3 隨機模塊(random)173
5.4 Python的可視化包——matplotlib175
5.4.1 2D圖錶175
5.4.2 3D圖錶178
5.4.3 圖像顯示180
第6章 OpenCV基礎182
6.1 OpenCV簡介182
6.1.1 OpenCV的結構182
6.1.2 安裝和使用OpenCV183
6.2 Python-OpenCV基礎184
6.2.1 圖像的錶示184
6.2.2 基本圖像處理185
6.2.3 圖像的仿射變換188
6.2.4 基本繪圖190
6.2.5 視頻功能192
6.3 用OpenCV實現數據增加小工具193
6.3.1 隨機裁剪194
6.3.2 隨機鏇轉194
6.3.3 隨機顔色和明暗196
6.3.4 多進程調用加速處理196
6.3.5 代碼:圖片數據增加小工具196
6.4 用OpenCV實現物體標注小工具203
6.4.1 窗口循環203
6.4.2 鼠標和鍵盤事件205
6.4.3 代碼:物體檢測標注的小工具206
第7章 Hello World! 212
7.1 用MXNet實現一個神經網絡212
7.1.1 基礎工具、NVIDIA驅動和CUDA安裝212
7.1.2 安裝MXNet213
7.1.3 MXNet基本使用214
7.1.4 用MXNet實現一個兩層神經網絡215
7.2 用Caffe實現一個神經網絡219
7.2.1 安裝Caffe219
7.2.2 Caffe的基本概念220
7.2.3 用Caffe實現一個兩層神經網絡221
第8章 *簡單的圖片分類——手寫數字識彆227
8.1 準備數據——MNIST227
8.1.1 下載MNIST227
8.1.2 生成MNIST的圖片227
8.2 基於Caffe的實現228
8.2.1 製作LMDB數據229
8.2.2 訓練LeNet-5230
8.2.3 測試和評估235
8.2.4 識彆手寫數字239
8.2.5 增加平移和鏇轉擾動240
8.3 基於MXNet的實現242
8.3.1 製作Image Recordio數據242
8.3.2 用Module模塊訓練LeNet-5243
8.3.3 測試和評估245
8.3.4 識彆手寫數字247
第9章 利用Caffe做迴歸249
9.1 迴歸的原理249
9.1.1 預測值和標簽值的歐式距離249
9.1.2 EuclideanLoss層250
9.2 預測隨機噪聲的頻率250
9.2.1 生成樣本:隨機噪聲250
9.2.2 製作多標簽HDF5數據252
9.2.3 網絡結構和Solver定義253
9.2.4 訓練網絡259
9.2.5 批量裝載圖片並利用GPU預測260
9.2.6 捲積核可視化262
第10章 遷移學習和模型微調264
10.1 吃貨**——通過Python采集美食圖片264
10.1.1 通過關鍵詞和圖片搜索引擎下載圖片264
10.1.2 數據預處理——去除無效和不相關圖片267
10.1.3 數據預處理——去除重復圖片267
10.1.4 生成訓練數據269
10.2 美食分類模型271
10.2.1 遷移學習271
10.2.2 模型微調法(Finetune)272
10.2.3 混淆矩陣(Confusion Matrix)276
10.2.4 P-R麯綫和ROC麯綫278
10.2.5 全局平均池化和激活響應圖284
第11章 目標檢測288
11.1 目標檢測算法簡介288
11.1.1 滑窗法288
11.1.2 PASCAL VOC、mAP和IOU簡介289
11.1.3 Selective Search和R-CNN簡介290
11.1.4 SPP、ROI Pooling和Fast R-CNN簡介291
11.1.5 RPN和Faster R-CNN簡介293
11.1.6 YOLO和SSD簡介294
11.2 基於PASCAL VOC數據集訓練SSD模型296
11.2.1 MXNet的SSD實現296
11.2.2 下載PASCAL VOC數據集297
11.2.3 訓練SSD模型298
11.2.4 測試和評估模型效果299
11.2.5 物體檢測結果可視化299
11.2.6 製作自己的標注數據302
第12章 度量學習304
12.1 距離和度量學習304
12.1.1 歐氏距離和馬氏距離304
12.1.2 歐式距離和餘弦距離305
12.1.3 非綫性度量學習和Siamese網絡306
12.1.4 Contrastive Loss:對比損失函數307
12.2 用MNIST訓練Siamese網絡307
12.2.1 數據準備307
12.2.2 參數共享訓練309
12.2.3 結果和可視化314
12.2.4 用τ-SNE可視化高維特徵316
第13章 圖像風格遷移317
13.1 風格遷移算法簡介317
13.1.1 通過梯度下降法進行圖像重建317
13.1.2 圖像風格重建和Gram矩陣318
13.1.3 圖像風格遷移320
13.2 MXNet中的圖像風格遷移例子320
13.2.1 MXNet的風格遷移實現321
13.2.2 對圖片進行風格遷移326

深度學習輕鬆學:核心算法與視覺實踐

  《深度學習輕鬆學:核心算法與視覺實踐》介紹瞭深度學習基本算法和視覺領域的應用實例。書中以輕鬆直白的語言,生動詳細地介紹瞭深層模型相關的基礎知識,並深入剖析瞭算法的原理與本質。同時,書中還配有大量案例與源碼,幫助讀者切實體會深度學習的核心思想和精妙之處。除此之外,書中還介紹瞭深度學習在視覺領域的應用,從原理層麵揭示其思路思想,幫助讀者在此領域中夯實技術基礎。
  《深度學習輕鬆學:核心算法與視覺實踐》十分適閤對深度學習感興趣,希望對深層模型有較深入瞭解的讀者閱讀。
1 機器學習與深度學習的概念1 
1.1 什麼是機器學習 1 
1.1.1 機器學習的形式. 2 
1.1.2 機器學習的幾個組成部分. 8 
1.2 深度學習的逆襲 9 
1.3 深層模型在視覺領域的應用. 13 
1.4 本書的主要內容 15 
1.5 總結. 17 
2 數學與機器學習基礎18 
2.1 綫性代數基礎. 18 
2.2 對稱矩陣的性質 22 
2.2.1 特徵值與特徵嚮量 22 
2.2.2 對稱矩陣的特徵值和特徵嚮量 23 
2.2.3 對稱矩陣的對角化 24 
2.3 概率論. 25 
2.3.1 概率與分布. 25 
2.3.2 *大似然估計 28 
2.4 信息論基礎 31 
2.5 KL 散度. 33 
2.6 凸函數及其性質 37 
2.7 機器學習基本概念. 39 
2.8 機器學習的目標函數 42 
2.9 總結. 44 
3 CNN 的基石:全連接層45 
3.1 綫性部分. 45 
3.2 非綫性部分 48 
3.3 神經網絡的模樣 50 
3.4 反嚮傳播法 55 
3.4.1 反嚮傳播法的計算方法. 55 
3.4.2 反嚮傳播法在計算上的抽象. 58 
3.4.3 反嚮傳播法在批量數據上的推廣. 59 
3.4.4 具體的例子. 63 
3.5 參數初始化 65 
3.6 總結. 68 
4 CNN 的基石:捲積層69 
4.1 捲積操作. 69 
4.1.1 捲積是什麼. 69 
4.1.2 捲積層效果展示. 73 
4.1.3 捲積層匯總瞭什麼 76 
4.1.4 捲積的另一種解釋 77 
4.2 捲積層的反嚮傳播. 79 
4.2.1 實力派解法. 80 
4.2.2 “偶像派”解法. 84 
4.3 ReLU 88 
4.3.1 梯度消失問題 89 
4.3.2 ReLU 的理論支撐. 92 
4.3.3 ReLU 的綫性性質. 93 
4.3.4 ReLU 的不足. 93 
4.4 總結. 94 
4.5 參考文獻. 94 
5 Caffe 入門95 
5.1 使用Caffe 進行深度學習訓練. 96 
5.1.1 數據預處理. 96 
5.1.2 網絡結構與模型訓練的配置. 100 
5.1.3 訓練與再訓練 108 
5.1.4 訓練日誌分析 110 
5.1.5 預測檢驗與分析. 112 
5.1.6 性能測試 115 
5.2 模型配置文件介紹. 117 
5.3 Caffe 的整體結構. 122 
5.3.1 SyncedMemory 124 
5.3.2 Blob 125 
5.3.3 Layer 125 
5.3.4 Net 126 
5.3.5 Solver 126 
5.3.6 多GPU 訓練. 127 
5.3.7 IO 127 
5.4 Caffe 的Layer 128 
5.4.1 Layer 的創建——LayerRegistry 128 
5.4.2 Layer 的初始化. 130 
5.4.3 Layer 的前嚮計算. 132 
5.5 Caffe 的Net 組裝流程 133 
5.6 Caffe 的Solver 計算流程. 139 
5.6.1 優化流程 140 
5.6.2 多卡優化算法 142 
5.7 Caffe 的Data Layer 145 
5.7.1 Datum 結構. 145 
5.7.2 DataReader Thread 147 
5.7.3 BasePrefetchingDataLayer Thread 148 
5.7.4 Data Layer 149 
5.8 Caffe 的Data Transformer 150 
5.8.1 C++ 中的Data Transformer 150 
5.8.2 Python 中的Data Transformer 153 
5.9 模型層擴展實踐——Center Loss Layer 156 
5.9.1 Center Loss 的原理 156 
5.9.2 Center Loss 實現. 160 
5.9.3 實驗分析與總結. 164 
5.10 總結. 165 
5.11 參考文獻. 165 
6 深層網絡的數值問題166 
6.1 ReLU 和參數初始化. 166 
6.1.1 1個ReLU 數值實驗. 167 
6.1.2 第二個ReLU 數值實驗. 169 
6.1.3 第三個實驗——Sigmoid 171 
6.2 Xavier 初始化. 172 
6.3 MSRA 初始化. 178 
6.3.1 前嚮推導 178 
6.3.2 後嚮推導 181 
6.4 ZCA 182 
6.5 與數值溢齣的戰鬥. 186 
6.5.1 Softmax Layer 186 
6.5.2 Sigmoid Cross Entropy Loss 189 
6.6 總結. 192 
6.7 參考文獻. 192 
7 網絡結構193 
7.1 關於網絡結構,我們更關心什麼 193 
7.2 網絡結構的演化 195 
7.2.1 VGG:模型哲學. 195 
7.2.2 GoogLeNet:豐富模型層的內部結構. 196 
7.2.3 ResNet:從乘法模型到加法模型. 197 
7.2.4 全連接層的沒落. 198 
7.3 Batch Normalization 199 
7.3.1 Normalization 199 
7.3.2 使用BN 層的實驗. 200 
7.3.3 BN 的實現. 201 
7.4 對Dropout 的思考. 204 
7.5 從遷移學習的角度觀察網絡功能 206 
7.6 ResNet 的深入分析. 210 
7.6.1 DSN 解決梯度消失問題 211 
7.6.2 ResNet 網絡的展開結構. 212 
7.6.3 FractalNet 214 
7.6.4 DenseNet 215 
7.7 總結. 217 
7.8 參考文獻. 217 
8 優化與訓練219 
8.1 梯度下降是一門手藝活兒. 219 
8.1.1 什麼是梯度下降法 219 
8.1.2 優雅的步長. 220 
8.2 路遙知馬力:動量. 225 
8.3 SGD 的變種算法 232 
8.3.1 非凸函數 232 
8.3.2 **算法的彎道錶現. 233 
8.3.3 Adagrad 234 
8.3.4 Rmsprop 235 
8.3.5 AdaDelta 236 
8.3.6 Adam 237 
8.3.7 爬坡賽. 240 
8.3.8 總結. 242 
8.4 L1 正則的效果. 243 
8.4.1 MNIST 的L1 正則實驗. 244 
8.4.2 次梯度下降法 246 
8.5 尋找模型的弱點 251 
8.5.1 泛化性實驗. 252 
8.5.2 **性實驗. 255 
8.6 模型優化路徑的可視化. 255 
8.7 模型的過擬閤. 260 
8.7.1 過擬閤方案. 261 
8.7.2 SGD 與過擬閤 263 
8.7.3 對於深層模型泛化的猜想. 264 
8.8 總結. 265 
8.9 參考文獻. 265 
9 應用:圖像的語意分割267 
9.1 FCN 268 
9.2 CRF 通俗非嚴謹的入門. 272 
9.2.1 有嚮圖與無嚮圖模型. 272 
9.2.2 Log-Linear Model 278 
9.2.3 條件隨機場. 280 
9.3 Dense CRF 281 
9.3.1 Dense CRF 是如何被演化齣來的. 281 
9.3.2 Dense CRF 的公式形式. 284 
9.4 Mean Field 對Dense CRF 模型的化簡 285 
9.5 Dense CRF 的推斷計算公式 288 
9.5.1 Variational Inference 推導 289 
9.5.2 進一步化簡. 291 
9.6 完整的模型:CRF as RNN 292 
9.7 總結. 294 
9.8 參考文獻. 294 
10 應用:圖像生成295 
10.1 VAE 295 
10.1.1 生成式模型. 295 
10.1.2 Variational Lower bound 296 
10.1.3 Reparameterization Trick 298 
10.1.4 Encoder 和Decoder 的計算公式. 299 
10.1.5 實現. 300 
10.1.6 MNIST 生成模型可視化 301 
10.2 GAN 303 
10.2.1 GAN 的概念. 303 
10.2.2 GAN 的訓練分析. 305 
10.2.3 GAN 實戰. 309 
10.3 Info-GAN 314 
10.3.1 互信息. 315 
10.3.2 InfoGAN 模型 317 
10.4 Wasserstein GAN 320 
10.4.1 分布的重疊度 321 
10.4.2 兩種目標函數存在的問題. 323 
10.4.3 Wasserstein 距離. 325 
10.4.4 Wasserstein 距離的優勢. 329 
10.4.5 Wasserstein GAN 的實現 331 
10.5 總結. 333 
10.6 參考文獻. 334

用戶評價

評分

評分

評分

評分

評分

評分

評分

評分

評分

相關圖書

本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.qciss.net All Rights Reserved. 圖書大百科 版權所有