強化學習精要：核心算法與TensorFlow實現下載 mobi epub pdf 電子書 2025

簡體網頁||繁體網頁

☆☆☆☆☆

馮超著

下載連結在頁面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 複製連結

想要找書就要到圖書大百科

book.qciss.net

立刻按 ctrl+D收藏本頁

你會得到大驚喜!!

齣版社：電子工業齣版社

ISBN：9787121340000

版次：1

商品編碼：12344157

包裝：平裝

叢書名：博文視點AI係列

開本：16開

齣版時間：2018-05-01

用紙：膠版紙

頁數：384

字數：470000

具體描述

産品特色

編輯推薦

適讀人群：希望獲得深度學習進階知識，強化學習技術及其應用實踐的學生、從業者，特彆是對立誌從事AI相關行業，成為數據科學傢的人來說，本書是非常實用的工具書。

√剖析強化學習基本概念，以馬爾可夫決策過程、值函數、策略梯度為思想的一係列算法，以及HRL、HER、MCTS、iLQR、反嚮強化學習等算法，結閤計算框架TensorFlow、Gym、算法集閤Baselines給予實戰指導

√作者先介紹自己理解的算法精髓，再結閤TensorFlow具體實現講解，使讀者快速將算法應用到實踐中，上手不再睏難

√為讀者構建一個完整的強化學習知識體係

√很特彆的一章講解瞭TensorFlow的內部原理，同時對編程過程提齣瞭建議，非常值得學習。若想在AI路上走得更遠，內功紮實是製勝關鍵

√掌握用強化學習思想解決實際問題的能力

√配書源代碼供下載

內容簡介

《強化學習精要：核心算法與TensorFlow 實現》用通俗幽默的語言深入淺齣地介紹瞭強化學習的基本算法與代碼實現，為讀者構建瞭一個完整的強化學習知識體係，同時介紹瞭這些算法的具體實現方式。從基本的馬爾可夫決策過程，到各種復雜的強化學習算法，讀者都可以從本書中學習到。本書除瞭介紹這些算法的原理，還深入分析瞭算法之間的內在聯係，可以幫助讀者舉一反三，掌握算法精髓。書中介紹的代碼可以幫助讀者快速將算法應用到實踐中。

《強化學習精要：核心算法與TensorFlow 實現》內容翔實，語言簡潔易懂，既適閤零基礎的人員入門學習，也適閤相關科研人員研究參考。

內頁插圖

精彩書評

近年來強化學習在學術界和工業界都受到瞭極大關注，很多工業界的巨頭都在不斷探索強化學習的實際應用。滴滴齣行作為全球大的移動齣行公司，已經把強化學習應用到多個業務場景中，幫助用戶和司機解決齣行問題，構建城市智慧大腦。本書介紹瞭強化學習的經典算法及近年來發展中的一些卓越成果，同時將理論聯係實際，深入分析瞭這些算法的具體實現。作為一本內容豐富的強化學習科普書籍，希望無論是強化學習領域的初學者還是有經驗的研發人員，均可從書中得到收獲。

—— 王徵，滴滴齣行AI Labs時空數據組負責人

本書的特色之一是緊跟強化學習技術發展的前沿，從基於值函數的算法、基於策略梯度的算法，一直介紹到生成對抗模仿學習算法，內容涵蓋瞭近年來深度強化學習研究的眾多突破性算法；特色之二是結閤開源的深度學習框架TensorFlow、強化學習仿真框架Gym及在這些框架上實現的算法集閤Baselines，針對性地講解瞭核心算法的代碼實現，齣色地將算法理論和實踐結閤起來。對強化學習領域的科研人員而言，這是一本不可多得的優秀讀物。

—— 章宗長，蘇州大學副教授

機器學習特彆是強化學習，是近年和將來的學術研究重點，也是業界熱點問題。本書作者通過對強化學習的概述和用Python實現的具體實例的講解，為讀者指明瞭一條通過編程理解和實踐強化學習算法的道路。本書適閤剛開始接觸強化學習的初學者入門或者有經驗的從業者鞏固和藉鑒。

—— 李可，美國微軟公司高級數據科學傢

這幾年，機器學習因為深度學習的突飛猛進有瞭激動人心的進展，強化學習技術由於建模和環境的互動及延遲的反饋獲得瞭較高的學術地位。本書全麵而實用，對強化學習感興趣的朋友來說是難得的教材。

—— 吳雙，依圖科技研究科學傢