|
速習強化学習
Csaba Szepesvári 著 ; 小山田創哲 訳者代表・編集 ; 前田新一, 小山雅典 監訳
[目次]
- 第1章 マルコフ決定過程
- 第2章 価値推定問題
- 第3章 制御
- 第4章 さらなる勉強のために
- 付録A 割引マルコフ決定過程の理論
- 付録B TD(λ)法の前方観測的な見方と後方観測的な見方について
- 付録C 深層強化学習を含む最近の発展
「BOOKデータベース」より
|
書名 |
速習強化学習 |
著作者等 |
Szepesvári, Csaba
前田 新一
小山 雅典
小山田 創哲
Szepesv'ari Csaba
サパシバリ チョバ
|
書名ヨミ |
ソクシュウ キョウカ ガクシュウ : キソ リロン ト アルゴリズム |
書名別名 |
Algorithms for Reinforcement Learning
基礎理論とアルゴリズム |
出版元 |
共立 |
刊行年月 |
2017.9 |
ページ数 |
132p |
大きさ |
24cm |
ISBN |
978-4-320-12422-6
|
NCID |
BB24466396
※クリックでCiNii Booksを表示
|
全国書誌番号
|
22957152
※クリックで国立国会図書館サーチを表示
|
言語 |
日本語 |
原文言語 |
英語 |
出版国 |
日本 |
この本を:
|
件が連想されています
|