強化学習編 斎藤 康毅 オライリー・ジャパンゼロカラツクルディープラーニングフォー サイトウ コウキ
発行年月:2022年04月06日
予約締切日:2021年11月05日
ページ数:384p
サイズ:単行本
ISBN:9784873119755 斎藤康毅(サイトウコウキ) 1984年長崎県対馬生まれ。
東京工業大学工学部卒、東京大学大学院学際情報学府修士課程修了。
現在、企業にて人工知能に関する研究開発に従事(本データはこの書籍が刊行された当時に掲載されていたものです) 1章 バンディット問題/2章 マルコフ決定過程/3章 ベルマン方程式/4章 動的計画法/5章 モンテカルロ法/6章 TD法/7章 ニューラルネットワークとQ学習/8章 DQN/9章 方策勾配法/10章 さらに先へ/付録 人気シリーズの第4弾。
今回のテーマは強化学習です。
実際のコードを提示し動かしながら学ぶという本シリーズのスタイルを踏襲し、外部ライブラリに頼らず、強化学習を支える基本的な技術やアイデアをゼロから実装しながら学びます。
本書では読者が強化学習独特の理論を確実にマスターできるように、強化学習という難解なテーマの構成要素の一つひとつを「理論」と「実践」の双方から丁寧に解説します。
数式だけで説明する理論書とは異なり、読者はコードを通してハッとする気づきを数多く得られるでしょう。
本 パソコン・システム開発 プログラミング その他 パソコン・システム開発 その他
0.0 (0件)