本日読了。
最強囲碁AI アルファ碁 解体新書 増補改訂版 アルファ碁ゼロ対応 深層学習、モンテカルロ木探索、強化学習から見たその仕組み (AI & TECHNOLOGY)
- 作者: 大槻知史,三宅陽一郎
- 出版社/メーカー: 翔泳社
- 発売日: 2018/07/17
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
良書。アルファ碁論文を題材に、機械学習の様々な手法を解説。
ロジスティック回帰、ロールアウトポリシー、シグモイド関数、ツリーポリシー、誤差逆伝搬法、MNIST、ReLU、勾配消失問題、損失関数、勾配降下法、確率的勾配降下法(SGD)、残差ネットワーク、ソフトマックス関数、プーリング、バッチ正規化、ドロップアウト、解釈困難性の問題、バリューネットワーク、クロスエントロピー関数、自動微分、動的計画法、Q学習、方策勾配法、関数近似法、DQN、深層強化学習、UCB1アルゴリズム、リグレット、行動価値関数、ε-グリーディ法、エピソード経過数、方策関数、REINFORCEアルゴリズム、ゲーム木、ミニマックス木、アルファベータ法、枝刈り、深さ延長、モンテカルロ法、プレイアウト、プログレッシブワイドニング、非同期方策価値更新モンテカルロ木探索(APV-MCTS)、ロックレスハッシュ、バーチャルロス、デュアルネットワーク、最良優先探索、セルフプレイ、正則化