Summary Introduction Chapter1 Introduction 1.1 增强学习 1.2 例子 1.3 增强学习基础 1.4 限制与使用领域 1.5 扩展实例:井字棋 1.6 本章总结 1.7 增强学习的早期历史 Part I: 表格解决方法 Chapter2 多臂老虎机 2.1 多臂老虎机问题 2.2 行动-价值方法 2.3 10臂测试案例 2.4 增量法实现 2.5 解决非固定情况 2.6 乐观初始化价值 2.7 置信上界法 2.8 梯度老虎机算法 2.9 相关性搜索(具有上下文的老虎机) 2.10 本章总结