diff --git a/4.人工智能/4.6.9.3基本概念介绍.md b/4.人工智能/4.6.9.3基本概念介绍.md new file mode 100644 index 0000000..f03baae --- /dev/null +++ b/4.人工智能/4.6.9.3基本概念介绍.md @@ -0,0 +1,8 @@ +# 基本概念介绍 +前面已经介绍过,强化学习难入坑的的原因之一就在于概念繁多。下面将进行基本概念的介绍,本章节最好能够理解,不理解也没有关系,但是建议作为参考章节常看常新。后续章节不理解某个概念时,便回来看看,相信一定能够做到常看常新、从而加深你对于概念的理解。下面将进行三个部分的介绍,分别为强化学习的基本过程、强化学习的基本要素、强化学习的目标。 + + +## 强化学习的基本过程 +前面已经介绍过强化学习的核心过程,在于智能体与环境进行交互,通过给出的奖励反馈作为信号学习的过程。简单地用图片表示如下: +![](static/4.6.9.3.1.png) +正是在这个与环境的交互过程中,智能体不断得到反馈,目标就是尽可能地让环境反馈的奖励足够大。 \ No newline at end of file diff --git a/4.人工智能/static/4.6.9.3.1.png b/4.人工智能/static/4.6.9.3.1.png new file mode 100644 index 0000000..5eac3ec Binary files /dev/null and b/4.人工智能/static/4.6.9.3.1.png differ