feat:4.6.9.3

初步增加4.6.9.3及其内容
This commit is contained in:
Xinlei_Zhou
2023-04-26 00:18:49 +08:00
parent 05d9972b87
commit 020d4854ea
2 changed files with 8 additions and 0 deletions

View File

@@ -0,0 +1,8 @@
# 基本概念介绍
前面已经介绍过,强化学习难入坑的的原因之一就在于概念繁多。下面将进行基本概念的介绍,本章节最好能够理解,不理解也没有关系,但是建议作为参考章节常看常新。后续章节不理解某个概念时,便回来看看,相信一定能够做到常看常新、从而加深你对于概念的理解。下面将进行三个部分的介绍,分别为强化学习的基本过程、强化学习的基本要素、强化学习的目标。
## 强化学习的基本过程
前面已经介绍过强化学习的核心过程,在于智能体与环境进行交互,通过给出的奖励反馈作为信号学习的过程。简单地用图片表示如下:
![](static/4.6.9.3.1.png)
正是在这个与环境的交互过程中,智能体不断得到反馈,目标就是尽可能地让环境反馈的奖励足够大。

Binary file not shown.

After

Width:  |  Height:  |  Size: 21 KiB