feat:4.6.9.3
初步增加4.6.9.3及其内容
This commit is contained in:
8
4.人工智能/4.6.9.3基本概念介绍.md
Normal file
8
4.人工智能/4.6.9.3基本概念介绍.md
Normal file
@@ -0,0 +1,8 @@
|
||||
# 基本概念介绍
|
||||
前面已经介绍过,强化学习难入坑的的原因之一就在于概念繁多。下面将进行基本概念的介绍,本章节最好能够理解,不理解也没有关系,但是建议作为参考章节常看常新。后续章节不理解某个概念时,便回来看看,相信一定能够做到常看常新、从而加深你对于概念的理解。下面将进行三个部分的介绍,分别为强化学习的基本过程、强化学习的基本要素、强化学习的目标。
|
||||
|
||||
|
||||
## 强化学习的基本过程
|
||||
前面已经介绍过强化学习的核心过程,在于智能体与环境进行交互,通过给出的奖励反馈作为信号学习的过程。简单地用图片表示如下:
|
||||

|
||||
正是在这个与环境的交互过程中,智能体不断得到反馈,目标就是尽可能地让环境反馈的奖励足够大。
|
||||
Reference in New Issue
Block a user