AA.从环境中获取目标的观测信息
BB.提供当前环境下的状态信息
CC.基于预期回报奖惩动作的价值
DD.以上都不是
38.下面哪一项是属于强化学习过程中的步骤?
37.下面哪一项是属于强化学习过程中的步骤?
36.下面哪一项是符合强化学习的过程?
39.下面哪一项是强化学习的算法?
下面哪些是变压吸附循环过程中的基本步骤( )。
首页
每日一练
打赏一下
浏览记录