试题详情

36.下面哪一项是符合强化学习的过程?

AA.在时间间隔上建立模型关系

BB.错了就惩罚,对了就奖励

CC.建立各个神经元之间的关系

DD.选择性遗忘之前的信息