Now, remember, the goal of an agent in a reinforcement learning problem is to learn how to interact with it environment to maximize an expected reward.
现在,请记住,强化学习问题中代理的目标是学习如何与其环境交互以最大化预期奖励。
网站首页 情感咨询 情感美文 情感百科 情感生活 学习充电 旧版美文
依恋情感网英汉例句词典收录3870147条英语例句词条,基本涵盖了全部常用英语单词的释义及例句,是英语学习的有利工具。