- 博客(1)
- 收藏
- 关注
原创 Grid2op reward相关知识
Grid2op reward相关知识 reward大致包含了6个函数 1、__init__函数一般是声明参数, 2、initialize函数,初始化参数,尤其是reward_min和reward_max, 3、__call__函数是为了计算奖赏值,其中包含了电网动作中的不同情况, has_error表示电网中的错误动作或者未完成的动作, is_done表示完成的动作, is_illegal,非法的动作,触发grid2op.Exceptions.IllegalAction,在这种情况下,被do nothing
2020-09-03 10:28:25 460
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人