ИИ, созданный для игры в прятки, научился прятать «искателей», чтобы не прятаться самому
55 показов
13K13K открытий

Вот тут неплохо написано про в том числе и проблемы неожиданно буквальных способов максимизировать награду https://www.alexirpan.com/2018/02/14/rl-hard.html

Ответить