reinforcement-learning
DQN с RNN в TorchRL: батчи без утечек между эпизодами
Nov. 1, 15:46
Почему DQN в Pong встает: ошибка каналов Conv2d в PyTorch
Oct. 31, 06:17
CTDE в RLlib: как заменить PrioritizedEpisodeReplayBuffer
Oct. 31, 05:16
ConditionalCategorical в pomegranate: как избежать TypeError
Oct. 22, 15:01