Bibliography (7):

MuZero: Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model
https://mujoco.org/
Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor
Wikipedia Bibliography: