Bibliography (34):

Dream to Control: Learning Behaviors by Latent Imagination
DreamerV2: Mastering Atari with Discrete World Models
https://danijar.com/project/dreamerv3/
https://x.com/danijarh/status/1613161946223677441
https://minecraft.fandom.com/wiki/Diamond
The MineRL 2019 Competition on Sample Efficient Reinforcement Learning using Human Priors
The MineRL 2020 Competition on Sample Efficient Reinforcement Learning using Human Priors
Maximum a Posteriori Policy Optimization
Deep DPG (DDPG): Continuous control with deep reinforcement learning
DP4G: Distributed Distributional Deterministic Policy Gradients
Model-Based Reinforcement Learning for Atari
SPR: Data-Efficient Reinforcement Learning with Self-Predictive Representations
IRIS: Transformers are Sample-Efficient World Models
Playing Atari with Deep Reinforcement Learning
Muesli: Combining Improvements in Policy Optimization
Deep Exploration via Bootstrapped DQN
Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor
https://arxiv.org/abs/2107.09645
Rainbow: Combining Improvements in Deep Reinforcement Learning
Proximal Policy Optimization Algorithms
Learning to Generalize with Object-centric Agents in the Open World Survival Game Crafter
Improving Variational Inference with Inverse Autoregressive Flow
https://arxiv.org/pdf/2301.04104.pdf#page=19&org=deepmind
https://arxiv.org/pdf/2301.04104#page=18&org=deepmind
https://arxiv.org/pdf/2301.04104#page=22&org=deepmind
2023-hafner-figure1-dreamerv3outperformsbaselinesinsampleefficiencyonmanytasks.png
Video PreTraining (VPT): Learning to Act by Watching Unlabeled Online Videos
https://arxiv.org/pdf/2301.04104#page=23&org=deepmind
Wikipedia Bibliography:
1. Reinforcement learning
2. Minecraft
3. CURL
4. Kullback-Leibler divergence
5. Entropy (information theory)
6. Volta (microarchitecture) § Products :
  
  https://en.wikipedia.org/wiki/Volta_(microarchitecture)#Products