Bibliography (6):

Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context
https://research.facebook.com/publications/llama-open-and-efficient-foundation-language-models/
LLaMa-1: Open and Efficient Foundation Language Models
https://openai.com/index/gpt-4-research/
Wikipedia Bibliography:
1. Transformer (deep learning architecture)
2. https://en.wikipedia.org/wiki/Natural_language_processing :
  
  https://en.wikipedia.org/wiki/Natural_language_processing