Megalodon: Efficient LLM Pretraining and Inference with Unlimited Context Length

Devs

Megalodon: Efficient LLM Pretraining and Inference with Unlimited Context Length | Read Paper on Bytez