LLM

비교

Model Training Tokens Vocab Size Context Length GPU Hours Release Date
LLaMA 1 7B, 13B, 33B, 70B 1T, 1.4T 32K 2K 7B - 82,432 2023년 2월
LLaMA 2 7B, 13B, 70B 2T 32K1 4K 7B - 184,320 2023년 8월
42dot LLM 1.3B 2T 50304 4K 1.3B - 49,152 2023년 9월
Mistral 7B 8T 32K 8K Around 200K 2023년 9월
Gemma 2B, 7B 2T, 6T 256K 8K   2024년 2월
LLaMA 3 8B, 70B 15T 128K 8K 1.3M 2024년 4월
Qwen2 0.5B, 1.5B, 7B, 72B   152K 131K   2024년 6월
Gemma 2 9B, 27B 8T, 13T 256K 8K   2024년 6월
Mistral NeMo 12B   128K 128K   2024년 7월

NVIDIA Jetson LLM 성능

Last Modified: 2024/07/21 22:27:00

is a collection of Papers I have written.
© 2000 - Sang Park Except where otherwise noted, content on this site is licensed under a CC BY 4.0.
This site design was brought from Distill.