LLaMA-MoE

https://github.com/pjlab-sys4nlp/llama-moe

AI & ML interests

None defined yet.

Recent Activity

Xiaoye08 submitted a paper 1 day ago

VA-π: Variational Policy Alignment for Pixel-Aware Autoregressive Generation

huxy912 authored a paper 3 months ago

Reasoning over Boundaries: Enhancing Specification Alignment via Test-time Delibration

tongjingqi authored a paper 6 months ago

Code2Logic: Game-Code-Driven Data Synthesis for Enhancing VLMs General Reasoning

View all activity

llama-moe 's models 8

llama-moe/LLaMA-MoE-v2-3_8B-residual-sft

8B • Updated Dec 3, 2024 • 10 • 2

llama-moe/LLaMA-MoE-v2-3_8B-2_8-sft

8B • Updated Dec 3, 2024 • 16 • 3

llama-moe/LLaMA-MoE-v1-3_0B-2_16

Text Generation • Updated Jun 25, 2024 • 46 • 11

llama-moe/LLaMA-MoE-v1-3_5B-4_16

Text Generation • Updated Jun 25, 2024 • 116 • 16

llama-moe/LLaMA-MoE-v1-3_0B-2_16-sft

Text Generation • 7B • Updated Jun 25, 2024 • 9 • 2

llama-moe/LLaMA-MoE-v1-3_5B-2_8-sft

Text Generation • 7B • Updated Jun 25, 2024 • 12 • 3

llama-moe/LLaMA-MoE-v1-3_5B-4_16-sft

Text Generation • 7B • Updated Jun 25, 2024 • 11 • 1

llama-moe/LLaMA-MoE-v1-3_5B-2_8

Text Generation • Updated Jun 25, 2024 • 400 • 15