Stärken auf einen Blick:

  • Vollständig quelloffen: Download, Feinabstimmung und Deployment ohne Einschränkungen
  • Llama 4 Maverick: 400 Mrd. Parameter (128 Experten-MoE), nativ multimodal (Text + Bild)
  • Llama 4 Scout: 10-Mio-Token-Kontextfenster – das größte aller offen verfügbaren Modelle
  • Über 1,2 Mrd. Downloads und 85.000+ Derivate auf Hugging Face
  • Deployment 3,5x günstiger als proprietäre Systeme wie GPT-4
  • 200 Sprachen unterstützt, davon 100+ mit über 1 Mrd. Trainingstoken
  • Llama Stack für standardisierte Enterprise-Deployments
  • Llama Guard 4, LlamaFirewall und Prompt Guard 2 als Sicherheits-Tools
  • Verfügbar über Ollama, vLLM, AWS, Google Cloud, NVIDIA NIM und 25+ Partner

Zusammenfassung: Meta Llama ist das Gravitationszentrum der Open-Source-KI-Welt. Mit über 1,2 Milliarden Downloads hat Llama die Art verändert, wie Unternehmen über KI-Infrastruktur denken: Statt pro Token an einen API-Anbieter zu zahlen, können Organisationen Llama auf eigener Hardware betreiben und nur für Strom und Rechenleistung aufkommen.

Llama 4 bringt erstmals Mixture-of-Experts-Architektur in die Open-Source-Welt. Maverick mit 128 Experten liefert starke Ergebnisse bei Coding, Reasoning und multilingualen Aufgaben und übertrifft laut Meta GPT-4o in allen getesteten Bereichen. Scout beeindruckt mit einem 10-Mio-Token-Kontextfenster, das ganze Codebasen, Buchsammlungen oder massive Konversationshistorien in einem Durchgang verarbeiten kann.

Für Unternehmen ist die Kombination aus offenen Gewichten, null Per-Token-Kosten beim Self-Hosting und dem riesigen Community-Ökosystem von Feinabstimmungen und Derivaten das Hauptargument. Llama Stack standardisiert Enterprise-Deployments, und Sicherheitstools wie Llama Guard 4 und LlamaFirewall bieten produktionsreife Absicherung. Meta entwickelt aktuell auch proprietäre Frontier-Modelle (Codename Avocado und Mango), plant aber weiterhin, davon Open-Source-Versionen abzuleiten.

Ideal geeignet für: Self-Hosting mit voller Datenkontrolle, Feinabstimmung auf eigene Domänen-Daten, kostenoptimierte Deployments, multilinguale Anwendungen, Unternehmen die Vendor-Lock-in vermeiden wollen, und die Open-Source-Forschungsgemeinschaft.

...weiter lesen
kostenlosllamamultimodalenterprisekontextfensterdatenschutzopen sourcemoemixture-of-expertsself-hostingollamametafeinabstimmungvllmmultilingualhugging facecommunityawsnvidiaforschung
49