Das Lieferunternehmen für Essen hat gerade ein LLM im Frontier-Scale‑Bereich veröffentlicht. LongCat-2.0 ist ein Mixture-of-Experts‑Modell mit insgesamt 1,6 Billionen Parametern, ~48B aktiv pro Token und einem 1M‑Token‑Kontextfenster. Der gesamte Pre‑Training‑Durchlauf — 35T+ tokens — fand auf über 50,000+ domestic AI ASICs in superpod clusters statt. NVIDIA war nicht im Gebäude.
Was es eigentlich ist
Dies ist ein Open‑Weight‑Modell, das für Agenten und nicht für Chat gebaut wurde. Die tiefgreifenden Optimierungen zielen auf mehrstufige Aufgabenplanung, Tool‑Aufrufe und produktionsreife Code‑Generierung — Meituan wirbt damit für “complex task planning and enterprise automation.” Unter der Haube: sparse attention, N-gram embeddings, zero-computation experts und post-training specialist groups für Coding und Agent‑Workflows.
Warum es wichtig ist
Die Gewichte sind auf Hugging Face herunterladbar, sodass Sie es selbst ausführen oder in einen Agent‑Stack einbinden können — keine Rate‑Limits, kein Vendor‑Lock‑In. Aber die eigentliche Schlagzeile ist geopolitisch: Ein chinesisches Unternehmen hat ein offenes Modell mit Billionen‑Parametern vollständig auf heimischem Silizium trainiert, unter Exportkontrollen und ohne größere Trainings‑Rollbacks. Das ist das Proof‑of‑Concept, auf das alle gewartet haben. Der Kontext hat sich verdoppelt, die Skalierung hat sich verdoppelt und die Chip‑Abhängigkeit ist auf null gesunken.