Alibaba’s Qwen 3.6 27B erzielt 77,2 Punkte im SWE‑bench — und läuft auf einer einzigen Consumer‑GPU

29. Juni 2026

Ein 480-Punkte-HN-Thread mit dem Titel Qwen 3.6 27B „der Sweet Spot für lokale Entwicklung“. Das ist kein Hype — es ist das erste Mal in diesem Jahr, dass ein Open-Weight‑lokales Modell wirklich gut genug wirkte.

Was es eigentlich ist

Qwen 3.6 27B ist ein dichtes, Open-Weight‑Coding‑Modell des Qwen‑Teams von Alibaba, Apache 2.0, veröffentlicht am 22. April. Dichte ist hier wichtig: alle 27 B Parameter werden bei jedem Durchlauf verwendet, kein MoE‑Routing. Es erzielt 77.2 auf SWE-bench Verified — in Reichweite von Claude 4.5 Opus’s 80.9, und übertrifft leicht Alibabas eigenes 397 B MoE beim agentischen Coding. 256K Kontext, 201 Sprachen.

Der eigentliche Trick ist die Größe. 27 B liegt genau dort, wo die Leistungsfähigkeit auf eine einzelne High-End‑Karte trifft — Nutzer berichten von ~50 tok/s auf einer RTX 5090, ~30 auf einem M5 Mac. Kein Cloud, keine Token‑Rechnung, dein Code verlässt nie die Maschine.

Ausführen

Lade die Gewichte von Hugging Face oder ModelScope herunter und stelle sie lokal über llama.cpp oder LM Studio bereit, oder nutze die Qwen API, wenn du nicht selbst hosten möchtest. Typische Anwendungsfälle: repo‑level agentisches Coding, Autovervollständigung, Frontend‑Arbeit — das, wofür du normalerweise Claude oder GPT bezahlen würdest, jetzt offline und kostenlos.