Ornith-1.0 (DeepReinforce Self-Scaffolding Coding Models): offene Gewichte, die ihr eigenes RL‑Gerüst schreiben, 397B erreicht 82,4 bei SWE-bench

DeepReinforce hat gerade Ornith-1.0 als Open Source veröffentlicht, eine Familie von agentischen Codierungsmodellen, die von einem 9B Dense für Edge‑Boxen bis zu einem 397B MoE reichen. Auf Gemma 4 und Qwen 3.5 aufgebaut, MIT‑lizenziert, alle Gewichte bereits auf Hugging Face. Es landete schnell auf der Titelseite von HN.

Das Modell, das sein eigenes Gerüst baut

Alle anderen schreiben das Gerüst, das ein Codierungsmodell umschließt, von Hand – Tool‑Schleifen, Prompts, die gesamte Infrastruktur. Ornith behandelt dieses Gerüst als etwas, das man lernen kann. In jedem RL‑Schritt schreibt das Modell zuerst ein aufgabenspezifisches Gerüst und generiert dann die Lösung darauf. Das Modell lehrt sich selbst, wie man die Aufgabe einrichtet, bevor man sie ausführt.

Zahlen belegen das: 397B erreicht 82,4 bei SWE‑Bench Verified, praktisch auf dem Niveau von Claude Opus 4.7 und liegt vor MiniMax M3 und DeepSeek‑V4‑Pro. Das kleine 9B erzielt immer noch 69,4 bei SWE‑Bench und 43,1 bei Terminal‑Bench 2.1.

Selbst ausführen

Keine API zum Anmelden – hol dir deepreinforce-ai/Ornith-1.0-9B (oder das 397B) von Hugging Face und setze es lokal ein. Das 9B ist klein genug, um einen selbst‑gerüstenden Agenten auf deiner eigenen GPU laufen zu lassen.

Ornith-1.0 (DeepReinforce Self-Scaffolding Coding Models): offene Gewichte, die ihr eigenes RL‑Gerüst schreiben, 397B erreicht 82,4 bei SWE-bench

Das Modell, das sein eigenes Gerüst baut

Selbst ausführen

Ornith-1.0 (DeepReinforce Self-Scaffolding Coding Models): offene Gewichte, die ihr eigenes RL‑Gerüst schreiben, 397B erreicht 82,4 bei SWE-bench