Apple AFM 3 führt ein 20B‑Modell auf Ihrem iPhone aus — und stellt es Entwicklern zur Verfügung.

27. Juni 2026, 12:13

Auf der WWDC 2026 hat Apple AFM 3 vorgestellt, seine dritte Generation von Foundation Models: fünf Modelle, die auf Gerät und Cloud verteilt sind. Die Headline ist AFM 3 Core Advanced, ein 20-Milliarden-Parameter-Sparse-Modell, das tatsächlich auf einem iPhone läuft.

Der Flash-Memory-Trick

Ein 20B-Modell passt nicht in den RAM eines Handys, also versucht Apple es nicht. Das vollständige Modell lebt im Flash (NAND), und ein leichter Router wählt pro Prompt einen festen Satz von Experten aus – dabei werden jeweils nur 1–4B Parameter aktiviert. Apple nennt das Instruction-Following Pruning. Ergebnis: Qualität auf 20B-Klassen-Niveau auf Hardware, die nur ein paar Milliarden aktive Gewichte im Speicher halten kann. Nebenbei gibt es das 3B AFM 3 Core, das serverseitige AFM 3 Cloud, ein Bildmodell und AFM 3 Cloud Pro, Apples leistungsstärkstes Modell – erweitert auf NVIDIA-GPUs in Google Cloud, während die Datenschutzgarantien von Private Cloud Compute erhalten bleiben.

Was Entwickler tatsächlich erhalten

Über das Foundation Models-Framework rufst du AFM 3 direkt in deiner App auf – on-device oder Cloud, je nach Wahl. Ideal für agentenbasierte Werkzeugnutzung, on-device Diktat, Zusammenfassungen und strukturierte Generierung ohne API‑Schlüssel und ohne Abrechnung pro Token. Dieser letzte Aspekt ist die eigentliche Veränderung.