Mistral hat am 23. Juni OCR 4 veröffentlicht, ein Open-Weights-Modell für Dokumenten‑Verständnis, das mehr kann, als PDFs in Text zu verwandeln. Es liefert Begrenzungsrahmen (wo jeder Block sitzt), Blockklassifizierung (Titel, Tabelle, Gleichung, Unterschrift) und Inline‑Vertrauenswerte pro Seite und pro Wort. Wenn das Modell also bei einer Zeile in einer gescannten Rechnung unsicher ist, sagt es das — anstatt stillschweigend eine Zahl in Ihre Pipeline zu halluzinieren.
Dieses Vertrauenssignal ist der eigentliche Kern. Dokument‑OCR ist die Eingangstür für Agenten, die Unternehmensdaten lesen, und stille Fehler dort vergiften alles nachgelagerte.
Warum es wichtig ist
Die Zahlen belegen das: Unabhängige Annotatoren bevorzugten OCR 4 gegenüber allen getesteten führenden OCR‑Systemen, mit einer durchschnittlichen Gewinnrate von 72 % und dem besten Ergebnis im OlmOCRBench (85,20). Es unterstützt 170 Sprachen, verarbeitet PDF, DOC, PPT und OpenDocument und ist kompakt genug, um in einem einzigen Container selbst gehostet zu werden — sodass sensible Dokumente innerhalb Ihrer eigenen Infrastruktur bleiben.
API und Anwendungsfälle
Es wird über die Mistral API zu 4 $ pro 1.000 Seiten angeboten, bei Nutzung des Batch‑Rabattes halbiert auf 2 $. Selbst‑Hosting ist für Unternehmenskunden verfügbar. Der typische Anwendungsfall: Unordentliche Rechnungen, Verträge und Formulare in eine RAG‑ oder Agent‑Pipeline einspeisen und strukturierte, zitiervorbereitete, positions‑bewusste Ausgaben erhalten. In Kombination mit dem am selben Tag gestarteten Mistral Connectors‑Launch wird die letzte Meile des Agenten‑Workflows nun gefüllt.