Google Gemini 3.5 Pro (GA) ist Googles neue Frontier‑LLM, erreichbar über die Gemini‑API und Vertex AI. Es löst ein Problem besser als alles, was heute verfügbar ist: eine absurde Menge an Kontext in einem einzigen Aufruf unterzubringen.
Die 2M‑Zahl ist die ganze Geschichte
Zwei Millionen Eingabe‑Token. Das Doppelte dessen, was Gemini 3.5 Flash verarbeiten kann, und das größte Fenster aller aktuellen Frontier‑Modelle. Das entspricht einer kompletten Code‑Base, einem Jahr Support‑Tickets oder einer gesamten Vertragsbibliothek, die in einen Prompt eingefügt wird – kein Chunking, keine Retrieval‑Hacks. Die andere Schlagzeile ist Deep Think, ein mehrstufiger Denkmodus für schwierige Mathematik, Naturwissenschaften und Programmierung. Aber er ist hinter Googles Ultra‑Abonnement gesperrt, das bei etwa 100 $/Monat beginnt, sodass die meisten Menschen ihn nicht nutzen können.
Was man damit bauen kann
Es ist API‑interaktiv: Man kann es über die Gemini‑API oder Vertex AI ansprechen, riesige Kontexte einspeisen und es über das Ganze nachdenken lassen. Die erwartete Preisgestaltung liegt bei etwa 15 $/Mio. Token Eingabe und 60 $/Mio. Token Ausgabe – etwa 10‑fach teurer als Flash, also ist dies für Aufgaben, bei denen der Kontext die Kosten überwiegt.
Warum der Lärm? Es wurde von Juni auf Juli verschoben, gerade als DeepMind Talente verliert. Google brauchte einen Erfolg. Das Fenster liefert; der Preis nicht.