Google hat Google Gemini Omni Flash am 30. Juni veröffentlicht – die günstige, schnelle Stufe seiner Omni‑Familie, die für genau ein Ziel gebaut wurde: Video erstellen, indem man mit ihm spricht. Beschreibe eine Szene in einfachem Englisch und erhalte einen Clip. Dann sprich weiter, um ihn zu bearbeiten: „Verdunkle den Himmel“, „Füge einen Hund hinzu“, „Mach es langsamer“. Keine Zeitleiste, keine Keyframes, keine Bearbeitungs‑App. Das Modell behandelt ein Gespräch als Bearbeitungshistorie.
Was es eigentlich ist
Ein produktionsreifes Text‑/Bild‑/Video‑zu‑Video‑Modell, das konversationelle Bearbeitung ermöglicht. Es erzeugt Clips von bis zu 10 Sekunden in 720p, und jede Ausgabe enthält ein unsichtbares SynthID‑Wasserzeichen. Es ist jetzt live in der Gemini‑App, Google Flow und kostenlos auf YouTube Shorts und Create.
Der API‑Ansatz
Bei 0,10 $ pro Sekunde kostet ein zehnsekündiger Clip etwa einen Dollar – ein Zehner‑mal günstiger als das Flaggschiff‑Omni und entspricht Veo 3.1 Fast. Die Entwickler‑ und Unternehmens‑API wird in den kommenden Wochen geöffnet. Der offensichtliche Anwendungsfall: Werbe‑Varianten, Produkt‑Demos und Short‑Form‑Social in großem Umfang, bei dem man durch Prompt iteriert statt eine Zeitleiste neu zu rendern.
Warum das wichtig ist: Google wettet darauf, dass „Chat der Editor ist“ skaliert, und hat diese Wette gerade günstig genug gemacht, um sie zu testen.