de.wedoany.com-Bericht: Google hat kürzlich zwei neue Modelle für Entwickler vorgestellt: Gemini Omni Flash und Nano Banana 2 Lite. Ersteres kombiniert multimodales Denken tiefgehend mit Videogenerierung und -bearbeitung, während Letzteres auf schnelle Bildgenerierung spezialisiert ist.
Das Gemini Omni Flash-Modell wurde bereits auf der Google I/O 2026 vorgestellt. Seine Kernfähigkeit besteht darin, das multimodale Denken von Gemini in den Videoerstellungs- und Bearbeitungsprozess zu integrieren. Das Modell ist jetzt über die Gemini API und Google AI Studio verfügbar. Zu seinen vier Schlüsselfunktionen gehören: dialogbasierte Videobearbeitung, bei der Benutzer Videos mit natürlicher Sprache verfeinern können; multimodale Referenzen, die Bild-, Text- und Videoeingaben kombinieren, um die Szenenkonsistenz zu wahren; die Nutzung von Geminis Wissen in Bereichen wie Geschichte, Biologie und Erzähllogik zur Videokonstruktion; sowie die Synchronisation von Text und Videobewegungen durch einfache Aufforderungen. Preislich liegt Omni Flash bei 0,10 US-Dollar pro Sekunde Videoausgabe, gleichauf mit Veo 3.1 Fast.
Google listet gleichzeitig die derzeitigen Einschränkungen des Modells auf: Es unterstützt derzeit nur die Generierung von 10-Sekunden-Videos, keine Audio-Referenz-Uploads oder Szenenerweiterungen, die API unterstützt Videos mit einer Länge von bis zu 3 Sekunden als Referenzmaterial, aber das Modell kann diese Eingaben noch nicht korrekt verarbeiten, und die Personen-Konsistenz bei Szenenwechseln und Kamerabewegungen ist noch begrenzt.
Das andere Modell, Nano Banana 2 Lite, trägt den Namen gemini-3.1-flash-lite-image und ist für latenzempfindliche Szenarien optimiert. Sein Hauptverkaufsargument ist eine Bildgenerierungslatenz von etwa 4 Sekunden, ein Fünftel der von Nano Banana 2; die Kosten für die Generierung eines 1K-Auflösungsbildes betragen etwa 0,034 US-Dollar, die Hälfte von Nano Banana 2 und ein Viertel von Nano Banana Pro. In Bezug auf Textwiedergabe und Benchmark-Tests liegt Nano Banana 2 Lite auf dem gleichen Niveau wie Modelle wie Grok und eignet sich für die Massengenerierung von E-Commerce-Materialien, die iterative Erstellung von Werbekreativen und ähnliche Szenarien.

Google demonstrierte einen Workflow, der die beiden Modelle in Reihe schaltet: Zuerst wird mit Nano Banana 2 Lite schnell ein Bild erstellt, dann wird das generierte Bild als Referenzmaterial in Gemini Omni Flash eingespeist, um es in ein Video umzuwandeln. Zu diesem Zweck hat Google drei Demo-Anwendungen entwickelt: Anywhere, das Selfies oder hochgeladene Fotos in Wahrzeichen-Szenen einfügt und dynamische Kurzfilme erstellt; Space Lift, das nach dem Hochladen von Raumfotos verschiedene Einrichtungsoptionen generiert und in Raum-Rundgang-Videos umwandeln kann; und Omni Product Studio, das für E-Commerce-Produkte szenische Bilder und kurze Werbevideos erstellt.

Referenzlink: https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/









