Google veröffentlicht Nano Banana 2 Lite, Bildgenerierung in nur 4 Sekunden
2026-07-01 13:48
Merken

de.wedoany.com-Bericht: Google hat kürzlich zwei neue Modelle für Entwickler vorgestellt: Gemini Omni Flash und Nano Banana 2 Lite. Ersteres kombiniert multimodales Denken tiefgehend mit Videogenerierung und -bearbeitung, während Letzteres auf schnelle Bildgenerierung spezialisiert ist.

Das Gemini Omni Flash-Modell wurde bereits auf der Google I/O 2026 vorgestellt. Seine Kernfähigkeit besteht darin, das multimodale Denken von Gemini in den Videoerstellungs- und Bearbeitungsprozess zu integrieren. Das Modell ist jetzt über die Gemini API und Google AI Studio verfügbar. Zu seinen vier Schlüsselfunktionen gehören: dialogbasierte Videobearbeitung, bei der Benutzer Videos mit natürlicher Sprache verfeinern können; multimodale Referenzen, die Bild-, Text- und Videoeingaben kombinieren, um die Szenenkonsistenz zu wahren; die Nutzung von Geminis Wissen in Bereichen wie Geschichte, Biologie und Erzähllogik zur Videokonstruktion; sowie die Synchronisation von Text und Videobewegungen durch einfache Aufforderungen. Preislich liegt Omni Flash bei 0,10 US-Dollar pro Sekunde Videoausgabe, gleichauf mit Veo 3.1 Fast.

Google listet gleichzeitig die derzeitigen Einschränkungen des Modells auf: Es unterstützt derzeit nur die Generierung von 10-Sekunden-Videos, keine Audio-Referenz-Uploads oder Szenenerweiterungen, die API unterstützt Videos mit einer Länge von bis zu 3 Sekunden als Referenzmaterial, aber das Modell kann diese Eingaben noch nicht korrekt verarbeiten, und die Personen-Konsistenz bei Szenenwechseln und Kamerabewegungen ist noch begrenzt.

Das andere Modell, Nano Banana 2 Lite, trägt den Namen gemini-3.1-flash-lite-image und ist für latenzempfindliche Szenarien optimiert. Sein Hauptverkaufsargument ist eine Bildgenerierungslatenz von etwa 4 Sekunden, ein Fünftel der von Nano Banana 2; die Kosten für die Generierung eines 1K-Auflösungsbildes betragen etwa 0,034 US-Dollar, die Hälfte von Nano Banana 2 und ein Viertel von Nano Banana Pro. In Bezug auf Textwiedergabe und Benchmark-Tests liegt Nano Banana 2 Lite auf dem gleichen Niveau wie Modelle wie Grok und eignet sich für die Massengenerierung von E-Commerce-Materialien, die iterative Erstellung von Werbekreativen und ähnliche Szenarien.

Google demonstrierte einen Workflow, der die beiden Modelle in Reihe schaltet: Zuerst wird mit Nano Banana 2 Lite schnell ein Bild erstellt, dann wird das generierte Bild als Referenzmaterial in Gemini Omni Flash eingespeist, um es in ein Video umzuwandeln. Zu diesem Zweck hat Google drei Demo-Anwendungen entwickelt: Anywhere, das Selfies oder hochgeladene Fotos in Wahrzeichen-Szenen einfügt und dynamische Kurzfilme erstellt; Space Lift, das nach dem Hochladen von Raumfotos verschiedene Einrichtungsoptionen generiert und in Raum-Rundgang-Videos umwandeln kann; und Omni Product Studio, das für E-Commerce-Produkte szenische Bilder und kurze Werbevideos erstellt.

Referenzlink: https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/

Diese Kurznachricht stammt aus der Übersetzung und Weiterverbreitung von Informationen aus dem globalen Internet und von strategischen Partnern. Sie dient lediglich dem Austausch mit den Lesern. Bei Urheberrechtsverletzungen oder anderen Problemen bitten wir um rechtzeitige Mitteilung, und wir werden die notwendigen Änderungen oder Löschungen vornehmen. Die Weitergabe dieses Artikels ist ausdrücklich ohne formelle Genehmigung verboten.E-Mail: news@wedoany.com