StartseiteNewsGoogle stellt Gemini Omni vor – KI-Modell für Video-Generierung
Markt19. Mai 2026

Google stellt Gemini Omni vor – KI-Modell für Video-Generierung

Google hat auf der I/O 2026 Gemini Omni präsentiert, ein multimodales KI-Modell, das Video und andere Medien aus nahezu beliebigen Eingaben generieren kann. Das System kombiniert Googles Gemini-Intelligenz mit seinen Medien-Generierungstools wie Veo und Nano Banana.

Gemini Omni wurde von DeepMind-Chef Demis Hassabis als "Modell, das alles aus jedem Input erstellen kann" vorgestellt. Das System vereint die Intelligenz von Gemini mit den generativen Mediensystemen des Unternehmens und soll ein neues Level an Weltverstehen und Multimodalität erreichen. Google bezeichnet Omni als einen Schritt in Richtung Artificial General Intelligence (AGI) und beschreibt es als "World Model AI", das die Welt verstehen und simulieren kann.

Die erste Version, Gemini Omni Flash, startet zunächst über Flow – Googles KI-Filmmaking-Plattform – und Flow Music für KI-gestützte Musikerstellung. Bei einer Demonstration zeigte das Unternehmen, wie Omni ein Erklär-Video im Stop-Motion-Stil zur Proteinentfaltung generiert. Nutzer können Videos durch natürlichsprachliche Befehle bearbeiten, neue visuelle Elemente hinzufügen und die Umgebung verändern.

Das System soll Charaktere, Hintergründe und Bewegungen konsistent halten – eine Herausforderung, bei der viele KI-Video-Modelle bisher scheiterten. Das Modell nutzt Geminis Reasoning-Fähigkeiten, um komplexere Anweisungen zu verstehen, sodass Nutzer nur das gewünschte Endergebnis beschreiben müssen, ohne jedes Detail zu erklären. Diese Entwicklung baut auf dem Erfolg von Nano Banana auf, das Gemini zeitweise vor ChatGPT in Apples App Store platzierte.

Krypto-News per Newsletter
Jede Woche die wichtigsten Nachrichten kompakt in dein Postfach.

Weitere Markt-News