Google DeepMind schlägt mit Veo 3, dem neuen KI-Videogenerierungsmodell, hart zu. Das Versprechen ist ehrgeizig: hochwertige Videos mit nativem, synchronisiertem Ton zu generieren — Dialoge, Soundeffekte und Musik werden gleichzeitig mit dem Bild erzeugt. Wir konnten es vorab über Google AI Studio testen und die Ergebnisse sind verblüffend.

Die große Innovation: native Audio-Generierung

Diese Funktion hebt Veo 3 von allen Konkurrenten ab. Während Runway, Sora und Kling stumme Videos generieren, die anschließend manuell vertont werden müssen, produziert Veo 3 schon bei der Generierung eine vollständige, synchronisierte Tonspur. Die Soundeffekte sind kontextuell: das Geräusch von Schritten auf Kies, der Wind in den Bäumen, das Zuschlagen einer Tür — alles wird automatisch und stimmig zur Szene erzeugt. Dialoge sind noch verbesserungsfähig, aber die musikalische Führung und die Atmosphären überzeugen erstaunlich treffsicher.

Videoqualität: auf höchstem Niveau

Bei der reinen visuellen Qualität liegt Veo 3 direkt hinter Sora 2 und auf Augenhöhe mit Runway Gen-3 Alpha. Die Kameraführungen sind beherrscht – Zooms, Travellings, Luftaufnahmen – mit einem cineastischen Verständnis auf hohem Niveau. Die Auflösung erreicht im Gemini-Ultra-Plan 4K. Die zeitliche Konsistenz ist bei 30-Sekunden-Sequenzen solide, auch wenn man bei längeren Videos einige Artefakte beobachtet. Menschliche Figuren sind realistisch, aber bei Gesichtsausdrücken etwas hinter Sora 2.

Im Vergleich zu Runway und Sora: Wo steht Veo 3?

Runway Gen-3 Alpha bleibt mit über 30 integrierten Tools beim kreativen Ökosystem überlegen. Sora 2 behält den Vorteil bei reinem Realismus und physikalischer Konsistenz. Aber Veo 3 ist das einzige Modell mit nativem Audio – das bedeutet eine erhebliche Zeitersparnis in der Postproduktion. Für einen Creator, der Werbung oder Social-Media-Content produziert, ist der Verzicht auf separates Sounddesign ein gewichtiges Argument. Auch die native Integration mit YouTube Shorts und dem Google-Ökosystem ist ein Plus für Creator, die bereits dort aktiv sind.

Preis und Verfügbarkeit

Veo 3 ist über Google AI Studio zugänglich. Der Gemini-Advanced-Plan ab 19 €/Monat gewährt Zugriff auf Veo 2 in 1080p mit begrenzten Funktionen. Für den Zugang zu Veo 3 mit nativem Audio und 4K benötigt man den Gemini-Ultra-Plan ab 249 €/Monat – ein Premium-Preis, der ihn über Sora Pro (200 €/Monat) ansiedelt. Der Zugang bleibt vorerst begrenzt und einige Funktionen werden schrittweise ausgerollt. Google hat noch keinen Zwischenplan angekündigt, was für unabhängige Creator ein Hemmnis ist.

Unser Verdikt

Veo 3 ist dank des nativen Audios ein wichtiger Fortschritt. Es ist das erste Modell, das den Text-Prompt wirklich in eine vollständige audiovisuelle Erfahrung verwandelt. Die Videoqualität ist exzellent, die YouTube-Integration relevant, und die Leistungsfähigkeit der Google-Infrastruktur sorgt für vernünftige Generierungszeiten. Die Grenzen: ein hoher Preis (249 €/Monat für vollen Zugriff), ein weniger reichhaltiges Tool-Ökosystem als Runway und ein noch begrenzter Zugang.

Fazit

Veo 3 setzt sich als innovativstes Tool dieses Jahresanfangs 2026 durch. Wenn natives Audio für deinen Workflow entscheidend ist – Werbung, Social-Media-Content, Kurzfilme – ist es trotz Premium-Preis ernsthaft zu erwägen. Für Creator ohne Bedarf an integriertem Ton bieten Runway (ab 12 €/Monat) und Kling AI (ab 8 €/Monat) ein besseres Preis-Leistungs-Verhältnis bei reinem Video. Wir behalten die nächsten Preisaktualisierungen von Google im Auge – sie könnten Veo 3 zugänglicher machen.

Partager :