Google enthüllt VideoPoet

Last Updated: Januar 2, 2024By Tags:

Im Jahr 2023 führte Google zwei neue Sprachmodelle ein: PaLM 2 und Gemini. Diese Modelle unterstrichen die Konzentration des Unternehmens auf multimodale KI-Fähigkeiten, die in der Lage sind, Text, Bilder, Audio und Videos zu generieren. Dies war eine signifikante Abkehr von traditionellen Sprachmodellen, wie zum Beispiel OpenAIs GPT-4, das in ChatGPT verwendet wird, und das sich hauptsächlich auf Text konzentrierte.

Googles VideoPoet: Über traditionelle Modelle hinaus

Googles neueste Innovation, VideoPoet, stellt einen Sprung über traditionelle Modelle hinaus dar. Im Gegensatz zu seinen Vorgängern wandelt VideoPoet Textbefehle in KI-generierte Videos um. Es handelt sich um ein experimentelles, großes Sprachmodell, das speziell für die Videogenerierung und das Bearbeiten bestehender Videoinhalte entwickelt wurde. VideoPoet markiert Googles ersten Schritt in Richtung KI-getriebener Videogenerierung.

VideoPoets einzigartiger Ansatz: Jenseits von Diffusionsmodellen

VideoPoet unterscheidet sich von konventionellen Text-zu-Bild- und Text-zu-Video-Generatoren, da es kein Diffusionsmodell verwendet. Stattdessen basiert es auf einem großen Sprachmodell, das neben Text auch Video- und Audiodaten vorhersagen kann. Es wurde speziell vortrainiert, um Bilder, Videoframes und Audiodaten in Tokens zu übersetzen. Diese Fähigkeit ermöglicht es VideoPoet, bestehende Videos zu bearbeiten, deren Stil zu ändern und längere Videos mit mehr Bewegung als Konkurrenzmodelle zu erzeugen.

Googles Strategie: Kein Produkt oder Veröffentlichungsdatum für VideoPoet bisher

Bis jetzt hat Google weder ein Produkt noch ein Veröffentlichungsdatum für VideoPoet angekündigt. Die Preisstrategie könnte dem Weg anderer KI-Bildgeneratoren wie Midjourney folgen, die nur über ein Abonnement verfügbar sind. Angesichts der rechenintensiven Anforderungen für die Erstellung von KI-generierten Bildern und Videos könnte eine breite Zugänglichkeit schwierig sein. Die Branche beobachtet nun, ob Entwicklungen wie OpenAIs ChatGPT Google zu weiteren Schritten in diesem Bereich veranlassen werden.

news via inbox

Nulla turp dis cursus. Integer liberos  euismod pretium faucibua