Nvidia GTC: Edify kann Text-zu-3D und den Marken-Style ins Finetuning nehmen

Nvidia und Shutterstock sowie Adobe bieten KI-Bildgeneratoren für 3D an, Getty Images lässt Edify mit der Markenoptik feintunen.

In Pocket speichern vorlesen Druckansicht 1 Kommentar lesen
Nvidias Beispielbild für 3D-Welten.

Ein Beispiel aus Nvidias Blogbeitrag zeigt, wie eine 3D-Welt aussehen kann, die ein KI-Model generiert hat.

(Bild: Nvidia)

Lesezeit: 3 Min.

Auf der diesjährigen Entwicklerkonferenz GTC hat Nvidia auch Neuigkeiten im Bereich Software vorgestellt, konkret geht es um Kooperationen im Bereich der visuellen generativen KI. Der Chip-Hersteller arbeitet mit Shutterstock, Getty Images, Adobe und weiteren zusammen, die dann das Nvidia-eigene KI-Modell Edify anbieten.

Zunächst gibt es einen Early-Access zu Shutterstocks 3D-Generator via API. Damit sollen Entwickler und Creatoren virtuelle Szenen in 3D per Text-Prompt erstellen können. So ließe sich beispielsweise ein Filmset, eine Theaterbühne oder Ähnliches blitzschnell erdenken. Das Tool ist entsprechend für den professionellen Einsatz entwickelt worden und kein spaßiger Bildgenerator, wie etwa das kostenlose Midjourney. Eine weitere Kooperation gehen Nvidia, Shutterstock und HP ein – die 3D-Modelle lassen sich mit den HP-3D-Druckern erstellen. Die nötigen Zwischenschritte sollen automatisiert werden.

Die Preise für den Zugang zu Shutterstocks 3D-Generator sind noch nicht bekannt. Shutterstocks Bildgenerator ist ausschließlich auf lizenziertem Material trainiert worden. Gleiches gilt für Adobes Firefly. Auch dieser Bildgenerator soll künftig 3D-Modelle erstellen können.

Auch Getty Images arbeitet mit Nvidia und nutzt Edify. Nachdem bereits im Januar die APIs für sogenanntes Inpainting und Outpainting angekündigt wurde, sind sie ab sofort verfügbar. Damit gemeint ist, dass man generierte Bilder weiter bearbeiten kann, in dem Objekte hinzugefügt oder herausgenommen werden. Geplant ist beispielsweise auch eine Sketch-Funktion, bei der man mittels einer Skizze die KI anleiten kann, etwas zu generieren. Die Bildbearbeitung generierter Bilder ist bei den gängigen kostenlosen Tools nicht vorgesehen.

Zudem gibt es ab Mai die Möglichkeit für Unternehmen oder Organisationen, ein vortrainiertes KI-Modell im Sinne der eigenen Brand und des visuellen Stils mittels Finetunings weiter anzupassen. Dazu muss man im Grunde lediglich einige eigene Bilder hochladen. Getty Images hat den eigens angebotenen Bildgenerator ebenfalls ausschließlich mit eigenem Bildmaterial trainiert und bietet damit laut eigener Aussage Sicherheit für die kommerzielle Nutzung. Zugleich gibt es eine Klage von Getty gegen Anbieter von Bildgeneratoren, die offensichtlich mit urheberrechtlich geschütztem Material von Getty trainiert wurden.

Nvidia hat auch bekannt gegeben, dass Be.Live, eine Live-Streamingplattform auf Nvidias Picasso setzt – das ist der Rahmen, in dem Nvidia Basismodelle für Kunden erstellt. Bei Be.Live sollen in Echtzeit Bilder generiert werden, um ein interaktives Erlebnis zu schaffen. Cuebrick ist eine KI-Plattform, die mithilfe von Picasso immersive virtuelle Umgebungen schafft, schreibt Nvidia im Blogbeitrag.

Auf der GTC hat Nvidia vor allem die neue Beschleunigerarchitektur Blackwell vorgestellt. Mit der neuen Blackwell-Architektur und weiter reduzierten Datenformaten wie 4-Bit-Floating-Point sowie neuen Funktionen stehen vor allem die Energieeffizienz und der Datenaustausch zwischen den einzelnen Chips im Fokus.

(emw)