Sogar der CEO von Nvidia ist von Googles KI-Tool NotebookLM besessen


Luma AI behauptet, dass sein Photon-Bildgenerator schneller ist als jedes vergleichbare Modell, das derzeit erhältlich ist.

Die Liste generativer KI-Bildmodelle wächst ständig.

Am Montag veröffentlichte das KI-Unternehmen Luma Photon, sein neues Text-zu-Bild-Modell. Das Modell richtet sich an Designer und Kreative und basiert auf dem Videogenerator Dream Machine von Luma, mit dem Benutzer kurze Videoclips aus von ihnen hochgeladenen Bildern erstellen können.

Wie Dream Machine ist Photon für alle konzipiert und richtet sich an diejenigen, die „die Welt um uns herum gestalten, von Designern, Filmemachern, visuellen Denkern bis hin zu kleinen Unternehmen und Pädagogen“, heißt es in der Pressemitteilung. Dazu gehören Anwendungsfälle für alles von Mode bis Architektur. 

Photon bietet Multibildausgabe und scharfe Textwiedergabe und basiert auf der maßgeschneiderten Universal Transformer-Architektur von Luma, die es laut Angaben des Unternehmens „800 % schneller und günstiger als andere vergleichbare Modelle“ macht. Wie bei ähnlichen Generatoren können Benutzer ihre Eingabeaufforderungen im Laufe der Zeit optimieren und die resultierenden Bilder bearbeiten und anpassen. 

Luma kündigte außerdem eine Photon-API an, die möglicherweise noch vor Ende 2024 veröffentlicht wird. Mit der skalierbaren API können Entwickler Text-zu-Bild- und Bild-zu-Bild-Inhalte erstellen.

„Die wahre Magie von Luma AI besteht darin, die einzigartige kreative DNA jedes Schöpfers zu beherbergen – seine Referenzen, seinen Stil, seine Geschichte –, während Dream Machine mit der kreativen Reise jedes Benutzers lernt und sich weiterentwickelt“, sagt Anjney Midha, General Partner bei a16z und Vorstandsmitglied von Luma AI, sagte in der Pressemitteilung. 

Luma möchte, dass Benutzer Dream Machine und Photon als echte kreative Kollaborateure betrachten, die die einzigartigen Kontexte und Bedürfnisse der Benutzer verstehen können. Eine Funktion ermöglicht es Benutzern, ein Foto einer Person hochzuladen und einen wiederverwendbaren „Charakter“ von ihr zu erstellen, den Photon in mehreren Einzelbildszenarien darstellen kann – ein ideales Werkzeug für Brainstorming-Kampagnen. Benutzer können das Konterfei der Person hochladen und „@character“ in ihre Eingabeaufforderung einfügen, um die Funktion zu aktivieren. 

Während einer Demo für ZDNET schien Photon jedoch Probleme mit der Darstellung natürlich aussehender Ausdrücke für Charaktere in bestimmten Positionen zu haben, was sofort Bedenken hinsichtlich Deepfakes und anderen potenziellen Missbrauchsfällen hervorruft. 

Die Nutzungsrichtlinien von Luma enthalten einen Hinweis zur Inhaltsmoderation, der darauf hinweist, dass das Unternehmen bestimmte generierte Bilder entfernen wird.  

Luma gibt insbesondere an, dass die Eingabe- und Ausgabedaten von Photon nicht zum Trainieren der Modelle des Unternehmens verwendet werden. Auf die Frage nach Lumas Trainingsdatensatz während der Demo sagte CEO Amit Jain, er könne nicht preisgeben, was darin enthalten sei und ob er Material aus dem Internet oder lizenzierte Inhalte enthalte. 

Im Hinblick auf Urheberrechtsbedenken sind die Richtlinien etwas vager. Das Unternehmen fordert die Benutzer auf, „keine Inhalte anzufordern oder zu generieren, die urheberrechtlich geschützte oder markenrechtlich geschützte Materialien verletzen“ und „immer die Rechte an geistigem Eigentum zu respektieren“. 

Schließlich hat das Unternehmen auch eine neue Benutzeroberfläche für Dream Machine eingeführt, die jetzt im Internet und unter iOS verfügbar ist. Nach Angaben des Unternehmens kann es mit natürlicher Sprache verwendet werden: Es ist nicht erforderlich, zu lernen, wie man ein besserer Prompt-Ingenieur wird. 

Die neue Benutzeroberfläche ist einfach zu verwenden und erinnert an andere Generatoren, die wichtige Deskriptoren in Ihrer Eingabeaufforderung identifizieren und ein Dropdown-Menü mit ähnlichen Alternativen bieten, falls Sie Ihre Idee ändern oder verschiedene Variationen erkunden möchten. Der Service richtet sich an alle Benutzer, die ein Designkonzept erkunden, eine Produktidee weiterentwickeln, ein Brainstorming durchführen und über die praktische Moodboard-Infrastruktur von Luma mit Teammitgliedern zusammenarbeiten möchten. 

Der „visuelle KI-Dienst“ bietet außerdem Personalisierungsfunktionen für Bilder und Videos sowie kostenlose und kostenpflichtige Abonnementstufen ab 10 $pro Monat.