Lumas neues Bildmodell übertrifft Google und OpenAI bei

Das KI-Startup Luma AI hat Uni-1 veröffentlicht, ein Bildgenerierungsmodell, das Googles Nano Banana 2 und OpenAIs GPT Image 1.5 bei zentralen Reasoning-Benchmarks übertrifft und dabei bis zu 30 Prozent günstiger ist. Michael Nuñez berichtet für VentureBeat, dass das Modell ein Beispiel für einen grundlegenden Wandel in der KI-Bildgenerierung darstellt.

Viele ältere Bildgeneratoren nutzen Diffusion: Dabei wird aus zufälligem Rauschen schrittweise ein Bild verfeinert. Uni-1 setzt stattdessen auf autoregressive Generierung, das Token-für-Token-Verfahren, das auch großen Sprachmodellen zugrunde liegt. Das Modell denkt dabei während der Bilderzeugung mit, anstatt Verstehen und Erzeugen voneinander zu trennen. Die Bildgeneratoren von Google und ChatGPT nutzen dasselbe Prinzip, Midjourney aber beispielsweise nicht.

Beim RISEBench-Benchmark für visuelles Reasoning erzielt Uni-1 insgesamt 0,51 Punkte. Nano Banana 2 kommt auf 0,50, GPT Image 1.5 auf 0,46. Besonders deutlich ist der Vorsprung beim logischen Schlussfolgern: Uni-1 erreicht 0,32 gegenüber 0,15 bei GPT Image. Bei der Objekterkennung kommt Uni-1 fast an Googles Gemini 3 Pro heran.

Über die API kostet ein einzelnes Bild in 2K-Auflösung rund neun Cent, verglichen mit etwa zehn Cent für Nano Banana 2. Bei niedrigeren Auflösungen bleibt Google günstiger.

Bei der reinen Text-zu-Bild-Generierung bleibt Google vorne. In der Gesamtbewertung durch menschliche Tester liegt Uni-1 jedoch auf Platz eins.

Lumas neues Bildmodell übertrifft Google und OpenAI bei Reasoning-Benchmarks

Mehr zum Thema:

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Mehr Informationen

Bleib auf dem Laufenden

Mehr zum Thema:

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Mehr Informationen