Qwen-Image-2512: Neues KI-Modell fordert Google mit fotorealistischen Bildern heraus

Das Qwen-Team von Alibaba hat Qwen-Image-2512 veröffentlicht. Dieses Update verbessert das bestehende Basismodell zur Erzeugung von Bildern aus Text. Das Modell steht nun für die öffentliche Nutzung und für Unternehmen zur Verfügung. Laut den Entwicklern konzentriert sich diese Version auf drei Bereiche: menschlichen Realismus, natürliche Details und die Darstellung von Text.

Das Modell soll das künstliche Aussehen reduzieren, das bei KI-Bildern oft vorkommt. Alibaba berichtet, dass das Update Menschen besser darstellt. Dazu gehören genauere Gesichtsdetails und eine bessere Umgebung. Zum Beispiel erfasst das Modell Altersmerkmale wie Falten effektiver als frühere Versionen. Es zeigt auch eine verbesserte Genauigkeit bei Körperhaltungen und Bewegungen, die in einem Prompt beschrieben werden.

Über menschliche Motive hinaus verbessert das Update natürliche Elemente. Dies umfasst feinere Details in Landschaften, bei Tierfellen und Wassereffekten. VentureBeat merkt an, dass diese Verbesserungen das Modell für Branchen wie E-Commerce und Bildung nützlich machen. Hochwertige Texturen verringern den Aufwand für die manuelle Nachbearbeitung der Bilder.

Ein wichtiges Merkmal von Qwen-Image-2512 ist die Fähigkeit, komplexe Layouts und Texte zu verarbeiten. Das Modell kann vollständige Präsentationsfolien, Infografiken und Poster mit korrektem chinesischem und englischem Text erstellen. Diese Funktion bringt das Modell in direkten Wettbewerb mit geschlossenen Systemen wie Gemini 3 Pro Image von Google (aka Nano Banana Pro). VentureBeat berichtet, dass Googles Modell zwar hohe Maßstäbe gesetzt hat, aber ein geschlossenes System bleibt.

Das neue Qwen-Modell nutzt die Apache 2.0-Lizenz. Dies erlaubt es Personen und Firmen, das Modell von Plattformen wie Hugging Face oder ModelScope herunterzuladen. Nutzer können das Modell verändern und auf eigener Hardware betreiben. Dieser Ansatz bietet Vorteile für Unternehmen:

  1. Kostenkontrolle: Organisationen vermeiden API-Gebühren pro Bild durch die Nutzung eigener Server.
  2. Datenschutz: Firmen in regulierten Branchen behalten die volle Kontrolle über ihre Daten.
  3. Anpassung: Entwickler können das Modell auf spezifische kulturelle Stile oder internes Branding zuschneiden.

Alibaba bietet auch eine verwaltete Version über seine Cloud-Plattform an. Dieser Dienst kostet 0,075 US-Dollar pro erzeugtem Bild. Diese Strategie ermöglicht sowohl eigene Anpassungen als auch eine einfache Nutzung in der Cloud.

In internen Tests auf der Plattform AI Arena behauptet Alibaba, dass Qwen-Image-2512 das derzeit stärkste verfügbare Open-Source-Modell ist. Diese Tests deuten darauf hin, dass es mit führenden geschlossenen Modellen mithalten kann. Journalisten von VentureBeat beobachten eine Veränderung im Markt. Offene Modelle erreichen nun Funktionen, die für professionelle Nutzer wichtig sind. Dazu gehören die Kontrolle über das Layout und realistische Texturen.

Quellen: Qwen Blog, VentureBeat

Über den Autor

Mehr zum Thema:

Bleib up-to-date:

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Der aktuelle und umfassende Überblick für Marketing-Profis (2. Ausgabe, September 2025)

Der KI-Umbruch im Marketing ist in vollem Gange und ChatGPT steht als Plattform Nr. 1 im Zentrum. Aber wie behältst du den Überblick bei all den neuen Funktionen und Möglichkeiten? Wie setzt du ChatGPT wirklichgewinnbringend für deine Arbeit ein?

Der „ChatGPT-Kompass“ liefert dir einen fundierten, aktuellen und umfassenden Überblick über ChatGPT und seine Anwendungsmöglichkeiten im Marketing.

Mehr Informationen