Neues KI-Modell von Alibaba bearbeitet Bilder mit Textbefehlen

Das Qwen-Team von Alibaba hat ein neues Open-Source-KI-Modell namens Qwen-Image Edit veröffentlicht. Es ermöglicht Nutzern, Bilder mit einfachen Textanweisungen zu bearbeiten. Das Werkzeug kann eine Vielzahl komplexer Aufgaben ausführen und konkurriert damit mit etablierter Software wie Adobe Photoshop. Das berichtet Carl Franzen für VentureBeat.

Nutzer laden ein Bild hoch und geben eine Anweisung ein, zum Beispiel „Zieh dem Mann einen Smoking an“, um in Sekunden eine bearbeitete Version zu erhalten. Das Modell basiert auf dem Qwen-Image-Basismodell und ist darauf ausgelegt, den Stil und Inhalt des Originalbildes beizubehalten.

Qwen-Image Edit beherrscht sowohl große semantische Änderungen, wie die Umwandlung eines Stadtfotos in eine Lego-Szene, als auch feine optische Korrekturen, etwa das Entfernen einer einzelnen Haarsträhne. Eine besondere Funktion ist das Bearbeiten von Text in Bildern. Das Modell kann Schrift in Englisch und Chinesisch hinzufügen, entfernen oder verändern, wobei Schriftart und Stil erhalten bleiben.

Das Werkzeug ist über Plattformen wie Qwen Chat und eine Programmierschnittstelle (API) für Entwickler verfügbar. Da es sich um ein Open-Source-Modell unter der Apache-2.0-Lizenz handelt, können Unternehmen es auf ihrer eigenen Hardware einsetzen. Dies könnte eine erhebliche Kostenersparnis gegenüber proprietärer Software bedeuten.

Mehr zum Thema:

Bleib up-to-date: