Ein umfassender Test von KI-Bildmodellen kommt zu dem Ergebnis, dass es kein einzelnes Werkzeug für alle Arten der Bildbearbeitung gibt. Die Untersuchung von über 600 Bildgenerierungen zeigt, dass die Modelle von OpenAI, Google und Seedream je nach Anwendungsfall deutliche Stärken und Schwächen aufweisen. Darüber schreibt App-Entwickler LateNiteSoft im Firmenblog. Das Unternehmen nutzte seine langjährige Erfahrung im Bereich Fotografie-Apps, um die Modelle für typische Bearbeitungsaufgaben zu bewerten.
Die Resultate zeigen, dass das Modell von OpenAI seine Stärken bei kreativen und künstlerischen Umsetzungen hat. Es eignet sich besonders gut für die Übertragung von Kunststilen oder die komplette Umgestaltung von Szenen. Allerdings verändert es oft Details des Originalbildes stark, was zu einem unnatürlichen Eindruck führen kann. Zudem arbeitet es deutlich langsamer als die Konkurrenz.
Googles Gemini-Modell ist hingegen die beste Wahl für fotorealistische Bearbeitungen. Laut der Analyse bewahrt es die Details des Ausgangsbildes sehr genau, agiert aber oft zu zurückhaltend. Bei künstlerischen Stilen, insbesondere bei Fotos mit Menschen, verweigert das Modell mitunter die Bearbeitung.
Das Modell von Seedream erwies sich als vielseitiger Alleskönner. Es bietet einen guten Kompromiss zwischen den kreativen Ergebnissen von OpenAI und den realistischen von Gemini. Der Bericht beschreibt es aufgrund seiner Geschwindigkeit und Leistung als eine gute Alternative zu OpenAI. LateNiteSoft folgert, dass Nutzer für optimale Ergebnisse das Modell je nach Aufgabe gezielt auswählen sollten.
