Midjourney veröffentlicht V7 Alpha mit Sprachsteuerung und Entwurfsmodus

Midjourney hat V7 Alpha veröffentlicht, sein erstes neues KI-Bildgenerierungsmodell seit fast einem Jahr, das Sprachsteuerung und einen schnelleren Entwurfsmodus bietet. Die Veröffentlichung erfolgt eine Woche nach OpenAIs neuem Bildgenerator in ChatGPT, der schnell an Popularität gewann.

Laut Midjourney-CEO David Holz nutzt V7 eine „völlig andere Architektur“, die „viel intelligenter mit Textprompts umgeht“ und eine höhere Bildqualität mit „wunderschönen Texturen“ liefert.

Hauptfunktionen von Midjourney V7

  • Sprachsteuerung: Nutzer können direkt mit dem Modell über die Alpha-Website sprechen
  • Entwurfsmodus: Rendert Bilder 10-mal schneller zur Hälfte der Kosten des Standardmodus, allerdings zunächst in niedrigerer Qualität
  • Personalisierungspflicht: Nutzer müssen etwa 200 Bilder bewerten, um ein Personalisierungsprofil zu erstellen, bevor sie V7 Alpha nutzen können
  • Zwei Betriebsmodi: Turbo (höhere Leistung, aber teurer) und Relax

Die neue Spracheingabefunktion arbeitet zusammen mit dem Entwurfsmodus und versetzt Nutzer in einen von Midjourney beschriebenen „Flow-Zustand“ des kreativen Entwerfens. Nutzer können Anweisungen wie „mach das detaillierter“ oder „mach das dunkler“ sprechen, um Generierungen in Echtzeit anzupassen.

Mehrere Standard-Midjourney-Funktionen stehen für V7 noch nicht zur Verfügung, darunter Bildvergrößerung und Umtexturierung. Laut Holz werden diese „in naher Zukunft, möglicherweise innerhalb von zwei Monaten“ erscheinen.

Gemischte Reaktionen von Nutzern

Im Gegensatz zu früheren Midjourney-Veröffentlichungen, die breites Lob erhielten, sind die ersten Reaktionen auf V7 Alpha gemischt. Einige Nutzer haben Enttäuschung geäußert, wobei KI-Influencer Ethan Mollick anmerkte, dass „das Problem mit dem neuen V7 ist, dass V6 bereits wirklich gut war.“

Kritiker weisen auf Probleme mit der Genauigkeit bei der Umsetzung von Prompts, anatomischer Korrektheit (besonders bei Händen) und Textgenerierungsfähigkeiten hin. Einige Nutzer berichten, dass „identische Prompts aus V6 in V7 schlechter sind.“

Andere haben jedoch die Bildqualität von V7 gelobt, wobei KI-Künstlerin Tatiana Tsiguleva sie als einen „großen Sprung in der Qualität“ beschrieb.

Midjourney, ein 2022 von David Holz gegründetes Unternehmen mit Sitz in San Francisco, hat keine externe Finanzierung aufgenommen, erwartete aber Ende 2023 einen Umsatz von etwa 200 Millionen Dollar. Das Unternehmen sieht sich mehreren Klagen wegen Urheberrechtsverletzungen gegenüber, weil es seine KI-Tools mit aus dem Web gesammelten Bildern ohne Zustimmung der Urheber trainiert haben soll.

Quellen: TechCrunch, VentureBeat

Mehr zum Thema:

Bleib up-to-date: