Das deutsche KI-Start-up Black Forest Labs, gegründet von den Entwicklern von Stable Diffusion, hat FLUX.2 vorgestellt. Das ist eine neue Familie von KI-Modellen zur Erzeugung und Bearbeitung von Bildern. Laut Unternehmensangaben ist das System für professionelle kreative Arbeitsabläufe konzipiert. Ziel sind Zuverlässigkeit und Kontrolle statt einmaliger Demonstrationen.
FLUX.2 führt mehrere wichtige Verbesserungen gegenüber seinem Vorgänger ein. Die Modelle sollen den Charakter und Stil über bis zu zehn Referenzbilder hinweg konsistent halten. Black Forest Labs gibt zudem an, dass das System lesbaren Text deutlich besser erzeugen kann, was für Bildmodelle eine häufige Herausforderung darstellt. Es kann Bilder mit einer Auflösung von bis zu 4 Megapixeln erstellen und bearbeiten, wobei feine Details erhalten bleiben.
Eine „Open-Core“-Modellfamilie
Die Veröffentlichung folgt der „Open-Core“-Strategie von Black Forest Labs. Diese kombiniert kommerzielle Produkte mit frei verfügbaren „Open-Weight“-Modellen für die Entwickler-Community. Die FLUX.2-Familie umfasst mehrere Varianten:
- FLUX.2 [pro] und [flex]: Dies sind kommerzielle Modelle, die über eine Programmierschnittstelle (API) zugänglich sind. Die [pro]-Version ist auf Qualität und Geschwindigkeit optimiert. Die [flex]-Version gibt Entwicklern mehr Kontrolle über Parameter, um Geschwindigkeit und Detailgrad abzuwägen.
- FLUX.2 [dev]: Ein leistungsstarkes „Open-Weight“-Modell. Seine Dateien können heruntergeladen und auf eigener Hardware ausgeführt werden. Für die kommerzielle Nutzung ist eine Lizenz erforderlich.
- FLUX.2 [klein]: Ein kommendes, kleineres Modell, das als vollständige Open-Source-Software unter der Apache-2.0-Lizenz veröffentlicht wird.
- FLUX.2 – VAE: Diese Basiskomponente, die für die Bildkompression zuständig ist, ist ebenfalls vollständig Open-Source. Laut Black Forest Labs ermöglicht dies Unternehmen die Integration in eigene Systeme und vermeidet die Abhängigkeit von einem einzigen Anbieter.
Vom Unternehmen veröffentlichte Benchmarks zeigen, dass FLUX.2 [dev] andere verfügbare Open-Weight-Modelle bei der Bilderzeugung und -bearbeitung übertrifft. Ein Artikel von VentureBeat hebt einen Kostenvergleich hervor. Demnach ist der Preis pro Bild für das FLUX.2 [pro]-Modell deutlich niedriger als bei konkurrierenden Systemen wie Googles Gemini 3 Pro Image Preview. Ein Standardbild mit 1 Megapixel kostet mit FLUX.2 [pro] etwa 0,03 US-Dollar, während ein ähnliches Bild bei der Konkurrenz mehr als das Vierfache kosten kann.
Das FLUX.2-System basiert auf einer technischen Architektur, die ein Sprachmodell von Mistral mit einem Transformer kombiniert. Dies hilft dem Modell, Prompts und räumliche Zusammenhänge besser zu verstehen. Mit der Mischung aus proprietären und offenen Modellen will Black Forest Labs die Innovation in der Community fördern und gleichzeitig skalierbare, produktionsreife Werkzeuge für Unternehmen anbieten.
Quellen: Black Forest Labs, VentureBeat
