Qwen-Image-2512: Neues KI-Modell fordert Google mit fotorealistischen Bildern heraus

Das Qwen-Team von Alibaba hat Qwen-Image-2512 veröffentlicht. Dieses Update verbessert das bestehende Basismodell zur Erzeugung von Bildern aus Text. Das Modell steht nun für die öffentliche Nutzung und für Unternehmen zur Verfügung. Laut den Entwicklern konzentriert sich diese Version auf drei Bereiche: menschlichen Realismus, natürliche Details und die Darstellung von Text. Das Modell soll das …

Weiterlesen …

Dieses winzige KI-Modell schlägt Googles Gemini bei Videoanalyse

Das Allen Institute for AI hat Molmo 2 vorgestellt, ein Open-Source-Videomodell für Videoanalyse und Videoverständnis. Es soll mit größeren proprietären Systemen konkurrieren können. Emilia David berichtet für VentureBeat. Ai2 hat drei Versionen von Molmo 2 veröffentlicht: ein 8B-Modell auf Basis von Qwen-3 für optimales Video-Grounding und Fragenbeantwortung, eine effizientere 4B-Variante und eine 7B-Version auf Grundlage …

Weiterlesen …

Forscher entwickeln Sprachmodelle aus historischen Texten

Wissenschaftler der Universität Zürich und der Universität zu Köln erstellen große Sprachmodelle, die ausschließlich auf historischen Dokumenten bis zu bestimmten Daten trainiert wurden. Das Team um Daniel Göttlich, Dominik Loibner, Guohui Jiang und Hans-Joachim Voth beschreibt das Projekt auf GitHub. Die Modelle heißen Ranke-4B und verfügen über vier Milliarden Parameter. Sie wurden auf 80 Milliarden …

Weiterlesen …

Neues KI-Modell mit 8 Milliarden Parametern schlägt zehnmal größere Konkurrenz

Essential AI hat Rnj-1 vorgestellt, ein quelloffenes großes Sprachmodell für Programmierung, mathematisches Denken und wissenschaftliche Aufgaben. Das nach dem indischen Mathematiker Srinivasa Ramanujan benannte Modell ist der erste große Beitrag des Unternehmens zum Open-Source-Ökosystem. Das Team berichtet im Essential-AI-Blog, dass das Modell mit 8 Milliarden Parametern außergewöhnliche Leistungen bei Software-Entwicklungsaufgaben zeigt. Auf SWE-bench, einem Benchmark …

Weiterlesen …

Mistral AI veröffentlicht 10 Open-Source-Modelle für lokale KI und Unternehmenseinsatz

Mistral AI hat Mistral 3 veröffentlicht, eine Sammlung von 10 Open-Source-Modellen für künstliche Intelligenz. Die Modelle laufen auf Geräten vom Smartphone bis zu Cloud-Systemen für Unternehmen. Das französische Startup hat alle Modelle unter der Apache 2.0-Lizenz veröffentlicht, die kommerzielle Nutzung ohne Einschränkungen erlaubt. Die Veröffentlichung umfasst Mistral Large 3, das Flaggschiff-Modell des Unternehmens, und die …

Weiterlesen …

Black Forest Labs FLUX.2 ist eine KI für professionelle Bilderzeugung

Das deutsche KI-Start-up Black Forest Labs, gegründet von den Entwicklern von Stable Diffusion, hat FLUX.2 vorgestellt. Das ist eine neue Familie von KI-Modellen zur Erzeugung und Bearbeitung von Bildern. Laut Unternehmensangaben ist das System für professionelle kreative Arbeitsabläufe konzipiert. Ziel sind Zuverlässigkeit und Kontrolle statt einmaliger Demonstrationen. FLUX.2 führt mehrere wichtige Verbesserungen gegenüber seinem Vorgänger …

Weiterlesen …

Ai2 veröffentlicht Olmo 3 mit Fokus auf vollständige Entwicklungstransparenz

Das Allen Institute for AI (Ai2), ein gemeinnütziges Forschungsinstitut mit Sitz in Seattle, hat Olmo 3 veröffentlicht, eine neue Familie von Open-Source-Sprachmodellen. Laut Ai2 sollen die neuen Modelle in Leistung und Effizienz mit anderen führenden offenen Modellen konkurrieren und gleichzeitig ein neues Maß an Transparenz für Entwickler und Forschende bieten. Das Hauptmerkmal der Olmo-3-Veröffentlichung ist …

Weiterlesen …

Kimi K2 Thinking: Neues Open Source KI-Modell erreicht Leistung führender kommerzieller Systeme

Ein neues Open Source KI-Modell des chinesischen Startups Moonshot AI hat die Leistung führender kommerzieller Systeme erreicht oder übertroffen. Das betrifft OpenAI’s GPT-5 und Anthropic’s Claude Sonnet 4.5 in mehreren Leistungstests. Carl Franzen berichtet für VentureBeat, dass das Kimi K2 Thinking Modell 44,9 Prozent bei Humanity’s Last Exam erreichte. Bei BrowseComp waren es 60,2 Prozent …

Weiterlesen …

IBMs neue KI-Modelle sind klein genug für Laptops und Browser

IBM hat vier neue KI-Modelle vorgestellt, die klein genug sind, um auf einem normalen Laptop oder sogar in einem Webbrowser zu laufen. Carl Franzen berichtet für VentureBeat, dass diese „Granite 4.0 Nano“ genannten Modelle einen Wandel in der KI-Entwicklung anzeigen. Effizienz wird hier über schiere Größe gestellt. Die Modelle sind Open Source und unter der …

Weiterlesen …

MiniMax-M2 ist ein leistungsstarkes Open-Source-Modell für „agentische“ Aufgaben

Das chinesische KI-Startup MiniMax hat MiniMax-M2 veröffentlicht. Es ist ein neues großes Sprachmodell, das unter einer MIT-Lizenz zur freien kommerziellen Nutzung verfügbar ist. Das Unternehmen gibt an, das Modell sei speziell für komplexe „agentische“ Aufgaben und für das Programmieren entwickelt worden. Bei agentischen Aufgaben agiert die KI selbstständig, um Software-Tools zu nutzen. Einem Bericht von …

Weiterlesen …