Neues KI-Modell Qwen3-VL soll sehen, verstehen und handeln

Das QwenTeam hat eine neue Serie quelloffener Vision-Language-Modelle namens Qwen3-VL veröffentlicht. Laut der offiziellen Ankündigung sollen die Modelle nicht nur Bilder und Videos erkennen, sondern auch Kontexte verstehen, logisch schlussfolgern und Aktionen ausführen. Das Spitzenmodell der Reihe, Qwen3-VL-235B-A22B, wird in zwei Versionen angeboten. Die Entwickler berichten, dass die „Instruct“-Version in wichtigen Tests zur visuellen Wahrnehmung …

Weiterlesen …

Qwen3-Omni ist ein Open-Source-Modell für Text, Bild, Audio und Video

Das chinesische Technologieunternehmen Alibaba hat Qwen3-Omni veröffentlicht. Es ist ein neues generatives KI-Modell, das eine Kombination aus Text, Bildern, Audio und Video verarbeiten kann. Das Modell zeichnet sich durch seine „omni-modalen“ Fähigkeiten und seine Open-Source-Lizenz aus. Damit positioniert es sich als direkter Konkurrent zu proprietären Modellen von US-Technologiekonzernen wie OpenAI und Google. Nach von Alibaba …

Weiterlesen …

Alibaba stellt neue effiziente KI-Modellarchitektur vor

Alibaba hat eine neue Generation von KI-Modellen namens Qwen3-Next vorgestellt, die auf hohe Leistung bei geringem Rechenaufwand ausgelegt ist. Crystal Liu schreibt für Alibaba, dass die neue Architektur dies durch mehrere Innovationen erreicht. Das erste Modell der Serie, Qwen3-Next-80B, ist ab sofort als Open Source verfügbar. Laut dem Unternehmen aktiviert dieses Modell mit 80 Milliarden …

Weiterlesen …

Neues KI-Modell von Alibaba bearbeitet Bilder mit Textbefehlen

Das Qwen-Team von Alibaba hat ein neues Open-Source-KI-Modell namens Qwen-Image Edit veröffentlicht. Es ermöglicht Nutzern, Bilder mit einfachen Textanweisungen zu bearbeiten. Das Werkzeug kann eine Vielzahl komplexer Aufgaben ausführen und konkurriert damit mit etablierter Software wie Adobe Photoshop. Das berichtet Carl Franzen für VentureBeat. Nutzer laden ein Bild hoch und geben eine Anweisung ein, zum …

Weiterlesen …

Alibabas neues Open-Source-KI-Modell will Text in Bildern meistern

Das Qwen-Team von Alibaba hat mit Qwen-Image einen neuen KI-Bildgenerator veröffentlicht. Nach Angaben der Entwickler ist das Modell darauf spezialisiert, Bilder mit präzisem Text in englischer und chinesischer Sprache zu erzeugen. Dies ist eine bekannte Schwachstelle vieler KI-Systeme. Der Journalist Carl Franzen schreibt für VentureBeat, dass sich damit Inhalte wie Plakate, Präsentationen oder Ladenbeschriftungen mit …

Weiterlesen …

Alibaba stellt neuen KI-Bildgenerator vor

Der chinesische Technologiekonzern Alibaba hat Qwen VLo vorgestellt, ein neues KI-Modell zur Bilderzeugung und Bildbearbeitung. Die Technologie kann aus Textbefehlen Bilder erstellen oder bestehende Bilder modifizieren, berichtete Bloomberg-Journalistin Luz Ding. Nutzer können beispielsweise „Erstelle ein Bild von einer süßen Katze“ eingeben oder vorhandene Bilder mit Anweisungen wie „Setze der Katze eine Mütze auf“ bearbeiten. Das …

Weiterlesen …

Alibaba veröffentlicht Qwen3-Modelle mit KI-Reasoning-Fähigkeiten

Alibaba hat mit Qwen3 eine neue Familie von großen Sprachmodellen vorgestellt, die mit führenden KI-Systemen von OpenAI und Google konkurrieren. Die Produktreihe umfasst zwei Mixture-of-Experts (MoE)-Modelle und sechs Dense-Modelle mit Parametern zwischen 0,6 und 235 Milliarden. Laut den von Alibaba veröffentlichten Benchmarks übertrifft das Flaggschiffmodell Qwen3-235B-A22B DeepSeek R1 und OpenAIs o1 in mehreren wichtigen Metriken …

Weiterlesen …

Alibaba veröffentlicht QwQ-32B, ein leistungsstarkes Reasoning-Modell

Alibabas Qwen-Team hat QwQ-32B vorgestellt, ein neues Open-Source-Sprachmodell, das trotz deutlich geringerer Parameterzahl die Leistung viel größerer Modelle wie DeepSeek-R1 erreicht. Das unter der Apache 2.0-Lizenz veröffentlichte Modell mit 32 Milliarden Parametern nutzt Reinforcement Learning (RL), um seine Reasoning-Fähigkeiten für komplexe Problemlösungsaufgaben zu verbessern. Hauptmerkmale und Fähigkeiten QwQ-32B zeigt beeindruckende Leistungen bei mathematischem Denken, Programmierfähigkeiten …

Weiterlesen …

Alibaba stellt leistungsfähige neue KI-Modelle vor

Alibabas Qwen-Team hat zwei bedeutende KI-Modelle – Qwen2.5-VL und Qwen2.5-Max – vorgestellt, die fortschrittliche Fähigkeiten in verschiedenen Aufgabenbereichen demonstrieren. Laut Unternehmensangaben können diese Modelle Text- und Bildanalysen durchführen, Computer und mobile Geräte steuern und mit etablierten KI-Systemen von OpenAI, Anthropic und Google in mehreren Bewertungskategorien konkurrieren. Die Qwen2.5-VL-Modellfamilie umfasst drei Versionen, wobei die 72B-Hauptversion eine …

Weiterlesen …

DeepSeek veröffentlicht neue Reasoning-Modelle

Das chinesische KI-Unternehmen DeepSeek hat seine neuen Sprachmodelle DeepSeek-R1-Zero und DeepSeek-R1 sowie sechs kleinere destillierte Versionen vorgestellt. Die Hauptmodelle, die auf DeepSeeks V3-Architektur basieren, verfügen über insgesamt 671 Milliarden Parameter, von denen 37 Milliarden aktiv sind, und eine Kontextlänge von 128.000 Token. Laut Unternehmensangaben erreicht DeepSeek-R1 eine mit OpenAI-Modellen vergleichbare Leistung in den Bereichen Mathematik, …

Weiterlesen …