Qwen-Image-2512: Neues KI-Modell fordert Google mit fotorealistischen Bildern heraus

Das Qwen-Team von Alibaba hat Qwen-Image-2512 veröffentlicht. Dieses Update verbessert das bestehende Basismodell zur Erzeugung von Bildern aus Text. Das Modell steht nun für die öffentliche Nutzung und für Unternehmen zur Verfügung. Laut den Entwicklern konzentriert sich diese Version auf drei Bereiche: menschlichen Realismus, natürliche Details und die Darstellung von Text. Das Modell soll das …

Weiterlesen …

Alibabas Qwen erstellt Webseiten und Podcasts aus Rechercheberichten

Das chinesische Technologieunternehmen Alibaba hat sein KI-Recherchewerkzeug Qwen Deep Research erweitert. Es kann nun aus einem einzigen Recherchebericht automatisch interaktive Webseiten und Podcasts mit mehreren Sprechern erstellen. Das berichtet Carl Franzen für VentureBeat. Die neuen Funktionen sind in der Webanwendung Qwen Chat verfügbar. Der Prozess beginnt mit einer Rechercheanfrage des Nutzers. Die KI sammelt Informationen …

Weiterlesen …

Ehemalige OpenAI-Forscher veröffentlichen ihr erstes Tool

Das Start-up Thinking Machines Lab hat sein erstes Produkt vorgestellt. Es heißt Tinker und soll die Erstellung von spezialisierten KI-Modellen vereinfachen. Das berichtet Will Knight für das Magazin Wired. Das Unternehmen wurde von bekannten ehemaligen Forschern von OpenAI gegründet, darunter CEO Mira Murati. Tinker automatisiert das sogenannte Fine-Tuning von leistungsstarken Open-Source-Modellen. Damit können Entwickler und …

Weiterlesen …

Neues KI-Modell Qwen3-VL soll sehen, verstehen und handeln

Das QwenTeam hat eine neue Serie quelloffener Vision-Language-Modelle namens Qwen3-VL veröffentlicht. Laut der offiziellen Ankündigung sollen die Modelle nicht nur Bilder und Videos erkennen, sondern auch Kontexte verstehen, logisch schlussfolgern und Aktionen ausführen. Das Spitzenmodell der Reihe, Qwen3-VL-235B-A22B, wird in zwei Versionen angeboten. Die Entwickler berichten, dass die „Instruct“-Version in wichtigen Tests zur visuellen Wahrnehmung …

Weiterlesen …

Qwen3-Omni ist ein Open-Source-Modell für Text, Bild, Audio und Video

Das chinesische Technologieunternehmen Alibaba hat Qwen3-Omni veröffentlicht. Es ist ein neues generatives KI-Modell, das eine Kombination aus Text, Bildern, Audio und Video verarbeiten kann. Das Modell zeichnet sich durch seine „omni-modalen“ Fähigkeiten und seine Open-Source-Lizenz aus. Damit positioniert es sich als direkter Konkurrent zu proprietären Modellen von US-Technologiekonzernen wie OpenAI und Google. Nach von Alibaba …

Weiterlesen …

Alibaba stellt neue effiziente KI-Modellarchitektur vor

Alibaba hat eine neue Generation von KI-Modellen namens Qwen3-Next vorgestellt, die auf hohe Leistung bei geringem Rechenaufwand ausgelegt ist. Crystal Liu schreibt für Alibaba, dass die neue Architektur dies durch mehrere Innovationen erreicht. Das erste Modell der Serie, Qwen3-Next-80B, ist ab sofort als Open Source verfügbar. Laut dem Unternehmen aktiviert dieses Modell mit 80 Milliarden …

Weiterlesen …

Neues KI-Modell von Alibaba bearbeitet Bilder mit Textbefehlen

Das Qwen-Team von Alibaba hat ein neues Open-Source-KI-Modell namens Qwen-Image Edit veröffentlicht. Es ermöglicht Nutzern, Bilder mit einfachen Textanweisungen zu bearbeiten. Das Werkzeug kann eine Vielzahl komplexer Aufgaben ausführen und konkurriert damit mit etablierter Software wie Adobe Photoshop. Das berichtet Carl Franzen für VentureBeat. Nutzer laden ein Bild hoch und geben eine Anweisung ein, zum …

Weiterlesen …

Alibabas neues Open-Source-KI-Modell will Text in Bildern meistern

Das Qwen-Team von Alibaba hat mit Qwen-Image einen neuen KI-Bildgenerator veröffentlicht. Nach Angaben der Entwickler ist das Modell darauf spezialisiert, Bilder mit präzisem Text in englischer und chinesischer Sprache zu erzeugen. Dies ist eine bekannte Schwachstelle vieler KI-Systeme. Der Journalist Carl Franzen schreibt für VentureBeat, dass sich damit Inhalte wie Plakate, Präsentationen oder Ladenbeschriftungen mit …

Weiterlesen …

Alibaba stellt neuen KI-Bildgenerator vor

Der chinesische Technologiekonzern Alibaba hat Qwen VLo vorgestellt, ein neues KI-Modell zur Bilderzeugung und Bildbearbeitung. Die Technologie kann aus Textbefehlen Bilder erstellen oder bestehende Bilder modifizieren, berichtete Bloomberg-Journalistin Luz Ding. Nutzer können beispielsweise „Erstelle ein Bild von einer süßen Katze“ eingeben oder vorhandene Bilder mit Anweisungen wie „Setze der Katze eine Mütze auf“ bearbeiten. Das …

Weiterlesen …

Alibaba veröffentlicht Qwen3-Modelle mit KI-Reasoning-Fähigkeiten

Alibaba hat mit Qwen3 eine neue Familie von großen Sprachmodellen vorgestellt, die mit führenden KI-Systemen von OpenAI und Google konkurrieren. Die Produktreihe umfasst zwei Mixture-of-Experts (MoE)-Modelle und sechs Dense-Modelle mit Parametern zwischen 0,6 und 235 Milliarden. Laut den von Alibaba veröffentlichten Benchmarks übertrifft das Flaggschiffmodell Qwen3-235B-A22B DeepSeek R1 und OpenAIs o1 in mehreren wichtigen Metriken …

Weiterlesen …