Neues KI-Modell Qwen3-VL soll sehen, verstehen und handeln

Das QwenTeam hat eine neue Serie quelloffener Vision-Language-Modelle namens Qwen3-VL veröffentlicht. Laut der offiziellen Ankündigung sollen die Modelle nicht nur Bilder und Videos erkennen, sondern auch Kontexte verstehen, logisch schlussfolgern und Aktionen ausführen. Das Spitzenmodell der Reihe, Qwen3-VL-235B-A22B, wird in zwei Versionen angeboten. Die Entwickler berichten, dass die „Instruct“-Version in wichtigen Tests zur visuellen Wahrnehmung …

Weiterlesen …

Qwen3-Omni ist ein Open-Source-Modell für Text, Bild, Audio und Video

Das chinesische Technologieunternehmen Alibaba hat Qwen3-Omni veröffentlicht. Es ist ein neues generatives KI-Modell, das eine Kombination aus Text, Bildern, Audio und Video verarbeiten kann. Das Modell zeichnet sich durch seine „omni-modalen“ Fähigkeiten und seine Open-Source-Lizenz aus. Damit positioniert es sich als direkter Konkurrent zu proprietären Modellen von US-Technologiekonzernen wie OpenAI und Google. Nach von Alibaba …

Weiterlesen …

Alibaba stellt neue effiziente KI-Modellarchitektur vor

Alibaba hat eine neue Generation von KI-Modellen namens Qwen3-Next vorgestellt, die auf hohe Leistung bei geringem Rechenaufwand ausgelegt ist. Crystal Liu schreibt für Alibaba, dass die neue Architektur dies durch mehrere Innovationen erreicht. Das erste Modell der Serie, Qwen3-Next-80B, ist ab sofort als Open Source verfügbar. Laut dem Unternehmen aktiviert dieses Modell mit 80 Milliarden …

Weiterlesen …

Schweiz startet Open-Source-KI-Modell Apertus als transparente ChatGPT-Alternative

Die Schweiz steigt mit Apertus in das KI-Rennen ein. Das neue Open-Source Large Language Model wurde von führenden Schweizer Universitäten entwickelt und soll eine transparente Alternative zu kommerziellen KI-Systemen wie ChatGPT und Metas Llama bieten. Apertus, lateinisch für „offen“, entstand durch die Zusammenarbeit der ETH Lausanne (EPFL), ETH Zürich und des Swiss National Supercomputing Centre. …

Weiterlesen …

Tencent stellt KI-Modell vor, das aus Fotos navigierbare 3D-Videos erstellt

Der chinesische Technologiekonzern Tencent hat HunyuanWorld-Voyager veröffentlicht, ein KI-Modell, das statische Bilder in navigierbare 3D-ähnliche Videosequenzen verwandelt. Benj Edwards von Ars Technica berichtet über die Ankündigung. Das System erzeugt aus einem einzigen Foto 49-Frame-Videoclips von etwa zwei Sekunden Länge. Nutzer können Kamerabewegungen wie Vorwärts-, Rückwärts- und Drehbewegungen definieren, um virtuelle Szenen zu erkunden. Mehrere Clips …

Weiterlesen …

Hermes 4 ist ein frei verfügbarer ChatGPT-Konkurrent

Das Startup Nous Research hat Hermes 4 veröffentlicht, eine Familie von KI-Sprachmodellen, die nach Firmenangaben die Leistung führender kommerzieller Angebote erreicht. Gleichzeitig verzichtet das System auf die meisten Inhaltsbeschränkungen. Michael Nuñez berichtet für VentureBeat über die Veröffentlichung. Anders als ChatGPT oder Claude antwortet Hermes 4 auf nahezu jede Anfrage. Das System verzichtet auf Sicherheitsvorkehrungen, die …

Weiterlesen …

DeepSeek veröffentlicht starkes Open-Source-KI-Modell

Das chinesische Unternehmen DeepSeek hat kürzlich sein neues KI-Modell DeepSeek V3.1 veröffentlicht. Es steht als Open Source frei zur Verfügung und kann laut einem Artikel von Michael Nuñez in VentureBeat mit der Leistung führender Systeme von OpenAI und Anthropic mithalten. Das Modell wurde ohne große Ankündigung auf der Plattform Hugging Face hochgeladen und fand schnell …

Weiterlesen …

Die besten KI-Bildgeneratoren für Content-Profis im Vergleich

Vor nicht allzu langer Zeit war das Erzeugen eines Bildes mit KI eher eine technische Spielerei. Es war ein netter Partytrick mit begrenztem praktischem Nutzen. Im Jahr 2025 hat sich das geändert. Die KI-Bilderzeugung hat sich zu einem praktischen Werkzeug für Marketing-Profis entwickelt. Von einzigartigen Visuals für Social-Media-Kampagnen über Website-Assets bis hin zu konzeptionellen Produktfotos: …

Weiterlesen …

Experten uneins über OpenAIs neue Open Source Modelle

OpenAI hat zwei neue Open Source Sprachmodelle veröffentlicht, gpt-oss-120B und gpt-oss-20B. Es ist die erste bedeutende Open Source Veröffentlichung des Unternehmens seit 2019. Die ersten Reaktionen aus der KI-Community sind jedoch stark gespalten, wie Carl Franzen für VentureBeat berichtet. Befürworter bezeichnen die Veröffentlichung als einen wichtigen Schritt für Open Source KI im Westen. Experten wie …

Weiterlesen …

Neue KI-Modelle von Deep Cogito sollen eigenes Denken verbessern

Das KI-Startup Deep Cogito hat vier neue Open-Source-Sprachmodelle veröffentlicht. Die Modelle sollen laut dem Unternehmen die Fähigkeit besitzen, ihre eigenen Denkprozesse mit der Zeit selbstständig zu verbessern. Darüber berichtet Carl Franzen in einem Artikel für VentureBeat. Die Modelle der Familie Cogito v2 nutzen ein besonderes Trainingsverfahren. Dabei analysieren sie ihre eigenen Lösungswege. Erfolgreiche Denkmuster werden …

Weiterlesen …