DeepSeek veröffentlicht neue Reasoning-Modelle

Das chinesische KI-Unternehmen DeepSeek hat seine neuen Sprachmodelle DeepSeek-R1-Zero und DeepSeek-R1 sowie sechs kleinere destillierte Versionen vorgestellt. Die Hauptmodelle, die auf DeepSeeks V3-Architektur basieren, verfügen über insgesamt 671 Milliarden Parameter, von denen 37 Milliarden aktiv sind, und eine Kontextlänge von 128.000 Token. Laut Unternehmensangaben erreicht DeepSeek-R1 eine mit OpenAI-Modellen vergleichbare Leistung in den Bereichen Mathematik, … Weiterlesen …

Alibaba senkt Preise für KI-Sprachmodell Qwen um 85 Prozent

Der chinesische Technologiekonzern Alibaba hat eine drastische Preissenkung für sein KI-Sprachmodell Qwen-VL angekündigt. Wie Ryan Browne von Reuters berichtet, werden die Preise um bis zu 85 Prozent reduziert. Das Modell kann sowohl Text als auch Bilder verarbeiten. Diese Preissenkung folgt einer früheren Reduzierung um 97 Prozent im Mai. Bereits über 90.000 Unternehmenskunden nutzen Alibabas KI-Technologie. … Weiterlesen …

Alibaba Vision-Modell QVQ mit erweiterten Analysefähigkeiten

Das Qwen-Team von Alibaba hat mit QVQ-72B-Preview ein neues experimentelles visuelles KI-Modell veröffentlicht, das die Fähigkeiten zur visuellen Analyse verbessern soll. Aufbauend auf der Qwen2-VL-72B-Architektur kombiniert das Modell Sprach- und Bildverarbeitung zur Bewältigung komplexer analytischer Aufgaben. Nach Unternehmensangaben erreichte QVQ einen Wert von 70,3 im MMMU-Benchmark, was eine Verbesserung gegenüber dem Vorgängermodell darstellt. Das Modell … Weiterlesen …

Alibaba veröffentlicht neues KI-Reasoning-Modell als Konkurrenz zu OpenAI

Alibaba hat Qwen with Questions (QwQ) vorgestellt, ein neues KI-Reasoning-Modell, das mit OpenAIs o1-System konkurrieren soll. Das Modell verfügt über 32 Milliarden Parameter und kann Kontexte von bis zu 32.000 Token verarbeiten. Laut Alibabas Tests übertrifft QwQ OpenAIs o1-preview bei den mathematischen und wissenschaftlichen Reasoning-Benchmarks AIME und MATH. Das Unternehmen gibt an, dass QwQ bessere … Weiterlesen …

Alibaba erweitert Qwen für Verarbeitung von einer Million Token

Alibaba Cloud hat eine verbesserte Version seines KI-Modells Qwen2.5-Turbo vorgestellt, die nun Kontexte von bis zu einer Million Token verarbeiten kann. Das entspricht etwa 1,5 Millionen chinesischen Schriftzeichen oder zehn Romanen in voller Länge. Bei der Langtext-Bewertung RULER erreicht das Modell 93,1 Punkte und übertrifft damit GPT-4. Die Verarbeitungsgeschwindigkeit wurde deutlich gesteigert – für eine … Weiterlesen …

Arch-Function beschleunigt KI-Agenten

Katanemo hat Arch-Function vorgestellt, eine Sammlung von Open-Source Large Language Models (LLMs), die ultraschnelle Funktionsaufrufe bieten, welche für agentenbasierte Anwendungen in Unternehmen unerlässlich sind. Laut VentureBeat sind diese Modelle fast 12-mal schneller als OpenAIs GPT-4 und übertreffen die Angebote der Konkurrenz bei weitem, während sie gleichzeitig erhebliche Kosteneinsparungen ermöglichen. Arch-Function baut auf Katanemos Vorgängerversion Arch … Weiterlesen …

Alibaba stellt etliche neue KI-Modelle vor

Alibaba verstärkt seine KI-Aktivitäten durch die Veröffentlichung neuer Open-Source-Modelle und Text-zu-Video-Technologie. Das chinesische Technologieunternehmen stellte nun über 100 neue Open-Source-KI-Modelle aus seiner Qwen 2.5-Familie vor, wie Reuters berichtet. Die Modelle decken verschiedene Größen und Fähigkeiten ab, darunter Mathematik und Programmierung. Sie unterstützen mehr als 29 Sprachen. Zusätzlich präsentierte Alibaba ein neues Text-zu-Video-Modell als Teil seiner … Weiterlesen …

Chinesische Modelle führen Topliste an

Die neue Rangliste der besten Sprachmodelle von Hugging Face zeigt: Chinesische Modelle sind unter den frei verfügbaren KIs aktuell führend. Alibabas Qwen-Modelle dominieren die Top-Plätze des Rankings, das auf anspruchsvolleren Tests basiert als sein Vorgänger. Bewertet werden Fähigkeiten wie Wissensabruf, Schlussfolgerungen aus langen Texten, komplexe Mathematik und das Befolgen von Anweisungen. 

Ein neues, offenes KI-Modell ist besonders folgsam

Während kommerzielle KI-Angebote viele Leitplanken und Schranken einbauen, um sie gegen Missbrauch zu sichern, wirbt das offene Modell Liberated-Qwen1.5-72B damit, dass es keine solche Beschränkungen hat. Stattdessen ist es speziell darauf trainiert, strikt den Vorgaben zu folgen. Dadurch lässt es sich weniger leicht austricksen. Zugleich muss man aber selbst festlegen, welche Antworten und Themen erlaubt sind. Quelle: VentureBeat