MiniMax veröffentlicht KI-Modell M2.5 zu einem Bruchteil der Konkurrenzpreise

Das chinesische KI-Unternehmen MiniMax hat M2.5 veröffentlicht, ein neues großes Sprachmodell, das laut Unternehmensangaben mit Spitzenmodellen von Anthropic und Google mithalten soll — zu deutlich niedrigeren Kosten. MiniMax bietet zwei Versionen über seine API an. M2.5-Lightning verarbeitet 100 Token pro Sekunde und kostet 0,30 Dollar pro Million Eingabe-Token und 2,40 Dollar pro Million Ausgabe-Token. Das …

Weiterlesen …

Alibaba veröffentlicht Qwen3.5, ein multimodales KI-Modell mit 397 Milliarden Parametern

Alibaba hat Qwen3.5 vorgestellt, ein neues KI-Modell, das als multimodaler Agent Text, Bilder und Videos verarbeiten kann. Das QwenTeam kündigt diese Entwicklung auf der Webseite des Unternehmens an. Das Modell enthält 397 Milliarden Parameter. Pro Aufgabe aktiviert es jedoch nur 17 Milliarden davon. Das Team betont, dieser Ansatz optimiere Geschwindigkeit und Kosten. Die Architektur kombiniert …

Weiterlesen …

Mistral veröffentlicht Voxtral Transcribe 2: Transkription direkt auf dem Handy

Mistral AI hat Voxtral Transcribe 2 veröffentlicht, eine Familie von Speech-to-Text-Modellen für Batch-Verarbeitung und Echtzeit-Transkription. Das Unternehmen positioniert die Technologie als präziser und deutlich günstiger als konkurrierende Services und ermöglicht gleichzeitig lokale Verarbeitung für sensible Daten. Die Veröffentlichung umfasst zwei Modelle. Voxtral Mini Transcribe V2 verarbeitet voraufgezeichnete Audiodateien für $0.003 pro Minute, was laut Mistral …

Weiterlesen …

OpemClaw: Dieser KI-Assistent kann sich selbst verbessern und steuert dein digitales Leben

Ein quelloffener KI-Assistent namens OpenClaw zeigt, wie künftige digitale Helfer funktionieren könnten. Das System war bis vor Kurzem als Clawdbot und Moltbot bekannt und arbeitet vollständig auf dem eigenen Computer und bietet umfassende Anpassungsmöglichkeiten. Federico Viticci schreibt bei MacStories, dass das Projekt die Nutzung leistungsstarker Sprachmodelle über vertraute Messenger-Apps wie Telegram oder iMessage ermöglicht. Der …

Weiterlesen …

Black Forest Labs: Neue Modelle erzeugen Bilder in weniger als einer Sekunde

Black Forest Labs hat eine neue Serie von KI-Bildgeneratoren namens FLUX.2 [klein] vorgestellt. Diese Modellfamilie setzt auf hohe Geschwindigkeit und geringe Hardwareanforderungen. Das Unternehmen gibt an, dass die Modelle die Erzeugung und Bearbeitung von Bildern in einer einzigen Architektur vereinen. Laut der Ankündigung erstellen die Systeme Bilder auf moderner Hardware in weniger als einer Sekunde. …

Weiterlesen …

Open Source Modell GLM Image schlägt Googles Bild-KI bei Textdarstellung

Ein neues Open Source Modell setzt Maßstäbe bei der Erstellung von komplexen Grafiken mit viel Text. Die Software GLM Image des Startups Z.ai übertrifft in Tests sogar die Leistung von Googles Nano Banana Pro. Carl Franzen berichtet für VentureBeat über die wachsende Konkurrenz für den Tech Riesen aus den USA. GLM Image nutzt eine Architektur …

Weiterlesen …

OpenAI und Google veröffentlichen neue KI-Übersetzungstools

OpenAI und Google treiben die Entwicklung von KI-Übersetzungen mit neuen Veröffentlichungen voran. OpenAI startete ChatGPT Translate. Dieses eigenständige Tool soll direkt mit etablierten Diensten konkurrieren. Es unterstützt über 50 Sprachen und bietet eine Benutzeroberfläche mit zwei Textfeldern für Ein- und Ausgabe. Funktionen von ChatGPT Translate Der Hauptunterschied zu herkömmlichen Diensten liegt in der Anpassung durch …

Weiterlesen …

Qwen-Image-2512: Neues KI-Modell fordert Google mit fotorealistischen Bildern heraus

Das Qwen-Team von Alibaba hat Qwen-Image-2512 veröffentlicht. Dieses Update verbessert das bestehende Basismodell zur Erzeugung von Bildern aus Text. Das Modell steht nun für die öffentliche Nutzung und für Unternehmen zur Verfügung. Laut den Entwicklern konzentriert sich diese Version auf drei Bereiche: menschlichen Realismus, natürliche Details und die Darstellung von Text. Das Modell soll das …

Weiterlesen …

Dieses winzige KI-Modell schlägt Googles Gemini bei Videoanalyse

Das Allen Institute for AI hat Molmo 2 vorgestellt, ein Open-Source-Videomodell für Videoanalyse und Videoverständnis. Es soll mit größeren proprietären Systemen konkurrieren können. Emilia David berichtet für VentureBeat. Ai2 hat drei Versionen von Molmo 2 veröffentlicht: ein 8B-Modell auf Basis von Qwen-3 für optimales Video-Grounding und Fragenbeantwortung, eine effizientere 4B-Variante und eine 7B-Version auf Grundlage …

Weiterlesen …

Forscher entwickeln Sprachmodelle aus historischen Texten

Wissenschaftler der Universität Zürich und der Universität zu Köln erstellen große Sprachmodelle, die ausschließlich auf historischen Dokumenten bis zu bestimmten Daten trainiert wurden. Das Team um Daniel Göttlich, Dominik Loibner, Guohui Jiang und Hans-Joachim Voth beschreibt das Projekt auf GitHub. Die Modelle heißen Ranke-4B und verfügen über vier Milliarden Parameter. Sie wurden auf 80 Milliarden …

Weiterlesen …