Google TurboQuant kann KI-Kosten spürbar verringern

Google Research hat TurboQuant veröffentlicht, einen neuen Kompressionsalgorithmus für große Sprachmodelle. Laut des Unternehmens lässt sich der Key-Value-Cache eines Modells damit auf mindestens ein Sechstel reduzieren. Zudem wird die Attention-Berechnung – ein zentraler Verarbeitungsschritt – um das bis zu Achtfache beschleunigt, ohne dass das Modell neu trainiert werden muss oder an Präzision verliert. Um zu …

Weiterlesen …

Googles Lyria 3 Pro komponiert jetzt ganze Songs

Google hat sein KI-Musikmodell Lyria 3 Pro vorgestellt. Myriam Hamed Torres schreibt für Google DeepMind, dass das Modell Tracks von bis zu drei Minuten Länge erzeugen kann. Dabei versteht es musikalische Strukturen wie Intros, Verse, Refrains und Bridges. Das Modell ist auf mehreren Google-Plattformen verfügbar. Unternehmen können es über Vertex AI für die Produktion großer …

Weiterlesen …

ByteDance startet KI-Videomodell Seedance 2.0 in CapCut

ByteDance führt sein neues KI-Modell zur Video- und Audiogenerierung, Dreamina Seedance 2.0, in der Bearbeitungsplattform CapCut ein. Sarah Perez berichtet für TechCrunch, dass das Modell es Nutzern ermöglicht, Videoinhalte per Textprompt, Bild oder Referenzvideo zu erstellen, zu bearbeiten und mit Audio zu synchronisieren. Der Start erfolgt zunächst in Brasilien, Indonesien, Malaysia, Mexiko, den Philippinen, Thailand …

Weiterlesen …

Anthropic bestätigt neues KI-Modell Claude Mythos nach Datenpanne

Anthropic entwickelt ein neues KI-Modell namens Claude Mythos. Das Unternehmen bezeichnet es als das leistungsfähigste, das es je entwickelt hat. Beatrice Nolan berichtet für Fortune, dass die Existenz des Modells durch einen Fehler bekannt wurde: Interne Dokumente landeten versehentlich in einem öffentlich zugänglichen Datenspeicher. Ein Sprecher von Anthropic bezeichnete das Modell als einen „step change“, …

Weiterlesen …

Google Search Live weltweit verfügbar

Google hat Search Live, seine sprach- und kamerabasierte Suchfunktion, auf alle Länder und Sprachen ausgeweitet, in denen AI Mode verfügbar ist. Das Rollout umfasst mehr als 200 Länder und Territorien. Mit Search Live können Nutzer Fragen laut aussprechen, anstatt sie einzutippen. Die Funktion antwortet mit Audio und kann zusätzlich die Kamera des Smartphones einbeziehen. Wer …

Weiterlesen …

Google macht KI-Gespräche via Audio natürlicher

Google hat Gemini 3.1 Flash Live veröffentlicht. Valeria Wu und Yifan Ding schreiben im Google Blog, dass das Modell schneller antwortet und natürlichere Gespräche ermöglicht als sein Vorgänger. Das Modell ist in mehreren Google-Produkten verfügbar. Entwicklerinnen und Entwickler können es über die Gemini Live API in Google AI Studio nutzen. Unternehmen haben Zugang über Gemini …

Weiterlesen …

KI-Chatverlauf mitnehmen: So wechselst du jetzt zu Gemini

Google hat neue Funktionen für seinen KI-Assistenten Gemini veröffentlicht. Nutzer können damit ihren Chatverlauf und persönliche Vorlieben aus anderen KI-Apps wie ChatGPT oder Claude direkt in Gemini übertragen. Das Update bringt zwei neue Möglichkeiten. Zum einen können Nutzer eine Zusammenfassung ihrer persönlichen Daten importieren — also Interessen, Beziehungen und Vorlieben. Dazu kopieren sie einen von …

Weiterlesen …

Mistral veröffentlicht Open-Weight-Sprachmodell Voxtral TTS

Das französische KI-Unternehmen Mistral hat Voxtral TTS veröffentlicht, ein Open-Weight-Text-to-Speech-Modell für den Unternehmenseinsatz. Mögliche Anwendungsgebiete sind Kundendienst, Vertrieb und Echtzeit-Übersetzung. Anders als Konkurrenten wie ElevenLabs, Deepgram und OpenAI stellt Mistral die vollständigen Modellgewichte zur Verfügung. Unternehmen können das Modell auf ihrer eigenen Infrastruktur betreiben und müssen keine Daten an Dritte übermitteln. Das Modell basiert auf …

Weiterlesen …

Anthropic lässt Claude jetzt Macs steuern

Anthropic hat seinem KI-Assistenten Claude neue Fähigkeiten gegeben. Claude kann jetzt auf einem Mac klicken, tippen, scrollen und Programme bedienen. Die Funktion ist als Research Preview für Abonnenten der Pläne Claude Pro und Max verfügbar. Claude folgt dabei einem festen Ablauf. Zuerst nutzt das System direkte Verbindungen zu Diensten wie Gmail, Slack oder Google Calendar. …

Weiterlesen …

Xiaomi MiMo-V2-Pro glänzt mit hoher Leistung und niedrigen Preisen

Xiaomi hat das Sprachmodell MiMo-V2-Pro veröffentlicht. Das chinesische Elektronikunternehmen behauptet, das Modell erreiche eine Leistung nahe den führenden amerikanischen KI-Systemen, koste dabei aber nur etwa ein Sechstel bis ein Siebtel so viel. Carl Franzen berichtet für VentureBeat über die Veröffentlichung. Projektleiter Fuli Luo, der zuvor an dem einflussreichen Modell DeepSeek R1 mitarbeitete, bezeichnete den Launch …

Weiterlesen …