Mistral veröffentlicht Open-Weight-Sprachmodell Voxtral TTS

Das französische KI-Unternehmen Mistral hat Voxtral TTS veröffentlicht, ein Open-Weight-Text-to-Speech-Modell für den Unternehmenseinsatz. Mögliche Anwendungsgebiete sind Kundendienst, Vertrieb und Echtzeit-Übersetzung. Anders als Konkurrenten wie ElevenLabs, Deepgram und OpenAI stellt Mistral die vollständigen Modellgewichte zur Verfügung. Unternehmen können das Modell auf ihrer eigenen Infrastruktur betreiben und müssen keine Daten an Dritte übermitteln. Das Modell basiert auf …

Weiterlesen …

Anthropic lässt Claude jetzt Macs steuern

Anthropic hat seinem KI-Assistenten Claude neue Fähigkeiten gegeben. Claude kann jetzt auf einem Mac klicken, tippen, scrollen und Programme bedienen. Die Funktion ist als Research Preview für Abonnenten der Pläne Claude Pro und Max verfügbar. Claude folgt dabei einem festen Ablauf. Zuerst nutzt das System direkte Verbindungen zu Diensten wie Gmail, Slack oder Google Calendar. …

Weiterlesen …

Xiaomi MiMo-V2-Pro glänzt mit hoher Leistung und niedrigen Preisen

Xiaomi hat das Sprachmodell MiMo-V2-Pro veröffentlicht. Das chinesische Elektronikunternehmen behauptet, das Modell erreiche eine Leistung nahe den führenden amerikanischen KI-Systemen, koste dabei aber nur etwa ein Sechstel bis ein Siebtel so viel. Carl Franzen berichtet für VentureBeat über die Veröffentlichung. Projektleiter Fuli Luo, der zuvor an dem einflussreichen Modell DeepSeek R1 mitarbeitete, bezeichnete den Launch …

Weiterlesen …

Reisen buchen, Akten verwalten, Mails beantworten: KI-Agenten wollen das Büro übernehmen

KI-Agenten sind längst nicht mehr nur Werkzeuge für Softwareentwickler. Tools wie Claude Code von Anthropic und Codex von OpenAI, ursprünglich als Programmierhilfen gedacht, sollen künftig den gesamten Arbeitsalltag übernehmen, von der Reisebuchung bis zur Verwaltung von Krankenakten. Kate Clark berichtet für das Wall Street Journal, dass die Unternehmen hinter diesen Tools eine Chance im Billionen-Dollar-Bereich …

Weiterlesen …

Ausprobiert: Googles Gemini kann jetzt selbstständig Apps auf dem Smartphone bedienen

Googles KI-Assistent Gemini kann auf Android-Smartphones eigenständig Apps steuern und Aufgaben erledigen. Allison Johnson berichtet für The Verge, dass die Funktion derzeit als Beta-Version auf dem Pixel 10 Pro und dem Galaxy S26 Ultra verfügbar ist. Bisher unterstützt sie nur eine kleine Auswahl an Liefer- und Fahrdienst-Apps. Die Funktion läuft im Hintergrund, während Nutzer ihr …

Weiterlesen …

Anthropic verbindet Claude Code mit Telegram und Discord

Anthropic hat Claude Code Channels veröffentlicht. Das Feature erlaubt Entwicklern, Nachrichten direkt aus Telegram oder Discord an eine laufende Claude-Code-Sitzung zu schicken. Eine Nachricht vom Smartphone genügt, Claude führt die Aufgabe auf dem Desktop oder Server aus und antwortet über dieselbe App. Die Funktion basiert auf dem Model Context Protocol (MCP), einem offenen Standard, den …

Weiterlesen …

Firefly Custom Models: Adobe öffnet das Training eigener Bild-KI für alle

Adobe hat Firefly Custom Models als Public Beta gestartet. Damit können Unternehmen und Kreative KI-Bildgeneratoren mit ihren eigenen Bildern trainieren. Das Modell lernt dabei, einen bestimmten visuellen Stil nachzuahmen — einschließlich Farbpaletten, Beleuchtung, Strichstärken und Charakterdesigns. Das Ziel ist es, Teams dabei zu helfen, große Mengen an Inhalten zu produzieren, die über Kampagnen, Kanäle und …

Weiterlesen …

OpenAI stellt Video-KI Sora komplett ein und setzt auf Business-Tools

OpenAI stellt seine Video-KI Sora ein. Das Unternehmen richtet sich strategisch neu aus und will sich künftig auf Business- und Programmierwerkzeuge konzentrieren. Berber Jin berichtet für das Wall Street Journal, dass CEO Sam Altman die Entscheidung intern bekannt gegeben hat. Von der Einstellung betroffen sind die Verbraucher-App, eine Entwicklerversion der Plattform sowie die Videofunktion in …

Weiterlesen …

Nvidia bringt mit NemoClaw Sicherheitskontrollen für KI-Agenten

Nvidia hat NemoClaw vorgestellt, einen Software-Stack, der sich in OpenClaw integriert. OpenClaw ist eine Plattform für autonome KI-Agenten und eines der am schnellsten gewachsenen Open-Source-Projekte der letzten Zeit. Die Ankündigung erfolgte auf Nvidias jährlicher GTC-Konferenz in San Jose. NemoClaw ersetzt OpenClaw nicht. Die Software funktioniert als unternehmenstaugliche Distribution der Plattform. Sie lässt sich mit einem …

Weiterlesen …

Manus „My Computer“: KI-Agent arbeitet jetzt auf lokalen Computern

Der KI-Agent Manus kann ab sofort direkt auf dem Computer seiner Nutzer arbeiten. Das Unternehmen erklärt die neue Funktion „My Computer“ in einem offiziellen Post. Sie ist Teil der Manus-Desktop-Anwendung und ermöglicht dem Agenten den Zugriff auf lokale Dateien, Anwendungen und Entwicklungswerkzeuge über Terminal-Befehle. Bisher arbeitete Manus ausschließlich in einer Cloud-basierten Sandbox-Umgebung. Diese bot zwar …

Weiterlesen …