Googles neue Sprach-KI kannst du steuern wie ein Regisseur beim Film

Google hat Gemini 3.1 Flash TTS veröffentlicht, ein neues Text-to-Speech-Modell. Das Unternehmen bezeichnet es als sein bisher natürlichstes und ausdrucksstärkstes Modell dieser Art. Es ist als Vorschauversion über die Gemini API, Google AI Studio, Vertex AI für Unternehmenskunden sowie Google Vids für Workspace-Nutzer verfügbar. Das Modell unterstützt mehr als 70 Sprachen und kann Gespräche zwischen …

Weiterlesen …

Chromes neue Skills-Funktion automatisiert KI-Aufgaben

Google hat eine neue Funktion namens Skills im Chrome-Browser eingeführt. Sie erlaubt es, AI-Prompts zu speichern und mit einem einzigen Klick erneut auszuführen. Die Funktion ist über die Gemini-Seitenleiste in Chrome auf dem Desktop verfügbar. Bisher mussten Nutzer denselben Prompt jedes Mal neu eingeben, wenn sie ihn auf einer anderen Seite verwenden wollten. Skills entfernt …

Weiterlesen …

Gemini jetzt auf dem Mac: So funktioniert die neue Desktop-App

Google hat eine native Gemini-App für macOS veröffentlicht. Die App ist kostenlos für alle Gemini-Nutzer ab macOS 15 verfügbar und lässt sich unter gemini.google/mac herunterladen. Im Unterschied zur Browser-Version ist die Desktop-App jederzeit per Tastenkürzel erreichbar: Option + Space. Damit öffnet sich eine Eingabeleiste direkt auf dem Desktop, ohne dass Nutzer das Fenster oder den …

Weiterlesen …

Adobes neuer Firefly AI Assistant arbeitet in Photoshop, Premiere und mehr

Adobe hat den Firefly AI Assistant vorgestellt. Das neue Tool erlaubt es, mehrere Adobe-Creative-Cloud-Programme wie Photoshop, Premiere, Illustrator und Lightroom über eine einzige Oberfläche per Texteingabe zu steuern. Nutzer beschreiben ihr gewünschtes Ergebnis in eigenen Worten, und der Assistent führt die nötigen Schritte in den jeweiligen Programmen aus. Der Assistent basiert auf einem Forschungsprototyp namens …

Weiterlesen …

YouTube führt KI-Avatare für Shorts ein

YouTube ermöglicht es Nutzern, einen fotorealistischen KI-Avatar von sich selbst für Shorts zu erstellen. Abner Li berichtet für 9to5Google, dass das Tool sowohl das Aussehen als auch die Stimme der Nutzenden erfasst, um personalisierte Videoclips zu generieren. Für die Einrichtung nehmen Nutzer ein Live-Selfie auf und lesen einige Sätze laut vor. Dies geschieht in der …

Weiterlesen …

Claude Mythos: Wie gefährlich ist diese neue KI wirklich?

Anthropics neues KI-Modell Claude Mythos kann selbstständig Sicherheitslücken in nahezu allen wichtigen Softwaresystemen finden und ausnutzen. Wie ich bereits berichtet habe, steht Mythos derzeit nur einer kleinen Gruppe von Technologieunternehmen im Rahmen von Project Glasswing zur Verfügung. Zvi Mowshowitz schreibt in seinem Newsletter „Don’t Worry About The Vase“ darüber, was diese Fähigkeiten so beispiellos macht …

Weiterlesen …

Meta veröffentlicht proprietäres KI-Modell Muse Spark

Meta hat Muse Spark veröffentlicht, ein neues proprietäres KI-Modell seiner internen Abteilung Meta Superintelligence Labs. Das Modell ist über die Meta AI App und die Website verfügbar, mit einem privaten API-Zugang für ausgewählte Nutzer. Anders als Metas frühere Llama-Modelle ist Muse Spark kein Open-Source-Modell. Muse Spark verarbeitet Text und Bilder gemeinsam. Meta nennt diese Fähigkeit …

Weiterlesen …

Claude Cowork jetzt auch als Firmenlösung erhältlich

Anthropic bringt neue Verwaltungsfunktionen für Claude Cowork, sein KI-gestütztes Kollaborationswerkzeug. Ein Post im offiziellen Claude-Blog erklärt, dass das Update rollenbasierte Zugriffskontrollen, Teambudgets, erweiterte Überwachungsfunktionen und neue Nutzungsanalysen umfasst. Das Ziel ist der unternehmensweite Einsatz auf allen kostenpflichtigen Tarifen. Claude Cowork unterstützt Teams bei Aufgaben wie dem Erstellen von Projektunterlagen, der internen Koordination und der Durchführung …

Weiterlesen …

ChatGPT Pro ist jetzt für 100 Dollar pro Monat erhältlich

OpenAI hat eine neue Stufe seines ChatGPT Pro-Abonnements eingeführt. Sie kostet 100 Dollar pro Monat und richtet sich vor allem an Nutzer des KI-Programmierwerkzeugs Codex. Zac Hall berichtet für 9to5Mac, dass das neue Angebot zwischen dem bestehenden Plus-Abo für 20 Dollar und dem ursprünglichen Pro-Abo für 200 Dollar liegt. Letzteres bleibt weiterhin verfügbar. Das neue …

Weiterlesen …

Google führt „Notizbücher“ für Projekte in der Gemini-App ein

Google fügt der Gemini-App eine „Notizbuch“-Funktion hinzu. Nutzer erhalten damit einen festen Bereich, um Chats, Dateien und Dokumente zu einem Thema oder Projekt zu bündeln. Google bezeichnet Notizbücher als persönliche Wissensdatenbanken, die künftig in mehreren Google-Produkten verfügbar sein sollen. Ein Notizbuch lässt sich direkt über das Seitenpanel der Gemini-App erstellen. Darin können Nutzer Quellen hinzufügen, …

Weiterlesen …

×