OpenAI GPT-5.5 bringt verbesserte Agentenfunktionen und mehr

OpenAI hat GPT-5.5 angekündigt, sein neuestes großes Sprachmodell. Das Unternehmen bezeichnet es als wichtigen Schritt hin zu einer neuen Art, mit dem Computer zu arbeiten. Das Modell steht ab sofort Plus-, Pro-, Business- und Enterprise-Nutzern in ChatGPT und Codex zur Verfügung. Laut OpenAI ist GPT-5.5 darauf ausgelegt, sogenannte agentische Aufgaben zu übernehmen, bei denen das …

Weiterlesen …

Google Workspace Intelligence denkt mit und das in jeder App

Google hat Workspace Intelligence vorgestellt. Das KI-System verbindet Gemini mit Daten aus Gmail, Chat, Calendar, Drive, Docs, Sheets und Slides. Statt also nur auf das zu reagieren, was Nutzer in einen Prompt eingeben, kann Gemini jetzt automatisch auf E-Mails, Dateien, Chat-Verläufe und Kalendereinträge zugreifen, um kontextbezogene Antworten zu liefern. Laut Google baut Workspace Intelligence aus …

Weiterlesen …

ChatGPT Images 2.0: Das kann OpenAIs verblüffender Bildgenerator

OpenAI hat ChatGPT Images 2.0 veröffentlicht, eine neue Version seines KI-Bildgenerierungstools. Das Modell basiert auf einem neuen System namens GPT Image 2 und steht allen ChatGPT- und Codex-Nutzern zur Verfügung. OpenAI sieht als neue Kernfunktion „Thinking Capabilities“: die Fähigkeit, vor der Bildgenerierung im Web zu suchen. Zahlende Nutzer der Tarife Plus, Pro, Business und Enterprise …

Weiterlesen …

Google erweitert Deep Research mit Max-Variante für professionelle Analysen

Google stellt zwei neue Versionen seiner autonomen Recherche-Agenten vor. Die Systeme tragen die Namen Deep Research und Deep Research Max und sollen KI-gestützte Analyse zu einem zentralen Werkzeug in Unternehmen machen. Der offizielle Blogpost erklärt, dass die Technologie mit dem Modell Gemini 3.1 Pro einen Wandel vollziehe. Die Agenten entwickeln sich demnach von reinen Zusammenfassungswerkzeugen …

Weiterlesen …

Gemini generiert Bilder auf Basis persönlicher Daten und Google Photos

Google hat die Gemini-App aktualisiert. Sie kann jetzt Bilder auf Basis persönlicher Daten aus verknüpften Google-Diensten erstellen. Die Funktion verbindet Personal Intelligence mit dem Bildmodell Nano Banana 2 und optional mit der Google-Photos-Bibliothek der Nutzer. Bisher mussten Nutzer ausführliche Prompts schreiben und Referenzfotos manuell hochladen, um relevante Ergebnisse zu erhalten. Das kann mit dieser Funktion …

Weiterlesen …

Perplexity startet KI-Agent „Personal Computer“ für den Mac

Perplexity hat Personal Computer veröffentlicht, ein neues Feature, das die KI-Agenten-Software des Unternehmens direkt auf Mac-Computer bringt. Es handelt sich um eine Erweiterung von Perplexity Computer, das Perplexity als digitalen Allround-Mitarbeiter beschreibt, der komplette Workflows erstellen und ausführen kann. Personal Computer steht ab sofort für Abonnenten des Perplexity-Max-Tarifs bereit, der 200 US-Dollar pro Monat kostet. …

Weiterlesen …

Anthropic startet Claude Design für visuelle Prototypen

Anthropic hat Claude Design veröffentlicht, ein neues Produkt, mit dem Nutzer visuelle Inhalte per Texteingabe erstellen können. Das Werkzeug erzeugt Designs, interaktive Prototypen, Präsentationen, einseitige Übersichten und Marketingmaterial. Es steht zahlenden Claude-Abonnenten (Pro, Max, Team und Enterprise) als Research Preview zur Verfügung und wird schrittweise freigeschaltet. Claude Design basiert auf Claude Opus 4.7, dem aktuell …

Weiterlesen …

Anthropic veröffentlicht Claude Opus 4.7

Anthropic hat Claude Opus 4.7 veröffentlicht, das bisher leistungsstärkste öffentlich verfügbare KI-Modell des Unternehmens. Laut Anthropic übertrifft das Modell seinen Vorgänger Claude Opus 4.6 in den Bereichen Softwareentwicklung, Dokumentenanalyse und Bildverarbeitung. Ein zentrales Merkmal ist die Fähigkeit zur Selbstüberprüfung. Bei internen Tests entwickelte Opus 4.7 eigenständig eine Text-zu-Sprache-Software in der Programmiersprache Rust und prüfte das …

Weiterlesen …

Googles neue Sprach-KI kannst du steuern wie ein Regisseur beim Film

Google hat Gemini 3.1 Flash TTS veröffentlicht, ein neues Text-to-Speech-Modell. Das Unternehmen bezeichnet es als sein bisher natürlichstes und ausdrucksstärkstes Modell dieser Art. Es ist als Vorschauversion über die Gemini API, Google AI Studio, Vertex AI für Unternehmenskunden sowie Google Vids für Workspace-Nutzer verfügbar. Das Modell unterstützt mehr als 70 Sprachen und kann Gespräche zwischen …

Weiterlesen …

Chromes neue Skills-Funktion automatisiert KI-Aufgaben

Google hat eine neue Funktion namens Skills im Chrome-Browser eingeführt. Sie erlaubt es, AI-Prompts zu speichern und mit einem einzigen Klick erneut auszuführen. Die Funktion ist über die Gemini-Seitenleiste in Chrome auf dem Desktop verfügbar. Bisher mussten Nutzer denselben Prompt jedes Mal neu eingeben, wenn sie ihn auf einer anderen Seite verwenden wollten. Skills entfernt …

Weiterlesen …

×