Microsoft Agent Mode automatisiert Office-Aufgaben

Microsoft hat den Agent Mode für Excel und Word sowie Office Agent im Copilot-Chat eingeführt und damit die KI-Funktionen seiner Produktivitätssoftware deutlich erweitert. Das Unternehmen nennt diesen Ansatz „vibe working“ und vergleicht ihn mit „vibe coding“, bei dem Nutzer durch einfache Prompts komplexe Ergebnisse erstellen können. Der Agent Mode ist eine leistungsfähigere Version der bestehenden …

Weiterlesen …

Claude Sonnet 4.5 kann länger denn je autonom arbeiten

Anthropic har Claude Sonnet 4.5 vorgestellt, ein KI-Modell, das bis zu 30 Stunden autonom an komplexen Aufgaben arbeiten kann. Das Unternehmen demonstrierte diese Fähigkeit, indem das Modell eine Chat-Anwendung ähnlich Slack erstellte und dabei 11.000 Zeilen Code produzierte, bevor es nach Aufgabenabschluss stoppte. Das neue Modell ist eine erhebliche Verbesserung gegenüber Anthropics vorherigem Opus 4 …

Weiterlesen …

Meta startet Vibes, einen neuen Feed für KI-generierte Videos

Meta hat eine neue Funktion namens Vibes vorgestellt. Es ist ein Feed, in dem Nutzer durch künstliche Intelligenz generierte Kurzvideos erstellen und teilen können. Nach Angaben des Unternehmens wird die Funktion in der Meta AI App und auf der Website meta.ai eingeführt. Vibes präsentiert den Nutzern einen Feed mit KI-generierten Videos, die als Inspiration dienen …

Weiterlesen …

Google aktualisiert Gemini 2.5 Flash für Entwickler und App-Nutzer

Google hat Updates für seine Modelle Gemini 2.5 Flash und Flash-Lite vorgestellt. Die Verbesserungen betreffen sowohl die öffentliche Gemini-App als auch neue Preview-Versionen für Entwickler. Einem Bericht von 9to5Google zufolge werden Nutzer der Gemini-App mehrere Verbesserungen am Modell Gemini 2.5 Flash feststellen. Antworten sind nun durch eine bessere Formatierung besser organisiert und nutzen Elemente wie …

Weiterlesen …

OpenAI stellt ChatGPT Pulse für personalisierte, proaktive Updates vor

OpenAI hat eine Preview-Version der neuen mobilen Funktion ChatGPT Pulse für seine Pro-Abonnenten gestartet. Diese Funktion wandelt den Chatbot von einem reinen Frage-Antwort-Werkzeug zu einem Assistenten, der proaktiv personalisierte Informationen liefert. Laut der Ankündigung des Unternehmens recherchiert Pulse Themen, die es für den Nutzer als relevant einstuft. Dieser Prozess basiert auf einer Analyse des Chat-Verlaufs, …

Weiterlesen …

Ehemalige Google-Entwickler veröffentlichen Audio-App Huxe

Drei frühere Entwickler von Googles Projekt NotebookLM haben die Audio-App Huxe veröffentlicht. Sie generiert Podcasts mit KI-Moderatoren zu Nachrichten und Sachthemen. Ivan Mehta berichtet für TechCrunch, dass das Startup 4,6 Millionen US-Dollar an Finanzierung erhalten hat. Die App ist für iOS und Android verfügbar und erstellt ein tägliches Briefing basierend auf E-Mails und Kalendereinträgen. Nutzer …

Weiterlesen …

Neues KI-Modell Qwen3-VL soll sehen, verstehen und handeln

Das QwenTeam hat eine neue Serie quelloffener Vision-Language-Modelle namens Qwen3-VL veröffentlicht. Laut der offiziellen Ankündigung sollen die Modelle nicht nur Bilder und Videos erkennen, sondern auch Kontexte verstehen, logisch schlussfolgern und Aktionen ausführen. Das Spitzenmodell der Reihe, Qwen3-VL-235B-A22B, wird in zwei Versionen angeboten. Die Entwickler berichten, dass die „Instruct“-Version in wichtigen Tests zur visuellen Wahrnehmung …

Weiterlesen …

Luma AI und Adobe stellen das neue KI-Videomodell Ray3 vor

Das KI-Unternehmen Luma AI kooperiert mit Adobe, um sein neues Videomodell Ray3 zu veröffentlichen. Das Modell ist ab sofort für Kunden der Adobe-App Firefly verfügbar, wie Steven Zeitchik für den Hollywood Reporter berichtet. Die Partnerschaft soll Kreativen und Filmemachern ermöglichen, realistische Videos in Kinoqualität aus Textbefehlen zu erstellen und so Produktionskosten zu senken. Der CEO …

Weiterlesen …

Google integriert seine KI Gemini in den Chrome-Browser

Google hat ein umfassendes Update für seinen Chrome-Browser vorgestellt, das sein KI-Modell Gemini integriert, um eine Reihe neuer Funktionen bereitzustellen. Laut einem offiziellen Blog-Post des Unternehmens soll das Surfen im Internet dadurch produktiver und sicherer werden. Ein Bericht des Magazins Wired merkt an, dass dieser Schritt entscheidend dazu beiträgt, das Konzept des „AI-Browsers“ massentauglich zu …

Weiterlesen …

Qwen3-Omni ist ein Open-Source-Modell für Text, Bild, Audio und Video

Das chinesische Technologieunternehmen Alibaba hat Qwen3-Omni veröffentlicht. Es ist ein neues generatives KI-Modell, das eine Kombination aus Text, Bildern, Audio und Video verarbeiten kann. Das Modell zeichnet sich durch seine „omni-modalen“ Fähigkeiten und seine Open-Source-Lizenz aus. Damit positioniert es sich als direkter Konkurrent zu proprietären Modellen von US-Technologiekonzernen wie OpenAI und Google. Nach von Alibaba …

Weiterlesen …