Microsoft Windows Agent Arena vorgestellt

Microsoft hat eine neue Plattform namens Windows Agent Arena (WAA) vorgestellt, um KI-Assistenten in realistischen Windows-Umgebungen zu testen. Das berichtet Michael Nuñez auf VentureBeat. WAA bietet über 150 verschiedene Aufgaben in gängigen Windows-Anwendungen und ermöglicht eine parallele Auswertung in der Azure-Cloud. Microsoft präsentierte auch einen neuen KI-Agenten namens Navi, der in Tests eine Erfolgsquote von … Weiterlesen …

Salesforce enthüllt Agentforce: KI-Agenten für Kundenservice und mehr

Salesforce hat nun offiziell Agentforce vorgestellt, eine bereits früher angekündigte Suite von KI-gestützten autonomen Agenten. Diese sollen menschliche Arbeitskräfte in verschiedenen Geschäftsbereichen wie Vertrieb, Marketing, Handel und Kundenservice unterstützen. Laut Salesforce-CEO Marc Benioff stellt Agentforce die „dritte Welle“ der KI dar und geht über Modelle für Trenderkennung sowie generative KI hinaus. Kernstück von Agentforce ist … Weiterlesen …

ServiceNow kündigt KI-Agenten für Unternehmen an

ServiceNow führt eine Bibliothek von anpassbaren KI-Agenten für Unternehmen ein. Das Unternehmen plant Updates für seine Now Assist KI-Plattform, die es Kunden ermöglichen, KI-Agenten in ihre Arbeitsabläufe zu integrieren. Wie Emilia David auf VentureBeat berichtet, können Unternehmen mit dem neuen Now Assist Skill Kit eigene Prompts und Fähigkeiten für die Agenten entwickeln. Die ersten zwei … Weiterlesen …

Replit Agent hilft beim Coden kompletter Anwendungen

Replit hat einen KI-Agenten eingeführt, der komplette Anwendungen von Grund auf erstellen kann. Wie Chris McKay in einem Beitrag für Maginative berichtet, geht es dabei um weit mehr als einen Coding-Assistenten. Der Agent kann selbstständig Software entwickeln, von der Projektplanung über das Schreiben von Code bis hin zum Debugging und Deployment. Laut Replit-CEO Amjad Masad … Weiterlesen …

Agenten

Aktuelle KI-Assistenten geben Antworten auf Fragen oder führen einfache, klar definierte Aufgaben durch. Sie werden aber nicht selbstständig tätig. Komplexere Aufträge benötigen zudem immer einen Menschen als steuernde Figur. KI-Agenten hingegen sollen selbst einen Lösungsweg finden und Ziele autonom oder halbautonom verfolgen. KI-Agenten verwenden Basismodelle für Sprache, Bilderkennung und mehr, um Anweisungen in natürlicher Sprache … Weiterlesen …

Studie zeigt Schwächen bei Benchmarks für KI-Agenten

Ein neuer Forschungsbericht der Princeton University enthüllt Schwächen in aktuellen Benchmarks und Bewertungspraktiken für KI-Agenten. Die Forscher bemängeln, dass die Kostenkontrolle bei der Bewertung oft vernachlässigt wird, obwohl der Ressourcenaufwand für KI-Agenten im Vergleich zu einzelnen Modellabfragen erheblich höher sein kann. Dies führe zu verzerrten Ergebnissen, da teure Agenten mit hoher Genauigkeit in Benchmarks besser abschneiden, … Weiterlesen …

Arios KI-Assistent hilft mit alltäglichen Aufgaben

Das Startup Ario entwickelt einen KI-gestützten persönlichen Assistenten, der Nutzern Aufgaben im Alltag abnehmen soll, indem er sich mit Apps wie Amazon, DoorDash und Google Kalender verbindet. Der Clou: Ario sammelt Nutzerdaten aus verschiedenen Quellen, um personalisierte Empfehlungen zu geben und Prozesse zu automatisieren. 

Selbst fortgeschrittene KI scheitert als Agent

Ein neuer Benchmark-Test von Sierra zeigt, dass selbst fortschrittliche Sprachmodelle wie GPT-4o bei komplexen Aufgaben in realistischen Szenarien noch Schwierigkeiten haben und eine Erfolgsquote von unter 50 Prozent erreichen. Der Test namens TAU-bench soll Entwicklern helfen, die Leistung von KI-Agenten in realitätsnahen Situationen zu bewerten, indem er Faktoren wie mehrfache Interaktionen und komplexe Aufgaben berücksichtigt.

Jace ist ein neuer KI-Agent

Die ehemalige Meta-Ingenieure Fryderyk Wiatrowski und Peter Albert haben einen KI-Agenten namens Jace entwickelt, der Aufgaben im Browser selbstständig erledigen soll wie etwa eine Hotelbuchung.

STORM schreibt tiefgründige Inhalte

STORM ist ein KI-System, das Wikipedia-ähnliche Artikel von Grund auf schreiben kann, indem es das Internet durchsucht und in einem zweistufigen Prozess zunächst einen Entwurf mit Gliederung und Referenzen erstellt und anschließend den vollständigen Artikel mit Zitaten. Quelle: Hacker News