Anthropics neueste KI-Funktion Computer Use kann bei der Interaktion mit Computern bemerkenswerte Fähigkeiten zeigen, wie ein praktischer Test von Thariq Shihipar ergab. Obwohl das System noch langsam, unzuverlässig und anfällig dafür ist, die volle Kontrolle über den Computer des Nutzers zu übernehmen, stellt es nach seinen Worten einen spannenden Schritt nach vorn bei der KI-gesteuerten Computerinteraktion dar. Claude Computer Use glänzt beim Lesen von Bildschirminhalten, bei der Navigation, bei Funktionsaufrufen und bei der schrittweisen Aufgabenausführung, hat jedoch Schwierigkeiten zu erkennen, wann der Bildschirm gelesen werden soll, zusätzliche Daten abzurufen, sich den aktuellen Stand zu merken und durch Modals und Popups zu navigieren.
Um die Leistung zu optimieren, schlägt der Autor vor, der KI so viele Informationen über den Systemzustand wie möglich zur Verfügung zu stellen, ihre Abhängigkeit von der visuellen Wahrnehmung zu minimieren und eine Möglichkeit zu entwickeln, wie die KI mit Unsicherheit umgehen kann. Trotz seiner Einschränkungen wird Claude Computer Use als bedeutender Meilenstein in der Entwicklung eines echten KI-Agentenverhaltens angesehen, mit dem Potenzial für weitere Fortschritte in der Zukunft.
