Das KI-Unternehmen Anthropic hat ein Testprogramm für eine neue Browser-Erweiterung seiner KI Claude gestartet. Die Erweiterung für Chrome ermögliche es der KI, Webseiten zu bedienen und im Auftrag von Nutzern Aktionen wie Klicks oder das Ausfüllen von Formularen auszuführen. Dies gab das Unternehmen in einem offiziellen Beitrag bekannt.
Anthropic betont, dass diese Funktion erhebliche Sicherheitsrisiken birgt. Als größte Gefahr nennt das Unternehmen sogenannte „Prompt-Injection-Angriffe“. Dabei verstecken Angreifer schädliche Befehle auf Webseiten, um die KI unbemerkt zu unerwünschten Handlungen zu manipulieren.
Interne Tests zeigten laut Anthropic eine Erfolgsquote solcher Angriffe von 23,6 Prozent, bevor Schutzmaßnahmen ergriffen wurden. Als Beispiel nannte das Unternehmen einen Fall, in dem die KI dazu gebracht wurde, die E-Mails eines Nutzers zu löschen.
Als Gegenmaßnahme hat Anthropic mehrere Sicherheitsfunktionen eingeführt. Dazu gehören Berechtigungen für einzelne Webseiten und eine Bestätigungspflicht für heikle Aktionen wie Käufe oder das Teilen persönlicher Daten. Mit diesen Vorkehrungen sei die Erfolgsquote der Angriffe auf 11,2 Prozent gesenkt worden.
Das Pilotprogramm mit zunächst 1.000 Nutzern soll nun reale Daten liefern, um die Sicherheit weiter zu verbessern. Ziel ist es, die Risiken vor einer möglichen allgemeinen Veröffentlichung weiter zu minimieren.