Die Trump-Regierung hat die Exportbeschränkungen für Anthropics KI-Modelle Fable 5 und Mythos 5 aufgehoben. Damit endet eine 18-tägige Unterbrechung, die Nutzern weltweit den Zugang zu beiden Modellen verwehrt hatte. Handelsminister Howard Lutnick teilte Anthropic mit, dass das Unternehmen keine Exportlizenz mehr benötigt. Bedingung: Anthropic muss Sicherheitsrisiken proaktiv erkennen, künftige Modellveröffentlichungen mit der Regierung abstimmen und schädliche Aktivitäten melden.
Fable 5 ist ab heute, dem 1. Juli, wieder auf Claude.ai, Claude Code und anderen Anthropic-Plattformen verfügbar. Mythos 5 war bereits am 26. Juni für eine begrenzte Gruppe US-amerikanischer Organisationen wieder zugänglich gemacht worden.
Ausgelöst hatte die Beschränkungen ein Bericht von Amazon-Forschern. Sie hatten am 12. Juni eine Methode entdeckt, mit der sich die Sicherheitsmechanismen von Fable 5 umgehen lassen. Das Modell identifizierte dabei Software-Schwachstellen und lieferte in einem Fall Code, der zeigte, wie eine dieser Schwachstellen ausgenutzt werden könnte. Anthropic betont, dass mehrere schwächere Modelle, darunter GPT-5.5 und Claude Opus 4.8, dieselben Ausgaben erzeugen konnten. Einzigartige gefährliche Fähigkeiten seien demnach nicht freigeschaltet worden.
Ein gemeinsamer Rahmen für KI-Jailbreaks
Anthropic hat inzwischen einen verbesserten Sicherheitsklassifikator entwickelt, der die beschriebene Umgehungsmethode in über 99 Prozent der Fälle blockiert. Das Unternehmen räumt ein, dass dabei auch harmlose Anfragen häufiger abgelehnt werden können, etwa beim normalen Programmieren oder Debuggen. Diese Fehlalarme sollen mit der Zeit reduziert werden.
Darüber hinaus arbeitet Anthropic gemeinsam mit Amazon, Microsoft, Google und weiteren Partnern an einem branchenweiten Bewertungsrahmen für sogenannte Jailbreaks. Als Jailbreak bezeichnet man Techniken, mit denen sich die Sicherheitsmechanismen eines KI-Modells gezielt aushebeln lassen. Der geplante Rahmen soll den Schweregrad solcher Angriffe anhand von vier Kriterien einordnen:
- Fähigkeitsgewinn: Werden durch den Jailbreak Fähigkeiten freigeschaltet, die über bestehende Tools hinausgehen?
- Reichweite: Funktioniert dieselbe Technik für viele verschiedene schädliche Zwecke?
- Angriffspotenzial: Wie viel Aufwand ist nötig, um den Jailbreak in einen echten Angriff umzuwandeln?
- Auffindbarkeit: Ist die Technik bereits öffentlich bekannt oder schwer zu finden?
Zusätzlich verpflichtet sich Anthropic, Regierungspartnern vor breiten Modellveröffentlichungen frühzeitig Zugang zu neuen Frontier-Modellen zu gewähren. Bedrohungsanalysen sollen künftig vorab mit zuständigen Behörden geteilt werden. Anthropic erklärt, diese Schritte könnten langfristig die Grundlage für eine verbindliche branchenweite Regulierung bilden.
Quellen
- Redeploying Claude Fable 5 – Anthropic
- Trump lifts limits on Anthropic’s Fable and Mythos models – Politico
Bleib auf dem Laufenden
KI für Contentprofis: die neuesten Tools, Tipps und Trends. Alle 14 Tage in deine Inbox:
