Claude Fable 5 und Mythos 5: USA heben Exportbeschränkungen auf

Die Trump-Regierung hat die Exportbeschränkungen für Anthropics KI-Modelle Fable 5 und Mythos 5 aufgehoben. Damit endet eine 18-tägige Unterbrechung, die Nutzern weltweit den Zugang zu beiden Modellen verwehrt hatte. Handelsminister Howard Lutnick teilte Anthropic mit, dass das Unternehmen keine Exportlizenz mehr benötigt. Bedingung: Anthropic muss Sicherheitsrisiken proaktiv erkennen, künftige Modellveröffentlichungen mit der Regierung abstimmen und schädliche Aktivitäten melden.

Fable 5 ist ab heute, dem 1. Juli, wieder auf Claude.ai, Claude Code und anderen Anthropic-Plattformen verfügbar. Mythos 5 war bereits am 26. Juni für eine begrenzte Gruppe US-amerikanischer Organisationen wieder zugänglich gemacht worden.

Ausgelöst hatte die Beschränkungen ein Bericht von Amazon-Forschern. Sie hatten am 12. Juni eine Methode entdeckt, mit der sich die Sicherheitsmechanismen von Fable 5 umgehen lassen. Das Modell identifizierte dabei Software-Schwachstellen und lieferte in einem Fall Code, der zeigte, wie eine dieser Schwachstellen ausgenutzt werden könnte. Anthropic betont, dass mehrere schwächere Modelle, darunter GPT-5.5 und Claude Opus 4.8, dieselben Ausgaben erzeugen konnten. Einzigartige gefährliche Fähigkeiten seien demnach nicht freigeschaltet worden.

Ein gemeinsamer Rahmen für KI-Jailbreaks

Anthropic hat inzwischen einen verbesserten Sicherheitsklassifikator entwickelt, der die beschriebene Umgehungsmethode in über 99 Prozent der Fälle blockiert. Das Unternehmen räumt ein, dass dabei auch harmlose Anfragen häufiger abgelehnt werden können, etwa beim normalen Programmieren oder Debuggen. Diese Fehlalarme sollen mit der Zeit reduziert werden.

Darüber hinaus arbeitet Anthropic gemeinsam mit Amazon, Microsoft, Google und weiteren Partnern an einem branchenweiten Bewertungsrahmen für sogenannte Jailbreaks. Als Jailbreak bezeichnet man Techniken, mit denen sich die Sicherheitsmechanismen eines KI-Modells gezielt aushebeln lassen. Der geplante Rahmen soll den Schweregrad solcher Angriffe anhand von vier Kriterien einordnen:

Fähigkeitsgewinn: Werden durch den Jailbreak Fähigkeiten freigeschaltet, die über bestehende Tools hinausgehen?
Reichweite: Funktioniert dieselbe Technik für viele verschiedene schädliche Zwecke?
Angriffspotenzial: Wie viel Aufwand ist nötig, um den Jailbreak in einen echten Angriff umzuwandeln?
Auffindbarkeit: Ist die Technik bereits öffentlich bekannt oder schwer zu finden?

Zusätzlich verpflichtet sich Anthropic, Regierungspartnern vor breiten Modellveröffentlichungen frühzeitig Zugang zu neuen Frontier-Modellen zu gewähren. Bedrohungsanalysen sollen künftig vorab mit zuständigen Behörden geteilt werden. Anthropic erklärt, diese Schritte könnten langfristig die Grundlage für eine verbindliche branchenweite Regulierung bilden.

Quellen

Redeploying Claude Fable 5 – Anthropic
Trump lifts limits on Anthropic’s Fable and Mythos models – Politico

Claude Fable 5 und Mythos 5: USA heben Exportbeschränkungen auf

Ein gemeinsamer Rahmen für KI-Jailbreaks

Quellen

Mehr zum Thema:

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Mehr Informationen

Ein gemeinsamer Rahmen für KI-Jailbreaks

Quellen

Bleib auf dem Laufenden

Mehr zum Thema:

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Mehr Informationen