Anthropic hat zwei neue KI-Modelle veröffentlicht: Claude Fable 5 für die breite Öffentlichkeit und Claude Mythos 5 für einen kleinen Kreis geprüfter Partner. Beide basieren auf demselben Grundmodell, doch Fable 5 enthält Sicherheitsbeschränkungen, die Antworten in risikoreichen Bereichen blockieren. Es ist das erste Mal, dass Anthropic sein leistungsstärkstes Modell allgemein zugänglich macht.
Gleiches Modell, unterschiedlicher Zugang
Fable 5 und Mythos 5 teilen dieselbe technische Grundlage. Der Unterschied liegt darin, was die Modelle tun dürfen. Fable 5 enthält sogenannte Classifier: separate KI-Systeme, die eingehende Anfragen überwachen. Betreffen diese Anfragen Cybersicherheit, Biologie, Chemie oder Versuche, die Fähigkeiten des Modells zu kopieren, werden sie automatisch an Claude Opus 4.8 weitergeleitet. Das ist ein älteres und weniger leistungsfähiges Modell. Anthropic gibt an, dass diese Umleitung in weniger als fünf Prozent aller Sitzungen greift.
Mythos 5 hebt diese Einschränkungen in bestimmten Bereichen auf. Das Modell wird über Project Glasswing eingesetzt, eine Zusammenarbeit mit der US-Regierung, die im April gestartet ist. Derzeit ist der Zugang auf Cybersicherheitspartner und, ab heute, eine kleine Gruppe von Biologieforschern beschränkt. Anthropic bezeichnet Mythos 5 als das weltweit leistungsfähigste Modell im Bereich Cybersicherheit.
Diane Penn, Leiterin des Produktmanagements bei Anthropic, erklärte gegenüber WIRED, dass der Ansatz mit der Umleitung nach monatelangen Tests und Nutzerfeedback als praktikabelste Lösung herausgearbeitet worden sei. „Wir versuchen, Verbesserungen so voranzutreiben, dass sie nützlich sind, auch wenn wir von Anfang an nicht für jeden Anwendungsfall die perfekte Lösung haben“, sagte sie.
Was die Modelle leisten
Anthropic gibt an, dass Fable 5 alle bisher öffentlich verfügbaren Modelle des Unternehmens übertrifft. Besonders deutlich sei der Vorsprung bei langen und komplexen Aufgaben.
Im Bereich Softwareentwicklung berichtete das Zahlungsunternehmen Stripe, dass das Modell monatelange Arbeit auf wenige Tage komprimiert habe. Eine Migration in einer Codebasis mit 50 Millionen Zeilen Quellcode soll in einem einzigen Tag abgeschlossen worden sein. Stripe schätzte, dass ein komplettes Team dafür über zwei Monate benötigt hätte.
Bei visuellen Aufgaben kann Fable 5 den Quellcode einer Webanwendung allein aus Screenshots rekonstruieren. Außerdem hat es das Videospiel Pokémon Feuerrot nur anhand visueller Eingaben durchgespielt, ohne die zusätzlichen Hilfsmittel, auf die frühere Claude-Modelle angewiesen waren.
Mythos 5 zeigt besonders starke Ergebnisse in der wissenschaftlichen Arbeit. Das interne Protein-Design-Team von Anthropic berichtet, dass das Modell Teile des Wirkstoffdesigns um das Zehnfache beschleunigt habe. In einem Test übertraf Mythos 5 erfahrene menschliche Experten, ohne dabei menschliche Unterstützung zu erhalten. Neun von 14 untersuchten Proteinzielen lieferten brauchbare Kandidaten für die Wirkstoffforschung.
In der Genomik arbeitete Mythos 5 über eine Woche weitgehend eigenständig. Es sammelte Einzelzelldaten von Millionen Zellen aus 138 Tierarten und trainierte anschließend ein eigenes Machine-Learning-Modell. Anthropic zufolge übertraf das Ergebnis ein kürzlich in der Fachzeitschrift Science veröffentlichtes Modell, obwohl es hundertmal kleiner ist.
Anthropic behauptet außerdem, Mythos 5 sei das erste Modell, das regelmäßig neue und glaubwürdige wissenschaftliche Hypothesen generiere. In internen Blindvergleichen bevorzugten Forscher die molekularbiologischen Hypothesen von Mythos 5 gegenüber denen von Opus-Modellen in rund 80 Prozent der Fälle. Eine Hypothese zu einem Mechanismus in einem E.-coli-Protein wurde später von einer unabhängigen Forschungsgruppe bestätigt.
Sicherheitsmaßnahmen und Datenspeicherung
Anthropic hat die Klassifikatoren vor der Markteinführung umfassend durch Red-Teaming getestet. Ein externes Bug-Bounty-Programm ergab in mehr als 1.000 Teststunden keine universellen Jailbreaks. Externe Red-Teaming-Organisationen fanden ebenfalls keine universellen Jailbreaks, obwohl das UK AI Safety Institute in einem anfänglichen Testfenster teilweise Fortschritte machte.
Parallel zur Markteinführung führte Anthropic eine neue Richtlinie zur Datenaufbewahrung ein. Der gesamte Datenverkehr der Modelle der Mythos-Klasse wird 30 Tage lang gespeichert, selbst bei Geschäftskunden, die zuvor Vereinbarungen ohne Datenaufbewahrung hatten. Das Unternehmen gibt an, dass diese Daten nicht für das Training verwendet werden und nur dazu dienen, neuartige Angriffe zu erkennen und falsch-positive Ergebnisse der Klassifikatoren zu reduzieren.
Anthropic räumt ein, dass die Klassifikatoren derzeit konservativ eingestellt sind und manchmal harmlose Anfragen blockieren werden. Das Unternehmen plant nach eigenen Angaben, diese falsch-positiven Ergebnisse im Laufe der Zeit zu reduzieren.
Preise und Verfügbarkeit
Beide Modelle kosten 10 US-Dollar pro Million Input-Token und 50 US-Dollar pro Million Output-Token. Laut Anthropic ist dies weniger als die Hälfte des Preises der früheren Mythos Preview, aber in etwa das Doppelte der Kosten von Claude Opus 4.8.
Fable 5 ist ab sofort über die Claude-API und nutzungsbasierte Enterprise-Tarife verfügbar. Die Einführung für Abonnement-Tarife erfolgt schrittweise:
- Bis zum 22. Juni: Fable 5 ist ohne Aufpreis in den Tarifen Pro, Max, Team und den platzbasierten Enterprise-Tarifen enthalten.
- Ab dem 23. Juni: Der Zugang erfordert Nutzungsguthaben in diesen Tarifen.
- Später: Anthropic plant, Fable 5 wieder als Standardbestandteil von Abonnement-Tarifen anzubieten, sobald die Kapazitäten dies zulassen.
Mythos 5 bleibt vorerst auf Partner des Project Glasswing und ausgewählte Biologieforscher beschränkt. Anthropic plant nach eigenen Angaben, den Zugang durch ein breiteres Trusted-Access-Programm in Abstimmung mit der US-Regierung zu erweitern.
Quellen
- Claude Fable 5 and Claude Mythos 5 – Anthropic
- Anthropic releases Claude Fable 5 and Mythos 5 with major gains in coding and science – The Decoder
- Anthropic releases Claude Fable, a version of Mythos, days after warning AI is becoming too dangerous – TechCrunch
- Anthropic’s new Claude Fable 5 is the same base model as Mythos but with guardrails attached – ZDNET
- Anthropic Offers Mythos Upgrade for Cyber Partners and a ‚Safe‘ Version for the Rest of You – WIRED
Bleib auf dem Laufenden
KI für Contentprofis: die neuesten Tools, Tipps und Trends. Alle 14 Tage in deine Inbox:
