Am 12. Juni 2026 hat die US-Regierung Anthropic per Anordnung dazu verpflichtet, den Zugang zu zwei seiner stärksten KI-Modelle, Fable 5 und Mythos 5, sofort und vollständig zu sperren. Berufungsgrundlage: Exportkontrollrecht und nationale Sicherheit. Betroffen sind alle ausländischen Staatsangehörigen, ob innerhalb oder außerhalb der USA, inklusive der ausländischen Anthropic-Mitarbeitenden selbst. Der praktische Effekt: Anthropic musste beide Modelle für sämtliche Kund:innen abschalten. Alle anderen Modelle bleiben verfügbar.

Was die Regierung beanstandet

Die Anordnung erreichte Anthropic am selben Tag um 17:21 Uhr (ET), ohne konkrete Angaben zu den Sicherheitsbedenken. Nach Anthropics Verständnis geht die Regierung davon aus, dass eine Methode entdeckt wurde, mit der sich die Schutzmechanismen von Fable 5 umgehen lassen (ein sogenannter „Jailbreak").

Anthropic hat eine Demonstration dieser Technik geprüft. Das Ergebnis: Damit ließen sich lediglich einige wenige, bereits bekannte und kleinere Schwachstellen identifizieren. Diese seien vergleichsweise simpel – und andere frei verfügbare Modelle könnten dieselben Lücken finden, ganz ohne Umgehung der Schutzmechanismen.

Anthropics „Defense in Depth"-Strategie

Anthropic verweist auf die eigene Sicherheitsarchitektur, wie sie schon beim Launch beschrieben wurde. Die Kernpunkte:

Die Schutzmechanismen seien so streng, dass sich viele Nutzer:innen sogar über zu weitreichende Sperren beschwert hätten. Vor dem Launch habe Anthropic gemeinsam mit der US-Regierung, dem britischen AISI, mehreren externen Organisationen und internen Teams die Schutzmechanismen über tausende Stunden hinweg im Red-Teaming getestet. Diese Tests hätten gezeigt, dass die Safeguards deutlich wirksamer seien als die jedes zuvor veröffentlichten Modells.

Entscheidend: Bislang habe kein Tester einen universellen Jailbreak gefunden,also eine Methode, die ein breites Spektrum an (etwa Cyber-)Fähigkeiten freischaltet. Anthropic geht davon aus, dass perfekte Jailbreak-Resistenz aktuell für keinen einzigen Anbieter möglich ist. Jeder branchenübliche Schutz ist anfällig für eng begrenzte, nicht-universelle Jailbreaks.

Genau deshalb setzt Anthropic auf eine gestaffelte Verteidigung („Defense in Depth"): Jailbreaks sollen entweder eng begrenzt oder sehr teuer in der Herstellung sein, kombiniert mit gründlichem Monitoring, um erfolgreiche Angriffe schnell zu erkennen und zu stoppen. Auch die verpflichtende 30-Tage-Speicherung von Kundendaten bei Fable dient laut Anthropic diesem Zweck: der Erforschung und Eindämmung von Jailbreaks.

Der konkrete Streitpunkt

Bis dato hat die Regierung nach Anthropics Darstellung nur mündliche Hinweise auf einen möglichen engen, nicht-universellen Jailbreak geliefert. Im Kern bestehe dieser darin, das Modell zu bitten, einen bestimmten Codebestand zu lesen und Softwarefehler zu beheben. Anthropic hat den vermutlich zugrunde liegenden Bericht geprüft und kommt zu dem Schluss: Das dort gezeigte Fähigkeitsniveau sei über andere Modelle, darunter OpenAIs GPT-5.5, breit verfügbar und werde täglich von genau jenen Verteidiger:innen genutzt, die Systeme absichern.

Anthropic widerspricht und entschuldigt sich

Anthropic befolgt die rechtliche Anordnung und entfernt den Zugang. Gleichzeitig widerspricht das Unternehmen deutlich: Der Fund eines engen, möglichen Jailbreaks sei kein hinreichender Grund, ein kommerzielles Modell zurückzurufen, das von hunderten Millionen Menschen genutzt wird. Würde dieser Maßstab branchenweit angelegt, käme nahezu jede neue Modellveröffentlichung zum Erliegen.

Anthropic betont, dass Regierungen unsichere Deployments durchaus blockieren können sollten, aber im Rahmen eines transparenten, fairen, klaren und technisch fundierten Verfahrens. Diese Maßnahme erfülle diese Prinzipien nicht. Das Unternehmen spricht von einem Missverständnis und arbeite daran, den Zugang so schnell wie möglich wiederherzustellen.