Anthropic hat eine neue Forschungsarbeit veröffentlicht, die beleuchtet, wie grosse Sprachmodelle genau funktionieren. Dafür haben sie gezielt bestimmte Neuronen im Modell aktiviert, zum Beispiel für das Konzept der Golden Gate Bridge. In der Folge hat diese abgewandelte Version von Claude laufend die Golden Gate Bridge in Antworten eingeflochten, auch vollkommen zusammenhanglos. Diese Experimente dienen dazu, in Zukunft bestimmte Verhaltensweisen in KI-Sprachmodellen direkt zu beeinflussen.