Anthropic aktualisiert Sicherheitsrichtlinien für KI
Anthropic hat seine Sicherheitsrichtlinien für KI aktualisiert, um Missbrauch zu verhindern, berichtet VentureBeat-Autor Michael Nuñez. Die neuen „Capability Thresholds“ definieren Schwellenwerte für riskante Fähigkeiten von KI-Modellen, etwa im Bereich Biowaffen oder autonome KI-Forschung. Erreicht ein Modell einen solchen Schwellenwert, greifen zusätzliche Sicherheitsmaßnahmen. Die überarbeitete Richtlinie legt auch detailliertere Verantwortlichkeiten für einen „Responsible Scaling Officer“ fest, …