KI-Modelle können sich durch Debatte der Wahrheit annähern

Zwei aktuelle Studien liefern erste empirische Belege dafür, dass Debatten zwischen KI-Modellen einem menschlichen oder maschinellen Richter helfen können, die Wahrheit zu erkennen, berichtet Nash Weerasekera für Quanta Magazine. Bei diesem Ansatz präsentieren zwei Expertenmodelle Argumente zu einer Frage, woraufhin ein weniger informierter Richter entscheidet, welche Seite Recht hat. In Experimenten von Anthropic und Google …

Weiterlesen …

Anthropic kooperiert mit Palantir und AWS, um Claude KI für US-Verteidigung bereitzustellen

Anthropic gibt eine Zusammenarbeit mit Palantir und Amazon Web Services (AWS) bekannt, berichtet TechCrunch. Ziel ist es, US-Geheimdiensten und Verteidigungsbehörden Zugang zu Anthropics Claude KI-Modellen zu ermöglichen. Die Partnerschaft erlaubt die Nutzung von Claude innerhalb von Palantirs akkreditierter Plattform Impact Level 6 (IL6). IL6 verarbeitet Daten, die für die nationale Sicherheit von entscheidender Bedeutung sind. …

Weiterlesen …

Anthropic bringt Claude-Apps für Desktop und Diktierfunktion

Anthropic hat Desktop-Apps für Mac und Windows für seinen KI-Chatbot Claude veröffentlicht, berichtet TechCrunch. Die Apps sind in öffentlicher Beta-Version für kostenlose und Premium-Nutzer verfügbar. Zusätzlich führte Anthropic ein Diktierwerkzeug ein, mit dem Nutzer Sprachnachrichten von bis zu 10 Minuten Länge hochladen können, die Claude transkribiert und beantwortet. Diese Funktion ist jedoch noch nicht in …

Weiterlesen …

Anthropic veröffentlicht Claude 3.5 Haiku mit höheren Preisen

Das Unternehmen Anthropic hat sein neuestes und kleinstes KI-Modell Claude 3.5 Haiku veröffentlicht. Laut Anthropic übertrifft es das vorherige Flaggschiff-Modell Claude 3 Opus bei verschiedenen Benchmarks zu einem niedrigeren Preis. Allerdings hat Anthropic die Preise für Claude 3.5 Haiku erhöht, um die verbesserten Fähigkeiten widerzuspiegeln. Eingabe-Token kosten jetzt 1 Dollar pro Million und Ausgabe-Token 5 …

Weiterlesen …

Anthropic fordert gezielte KI-Regulierung

KI-Startup Anthropic, bekannt für seinen Assistenten Claude, drängt Regierungen dazu, innerhalb der nächsten 18 Monate Maßnahmen zur KI-Regulierung zu ergreifen. Ziel sei es, die wachsenden Risiken durch immer leistungsfähigere KI-Systeme einzudämmen, heißt es in einem Artikel auf der offiziellen Website des Unternehmens. Das Unternehmen argumentiert, dass eine eng fokussierte Regulierung dazu beitragen kann, die Vorteile …

Weiterlesen …

Claude Computer Use verwundbar für Fernzugriff durch Prompt Injection

Das von Anthropic veröffentlichte Feature Claude Computer Use erlaubt es der KI Claude, einen Computer fernzusteuern. Dabei nutzt sie Screenshots zur Entscheidungsfindung und kann Bash-Kommandos ausführen. Ein Post auf „Embrace the Red“ demonstriert jedoch, dass dies auch erhebliche Sicherheitsrisiken birgt. Durch eine speziell gestaltete Webseite konnte der Autor Claude dazu bringen, Malware herunterzuladen und auszuführen. …

Weiterlesen …

Claudes neue „Computer Use“-Fähigkeiten ausprobiert

Anthropics neueste KI-Funktion Computer Use kann bei der Interaktion mit Computern bemerkenswerte Fähigkeiten zeigen, wie ein praktischer Test von Thariq Shihipar ergab. Obwohl das System noch langsam, unzuverlässig und anfällig dafür ist, die volle Kontrolle über den Computer des Nutzers zu übernehmen, stellt es nach seinen Worten einen spannenden Schritt nach vorn bei der KI-gesteuerten …

Weiterlesen …

„Computer Use“: Anthropics Claude kann jetzt deinen PC steuern

Anthropic hat eine aktualisierte Version seines KI-Modells Claude 3.5 Sonnet vorgestellt. Laut Unternehmensangaben kann das Modell nun Desktop-Anwendungen steuern und PC-Aufgaben ausführen. Dafür nutzt es eine neue „Computer Use“-API, die sich in der öffentlichen Beta-Phase befindet. Anthropic betont, dass die Technologie noch fehlerbehaftet sei und empfiehlt Entwicklern, zunächst nur risikoarme Aufgaben damit zu testen. Neben …

Weiterlesen …

Anthropic testet seine KI-Modelle auf Sabotage-Fähigkeiten

Anthropic hat neue Sicherheitsbewertungen für KI-Modelle entwickelt, die deren Fähigkeit zur Sabotage testen. In einem Blog-Post beschreibt das Unternehmen vier Testarten: „Human decision sabotage“, „Code sabotage“, „Sandbagging“ und „Undermining oversight“. Bei Human decision sabotage versuchen die Modelle, Menschen zu falschen Entscheidungen zu verleiten, ohne Verdacht zu erregen. Die Code sabotage testet, ob Modelle unbemerkt Fehler …

Weiterlesen …

Anthropic aktualisiert Sicherheitsrichtlinien für KI

Anthropic hat seine Sicherheitsrichtlinien für KI aktualisiert, um Missbrauch zu verhindern, berichtet VentureBeat-Autor Michael Nuñez. Die neuen „Capability Thresholds“ definieren Schwellenwerte für riskante Fähigkeiten von KI-Modellen, etwa im Bereich Biowaffen oder autonome KI-Forschung. Erreicht ein Modell einen solchen Schwellenwert, greifen zusätzliche Sicherheitsmaßnahmen. Die überarbeitete Richtlinie legt auch detailliertere Verantwortlichkeiten für einen „Responsible Scaling Officer“ fest, …

Weiterlesen …

×