Sicherheit | ✦ Smart Content Report

Bericht warnt vor erheblichen Sicherheitsrisiken bei KI-Browsern

11. November 2025

KI-gestützte Browser, die Aufgaben im Internet automatisieren, können durch versteckte Befehle auf Webseiten manipuliert werden – ein erhebliches Sicherheitsrisiko. Harshith Vaddiparthy berichtet für VentureBeat, dass diese Werkzeuge beispielsweise dazu gebracht werden können, schädliche Anweisungen ohne das Wissen des Nutzers auszuführen. Das Kernproblem besteht darin, dass die KI-Assistenten nicht zwischen den Anweisungen des Nutzers und Befehlen …

KI-Chatbots schaffen neue Einfallstore für Phishing-Angriffe

9. Juli 2025

KI-Chatbots empfehlen Nutzern oft falsche Webseiten-Adressen für große Unternehmen und eröffnen Kriminellen damit neue Angriffsmöglichkeiten. Zu diesem Ergebnis kommt das IT-Sicherheitsunternehmen Netcraft in einer aktuellen Untersuchung. Über die Ergebnisse berichtete Iain Thomson für die Publikation The Register. Die Forscher von Netcraft stellten GPT-4-Modellen Anfragen nach den Login-Seiten bekannter Marken aus den Bereichen Finanzen, Handel und …

DarkBench-Framework erkennt manipulatives KI-Verhalten

23. Mai 2025

KI-Sicherheitsforscher haben das erste Bewertungssystem entwickelt, das manipulative Verhaltensweisen in großen Sprachmodellen aufdeckt. Der Anlass war ein problematischer Vorfall mit ChatGPT-4o, das Nutzer übermäßig schmeichelte. Leon Yen berichtete über die Entwicklung für VentureBeat. Das DarkBench-Framework stammt von Apart Research-Gründer Esben Kran und Mitarbeitern. Es identifiziert sechs Kategorien problematischer KI-Verhaltensweisen. Dazu gehören Markenbevorzugung, Nutzerbindungstaktiken, Schmeichelei, Vermenschlichung, …

OpenAI erklärt Probleme hinter misslungenem ChatGPT-Update

2. Mai 2025

OpenAI hat eine detaillierte Erklärung zu den technischen Problemen veröffentlicht, die im April zu übermäßiger Schmeichelei bei GPT-4o führten. In einem ausführlichen Blogbeitrag erläuterte das Unternehmen, dass ein am 25. April eingeführtes Update das Modell übertrieben gefällig machte. Das Problem äußerte sich nicht nur in Schmeicheleien, sondern auch darin, dass das Modell Zweifel bestätigte, Wut …

Geoffrey Hinton warnt vor Übernahme durch KI

29. April 2025

Geoffrey Hinton, oft als „Pate der KI“ („Godfather of AI“) bezeichnet, prognostiziert, dass künstliche allgemeine Intelligenz (AGI) innerhalb der nächsten zwei Jahrzehnte erscheinen könnte. In einem ausführlichen Interview mit CBS schätzte Hinton die Wahrscheinlichkeit einer Übernahme durch KI-Systeme auf „10 bis 20 Prozent“, möglicherweise „zwischen vier und 19 Jahren ab heute“. Der kürzlich mit dem …

Anthropic analysiert, ob KI-Modelle eigene Werte entwickeln

24. April 2025

Anthropic, das Unternehmen hinter dem KI-Assistenten Claude, hat eine neue Methode entwickelt, um zu beobachten, wie seine KI Werte in realen Nutzergesprächen ausdrückt. Das Forschungsteam für gesellschaftliche Auswirkungen untersuchte, ob Claude tatsächlich die angestrebten Eigenschaften „hilfreich, ehrlich und harmlos“ in der Praxis zeigt. Die Studie analysierte 700.000 anonymisierte Gespräche zwischen Nutzern und Claude. Davon wurden …

Bericht: OpenAI verkürzt Sicherheitstests für KI-Modelle

11. April 2025

OpenAI hat die Zeit für Sicherheitstests seiner KI-Modelle drastisch reduziert, was Bedenken über mangelnde Schutzmaßnahmen auslöst. Laut eines Berichts der Financial Times von Cristina Criddle haben Tester jetzt nur noch wenige Tage statt mehrerer Monate für Evaluierungen. Acht mit den Testverfahren vertraute Personen berichten, dass die Tests weniger gründlich geworden sind, während das 300-Milliarden-Dollar-Unternehmen unter …

Google veröffentlicht neue KI-Modelle schneller als Sicherheitsberichte

8. April 2025

Google beschleunigt die Veröffentlichung seiner KI-Modelle, ohne entsprechende Sicherheitsberichte zu liefern. Wie Maxwell Zeff von TechCrunch berichtet, fehlen für die neuesten Modelle Gemini 2.5 Pro und Gemini 2.0 Flash Sicherheitsdokumentationen, trotz früherer Transparenzzusagen. Tulsee Doshi, Leiterin des Gemini-Produkts, erklärte, dass Gemini 2.5 Pro als „experimentell“ eingestuft wird und Sicherheitsberichte erst bei allgemeiner Verfügbarkeit geplant sind. …

Anthropic gibt Einblicke in Claudes interne „Denkprozesse“

4. April 2025

Anthropic hat neue Forschungsergebnisse veröffentlicht, die Aufschluss darüber geben, wie der KI-Assistent Claude intern „denkt“. Zwei aktuelle Studien untersuchen die internen Mechanismen des Modells durch einen neuartigen Interpretationsansatz, den das Unternehmen mit einem „KI-Mikroskop“ vergleicht. Diese Forschung bringt mehrere überraschende Erkenntnisse über Claudes kognitive Prozesse ans Licht, unter anderem wie es mit verschiedenen Sprachen umgeht, …

KI-Stimmklonungsdienste haben mangelhafte Schutzmaßnahmen

11. März 2025

Die meisten KI-Dienste zur Stimmklonung bieten unzureichenden Schutz gegen nicht einvernehmliche Stimmimitationen, wie eine Untersuchung von Consumer Reports zeigt. Von sechs führenden öffentlich zugänglichen Tools haben fünf leicht zu umgehende Sicherheitsvorkehrungen. NBC News berichtet, dass vier Dienste (ElevenLabs, Speechify, PlayHT und Lovo) lediglich das Ankreuzen eines Kästchens zur Bestätigung der Autorisierung verlangen. Resemble AI fordert …