OpenAI entwickelt neues Sicherheitssystem für KI-Modelle

5. Februar 202523. Dezember 2024 von SCR

OpenAI hat ein neues Sicherheitssystem namens „deliberative alignment“ für seine KI-Modelle entwickelt, berichtet Maxwell Zeff. Das System wurde in die neuen KI-Modelle o1 und o3 integriert. Die Technologie ermöglicht es den Modellen, vor jeder Antwort die Sicherheitsrichtlinien von OpenAI zu berücksichtigen. Dies geschieht in der Inferenzphase, nachdem ein Benutzer eine Anfrage gestellt hat. Die KI-Modelle prüfen automatisch relevante Teile der Sicherheitsrichtlinien, bevor sie Antworten generieren.

Tests zeigten eine deutliche Verringerung unangemessener Antworten während das System weiterhin legitime Fragen beantwortete. Das Unternehmen erstellte die Trainingsdaten synthetisch mit Hilfe eines KI-Modells zur Generierung von Beispielen und eines weiteren zur Bewertung. Das System übertraf in Sicherheitstests andere KI-Modelle wie GPT-4o, Gemini und Claude. OpenAI plant die Veröffentlichung von o3 mit diesen Sicherheitsfunktionen für 2025.

_{Über den Autor}

Der Autorname SCR steht für Inhalte, die mit KI-Hilfe erstellt wurden. Jeder Beitrag wird vor der Veröffentlichung kontrolliert und bearbeitet. Redaktionelle Verantwortung: Jan Tissler. Lies mehr darüber, wie diese Website entsteht und welche Prompts zum Einsatz kommen.

Mehr zum Thema:

Schlagwörter: o1, o3, OpenAI, Sicherheit

Bleib up-to-date:

Newsletter

RSS Feed

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Der aktuelle und umfassende Überblick für Marketing-Profis (2. Ausgabe, September 2025)

Der KI-Umbruch im Marketing ist in vollem Gange und ChatGPT steht als Plattform Nr. 1 im Zentrum. Aber wie behältst du den Überblick bei all den neuen Funktionen und Möglichkeiten? Wie setzt du ChatGPT wirklichgewinnbringend für deine Arbeit ein?

Der „ChatGPT-Kompass“ liefert dir einen fundierten, aktuellen und umfassenden Überblick über ChatGPT und seine Anwendungsmöglichkeiten im Marketing.

Mehr Informationen

Direkt beim Anbieter …

Bei Amazon …