Neuer Benchmark: Führende KI-Modelle produzieren selbstsicher falsche Informationen

Ein neuer Benchmark namens Phare zeigt, dass führende Large Language Models (LLMs) häufig falsche Informationen mit hoher Überzeugungskraft generieren, besonders bei der Verarbeitung von Fehlinformationen. Die von Giskard in Zusammenarbeit mit Partnern wie Google DeepMind durchgeführte Untersuchung bewertete die Top-Modelle von acht KI-Anbietern in mehreren Sprachen. Die Phare-Benchmark konzentriert sich auf vier kritische Bereiche: Halluzination, …

Weiterlesen …

Auch Forscher wissen nicht genau, wie KI-Sprachmodelle funktionieren

Wissenschaftler, die große Sprachmodelle entwickeln, stehen vor einem grundlegenden Problem: Sie verstehen nicht wirklich, wie diese KI-Systeme funktionieren. Dies berichtet James O’Brien in einem aktuellen Artikel für Quanta Magazine. Martin Wattenberg, Sprachmodellforscher an der Harvard University, vergleicht den Prozess mit dem Anbau einer Tomatenpflanze: Man schafft die Bedingungen für das Wachstum, versteht aber nicht die …

Weiterlesen …

Studie zeigt mögliche Bevorzugung großer KI-Anbieter durch LM Arena

Eine neue Studie von Forschern aus den Organisationen Cohere, Stanford, MIT und Ai2 wirft LM Arena vor, großen KI-Unternehmen Vorzugsbehandlung zu gewähren. Laut eines Berichts von Maxwell Zeff bei TechCrunch durften Firmen wie Meta, OpenAI, Google und Amazon mehrere Modellvarianten privat testen und nur die Ergebnisse der besten veröffentlichen. Die Forscher behaupten, Meta habe vor …

Weiterlesen …

KI unterstützt Wissenschaftler bei Entwicklung neuer Experimente

Künstliche Intelligenz wird zunehmend eingesetzt, um wissenschaftliche Experimente zu entwerfen und Entdeckungen voranzutreiben. Mario Krenn, ein Quantenphysiker und Leiter des Artificial Scientist Lab, entwickelte etwa das KI-Programm Melvin, das erfolgreich Quantenexperimente konzipierte, als menschliche Forscher keine Lösung fanden. Gregory Barber berichtet in Quanta Magazine, wie Krenns Erfahrung ihn dazu brachte, sich auf die Integration von …

Weiterlesen …

Google DeepMind-Forscher prognostizieren „Ära der Erfahrung“

Forscher von Google DeepMind sehen einen bedeutenden Wandel in der Entwicklung künstlicher Intelligenz voraus. David Silver und Richard S. Sutton nennen diese kommende Phase die „Ära der Erfahrung“. Sie beschreiben ihre Vision in einem Vorabdruck eines Buchkapitels für den Verlag MIT Press. Die Wissenschaftler argumentieren, dass aktuelle KI-Systeme, insbesondere große Sprachmodelle, an die Grenzen dessen …

Weiterlesen …

Anthropic analysiert, ob KI-Modelle eigene Werte entwickeln

Anthropic, das Unternehmen hinter dem KI-Assistenten Claude, hat eine neue Methode entwickelt, um zu beobachten, wie seine KI Werte in realen Nutzergesprächen ausdrückt. Das Forschungsteam für gesellschaftliche Auswirkungen untersuchte, ob Claude tatsächlich die angestrebten Eigenschaften „hilfreich, ehrlich und harmlos“ in der Praxis zeigt. Die Studie analysierte 700.000 anonymisierte Gespräche zwischen Nutzern und Claude. Davon wurden …

Weiterlesen …

Midjourney entwickelt Methoden für kreativere KI-Texte

Midjourney, bekannt für KI-Bildgenerierung, hat gemeinsam mit der New York University eine Forschungsarbeit veröffentlicht, die sich mit kreativeren Texten von Sprachmodellen befasst. Wie Carl Franzen für VentureBeat berichtet, stellt die Studie zwei neue Techniken vor: Diversified Direct Preference Optimization (DDPO) und Diversified Odds Ratio Preference Optimization (DORPO). Diese Methoden trainieren Sprachmodelle wie Meta’s Llama und …

Weiterlesen …

Anthropic gibt Einblicke in Claudes interne „Denkprozesse“

Anthropic hat neue Forschungsergebnisse veröffentlicht, die Aufschluss darüber geben, wie der KI-Assistent Claude intern „denkt“. Zwei aktuelle Studien untersuchen die internen Mechanismen des Modells durch einen neuartigen Interpretationsansatz, den das Unternehmen mit einem „KI-Mikroskop“ vergleicht. Diese Forschung bringt mehrere überraschende Erkenntnisse über Claudes kognitive Prozesse ans Licht, unter anderem wie es mit verschiedenen Sprachen umgeht, …

Weiterlesen …

Neue KI-Techniken versprechen Kosteneinsparungen und verbesserte Leistung für Unternehmen

Aktuelle Forschungsergebnisse haben zwei vielversprechende Ansätze aufgedeckt, die die Kosten für den Betrieb großer Sprachmodelle (LLMs) drastisch reduzieren und gleichzeitig ihre Leistung bei komplexen Denkaufgaben verbessern könnten. Diese Innovationen kommen zu einem kritischen Zeitpunkt, da Unternehmen zunehmend KI-Lösungen einsetzen, aber mit Rechenkosten kämpfen. Chain of draft: Weniger ist mehr Forscher bei Zoom Communications haben eine …

Weiterlesen …

Turing-Preis für Pioniere des Reinforcement Learning

Die Association for Computing Machinery hat Andrew Barto und Richard Sutton mit dem renommierten Turing-Preis für ihre bahnbrechende Arbeit im Bereich Reinforcement Learning ausgezeichnet. Wie Cade Metz in der New York Times berichtet, teilen sich die beiden Forscher das Preisgeld von einer Million Dollar. Barto und Sutton begannen ihre Zusammenarbeit Ende der 1970er Jahre an …

Weiterlesen …