Googles brandneue KI-Suche scheitert bei einfachen Wortsuchen

Googles neue Suchoberfläche hat neuartige Probleme. Wer das englische Wort „disregard“ eingibt, erhält eine nahezu leere KI-Antwort. Russell Brandom berichtet für TechCrunch, dass das neue Design klassische Suchergebnisse weit nach unten verdrängt. An ihrer Stelle erscheinen KI-Zusammenfassungen, die in diesem Fall aber keinerlei nützliche Information liefern. Google hat seine Suche grundlegend umgebaut. KI-generierte Zusammenfassungen stehen …

Weiterlesen …

Ein erfundener Hot-Dog-Champion deckt Schwäche in KI-Antworten auf

KI-Chatbots lassen sich mit einfachen Mitteln dazu bringen, Fehlinformationen zu verbreiten. Thomas Germain berichtet für die BBC, dass ein einziger, gezielt formulierter Blogbeitrag ausreicht, um Antworten von Tools wie ChatGPT, Google Gemini und Googles KI-Übersichten zu manipulieren. Germain belegte das Problem mit einem Selbstversuch. Er veröffentlichte einen Artikel auf seiner privaten Website, in dem er …

Weiterlesen …

Studie: KI-Modelle verfälschen Dokumente bei mehrstufigen Arbeitsabläufen

Eine neue Studie von Microsoft Research zeigt, dass große Sprachmodelle (Large Language Models, LLMs) Dokumente bei komplexen, mehrstufigen Arbeitsabläufen unbemerkt verändern. Ben Dickson berichtet für VentureBeat, dass selbst die leistungsstärksten KI-Modelle durchschnittlich 25 Prozent des Dokumenteninhalts verfälschen. Das Forschungsteam entwickelte dafür einen Benchmark namens DELEGATE-52. Er simuliert automatisierte Arbeitsabläufe in 52 Berufsfeldern, darunter Finanzbuchhaltung, Softwareentwicklung …

Weiterlesen …

Oft richtig, aber nicht gut genug: Googles KI-Überblicke im Test

Googles KI-Funktion „AI Overviews“ liefert in rund 91 Prozent der Fälle korrekte Antworten. Das klingt erst einmal gut, aber Tripp Mickle und Kollegen berichten für die New York Times, dass Google damit dennoch zig Millionen fehlerhafte Antworten pro Stunde ausgibt. Die Zeitung beauftragte das KI-Startup Oumi mit einer Analyse, die auf dem Branchenstandard SimpleQA basiert. …

Weiterlesen …

Zur Autowaschanlage laufen oder fahren? Die meisten KI-Modelle liegen daneben

Ein verblüffend einfacher Test hat eine weitverbreitete Logikschwäche aktueller KI-Modelle aufgedeckt. Felix Wunderlich schreibt bei opper.ai, dass 42 von 53 der getesteten Systeme eine einfach scheinende Frage falsch beantwortet haben: „Ich möchte mein Auto waschen. Die Waschanlage ist 50 Meter entfernt. Soll ich laufen oder fahren?“ Die richtige Antwort lautet natürlich: fahren. Das Auto muss …

Weiterlesen …

Fehler bei Google Gemini leert Chatverlauf für Nutzer weltweit

Ein Bug in Google Gemini lässt die Chatverläufe vieler Nutzer aus der Seitenleiste verschwinden. Gesprächslisten werden leer angezeigt, manche Nutzer verlieren bis zu einem Jahr gespeicherter Chats. Berichte kommen aus Reddit, dem Google-Support-Forum und anderen Plattformen. Betroffen sind sowohl kostenlose als auch zahlende Nutzer, darunter Gemini Pro und Gemini Business. Den Berichten zufolge wurden die …

Weiterlesen …

Studierende nutzen KI-Tools gegen KI-Betrugsvorwürfe

Studierende in den USA verwenden sogenannte KI-Humanizer, um falsche Betrugsvorwürfe zu vermeiden. Viele haben nie künstliche Intelligenz für ihre Arbeiten verwendet. Tyler Kingkade berichtet für NBC News. Der Einsatz von KI-Detektoren auf dem Campus hat einen eskalierenden Konflikt ausgelöst. Professoren prüfen Arbeiten mit Programmen wie Turnitin und GPTZero auf KI-generierte Inhalte. Die Detektoren gelten jedoch …

Weiterlesen …

PlayStation verschenkt und Fisch bestellt: Wenn KI-Agenten außer Kontrolle geraten

Ein KI-Modell von Anthropic übernahm für drei Wochen die Leitung eines Verkaufsautomaten in der Redaktion des Wall Street Journal. Das Experiment sollte zeigen, wie autonom generative KI-Agenten in einem geschäftlichen Umfeld agieren. Joanna Stern berichtet für das Wall Street Journal, dass der Versuch in einem finanziellen Desaster endete. Der KI-Agent erhielt den Namen Claudius. Das …

Weiterlesen …

Meinung: Sprachmodelle sind nützlich, aber nicht vertrauenswürdig

Große Sprachmodelle (LLMs) erzeugen Text auf Basis statistischer Muster und nicht auf Grundlage eines Verständnisses von Wahrheit. Das macht sie im Wesentlichen zu „Bullshittern“, denen Fakten gleichgültig sind. Dieses Merkmal ist ein Kern ihrer Funktionsweise, den Nutzer verstehen müssen, um sie sicher und effektiv einzusetzen. Diesen Standpunkt vertritt Matt Ranger, Leiter für maschinelles Lernen beim …

Weiterlesen …

KI-Assistenten für Meetings sorgen für peinliche Momente

KI-Tools, die in Videokonferenzen Notizen anfertigen, zeichnen dabei auch private Unterhaltungen und Scherze auf. Diese werden mitunter an alle Teilnehmenden verschickt, was zu peinlichen Situationen führen kann. Darüber berichtet Ann-Marie Alcántara im Wall Street Journal und beschreibt, wie die Werkzeuge das gesamte Meeting erfassen, auch Gespräche vor dem offiziellen Beginn. Der Artikel nennt mehrere Beispiele. …

Weiterlesen …

×