Fail | Page 3 of 3 | ✦ Smart Content Report

Warum ChatGPT & Co. bisweilen grandios an Aufgaben scheitern

11. September 202512. Juli 2024

In einem früheren Smart Content Report zeigte ich eine kuriose bebilderte Anleitung, generiert von ChatGPTs Dall-E: Ich finde solche „Fails“ spannend zu sehen, weil sich dort oftmals grundsätzliche Probleme zeigen. Wir sind z.B. immer noch ein gutes Stück von einer KI entfernt, die die Welt um sich herum tatsächlich versteht („General World Model“). Im Moment …

Selbst fortgeschrittene KI scheitert als Agent

5. Februar 202528. Juni 2024

Ein neuer Benchmark-Test von Sierra zeigt, dass selbst fortschrittliche Sprachmodelle wie GPT-4o bei komplexen Aufgaben in realistischen Szenarien noch Schwierigkeiten haben und eine Erfolgsquote von unter 50 Prozent erreichen. Der Test namens TAU-bench soll Entwicklern helfen, die Leistung von KI-Agenten in realitätsnahen Situationen zu bewerten, indem er Faktoren wie mehrfache Interaktionen und komplexe Aufgaben berücksichtigt.

Googles „AI Overviews“ stolpern

5. Februar 202531. Mai 2024

Die kürzlich vorgestellten „AI Overviews“ in der Google-Suche haben zu einigen kuriosen Ergebnissen geführt – manche davon peinlich, andere lächerlich, wieder andere gefährlich. Es zeigt sich an diesem Beispiel, was diverse Fachleute bereits wissen und predigen: Lass deine KI nicht unbeaufsichtigt arbeiten. So fand sich unter den Empfehlungen der Google-KI etwa, dass Käse besser auf der Pizza …

Noch eine Sache, die KI nicht versteht: Spiegel

3. Dezember 202422. März 2024

KI-Bildgeneratoren scheitern oftmals, weil sie nicht verstehen, was sie dort eigentlich erstellen. Spiegel sind ein schönes Beispiel dafür. Quelle: Reddit

Google blamiert sich mit Geminis „political correctness“

5. Februar 20258. März 2024

Wir hatten bereits über Googles KI-Offensive unter dem „Gemini“-Banner berichtet, aber bald darauf machte vor allem der integrierte Bildgenerator Schlagzeilen: Er war offenbar zu sehr auf Diversität getrimmt. Was generell eine gute Idee ist, ergibt keinen Sinn, wenn man etwa ein Bild der „Gründerväter“ der USA haben möchte. Google schränkte folgend den Bildgenerator ein, so dass …

Air Canada muss für falsche Auskunft seines Chatbots geradestehen

5. Februar 202523. Februar 2024

Der Chatbot von Air Canada hat einem Kunden eine falsche Auskunft zu den Bedingungen für eine Erstattung gegeben. Vor Gericht argumentierte die Fluggesellschaft, der Chatbot sei für seine Aussagen selbst verantwortlich, nicht Air Canada. Das sah das Gericht anders und das Unternehmen musste zahlen. Quelle: The Guardian