Neuer Benchmark zeigt große Lücke zwischen menschlicher und KI-Denkfähigkeit
Die Arc Prize Foundation hat mit ARC-AGI-2 einen neuen Maßstab zur Messung künstlicher allgemeiner Intelligenz (artificial general intelligence, AGI) veröffentlicht, der sich für selbst die fortschrittlichsten KI-Systeme als äußerst schwierig erwiesen hat. Dieser Test der zweiten Generation bewertet gezielt die Denkfähigkeiten zur Testzeit: KI muss sich an neue, nie zuvor gesehene Aufgaben anpassen, anstatt sich …