DeepSeek, ein chinesisches KI-Forschungsunternehmen unterstützt vom Hedgefonds High-Flyer Capital Management, hat DeepSeek-R1-Lite-Preview vorgestellt, ein neues KI-Modell, das mit OpenAIs o1 konkurrieren soll. Das Modell ist auf Reasoning-Fähigkeiten spezialisiert und kann sich mehr Zeit für die Überlegung von Fragen nehmen, bevor es Antworten gibt.
Laut DeepSeek erreicht ihr Modell vergleichbare Leistungen wie OpenAIs o1 bei etablierten KI-Benchmarks wie AIME und MATH. Das Modell zeigt seinen Gedankenprozess bei der Problemlösung. Tests haben jedoch auch Einschränkungen aufgezeigt, darunter Schwierigkeiten bei Logikrätseln und Beschränkungen bei politisch sensiblen Themen mit Bezug zu China.
Das Modell ist derzeit über DeepSeek Chat verfügbar, wobei der fortgeschrittene „Deep Think“-Modus auf 50 Nachrichten pro Tag begrenzt ist. Während DeepSeek plant, das Modell als Open Source zur Verfügung zu stellen und eine API zu veröffentlichen, hat das Unternehmen bisher keine technische Dokumentation zur Architektur oder den Trainingsmethoden des Modells veröffentlicht. Die Entwicklung ist Teil einer breiteren Bewegung in der Branche hin zu neuen KI-Ansätzen, insbesondere im Bereich des Test-Time Computing.
Quellen: TechCrunch, VentureBeat