Analyse: DeepSeek R1 revolutioniert Kosten und Leistung in KI-Entwicklung

Das chinesische Unternehmen DeepSeek hat mit seinem neuen R1-Modell für Aufsehen in der KI-Branche gesorgt, da es die Leistung von OpenAIs o1 zu nur 3-5% der Kosten erreicht. Das am 20. Januar 2025 veröffentlichte Modell wurde bereits über 109.000 Mal auf HuggingFace heruntergeladen und zeigt damit großes Interesse seitens der Entwicklergemeinschaft.

Der Durchbruch basiert auf mehreren technischen Innovationen, darunter ein neuartiger Ansatz beim Reinforcement Learning und eine effiziente Modellarchitektur. DeepSeeks R1-Modell wurde mit der firmeneigenen GRPO-Methode (Group Rewards Policy Optimization) entwickelt, die ohne komplexe Verifizierungssysteme oder externe Sprachmodelle auskommt. Das Entwicklerteam stellte fest, dass verschiedene Reinforcement-Learning-Ansätze effektiv funktionieren, sobald das Modell 1,5 Milliarden Parameter überschreitet.

Die Finanzmärkte reagierten deutlich auf diese Entwicklung: Der Aktienkurs von Nvidia fiel am 27. Januar um 17%, was einem Wertverlust von etwa 600 Milliarden Dollar entspricht. Die Reaktion spiegelt die Sorgen der Investoren über künftige KI-Infrastrukturkosten und eine mögliche Entwicklung von KI-Modellen zu Allerweltsprodukten wider. Auch andere große Technologieunternehmen verzeichneten Kursverluste.

DeepSeeks Erfolge haben Fragen zur nationalen Sicherheit und zum KI-Entwicklungswettbewerb zwischen China und den USA aufgeworfen. Das Unternehmen, ein Ableger des chinesischen Hedgefonds High-Flyer Quant, arbeitet Berichten zufolge mit etwa 50.000 GPUs – deutlich weniger als die führenden US-amerikanischen KI-Labore wie OpenAI, Google und Anthropic, die über 500.000+ GPUs verfügen.

Das Modell zeigt, dass hochwertige KI-Entwicklung mit weniger Ressourcen möglich ist als bisher angenommen. DeepSeek gab an, sein Basismodell (V3) mit einem Budget von 5,58 Millionen Dollar in zwei Monaten trainiert zu haben, wobei Forschungs- und Entwicklungskosten nicht eingerechnet sind. Das Unternehmen hat sich zu einem Open-Source-Ansatz verpflichtet, wobei CEO Liang Wenfeng betont, dass Open Source entscheidend für die Gewinnung technischer Talente sei.

Branchenexperten sind über die langfristigen Auswirkungen von DeepSeeks Durchbruch geteilter Meinung. Während einige darin eine fundamentale Herausforderung für die Geschäftsmodelle etablierter KI-Unternehmen sehen, weisen andere darauf hin, dass US-Unternehmen bei KI-Grundinnovationen weiterhin führend sind. Die Entwicklung hat jedoch eine neue Diskussion über KI-Regulierung, Exportkontrollen und die Zukunft der KI-Entwicklungskosten ausgelöst.

Quellen: Tim Kellogg, VentureBeat, Stratechery, Platformer

Mehr zum Thema:

Bleib up-to-date: