DeepSeek | Page 2 of 2 | ✦ Smart Content Report

Chinesisches KI-Startup DeepSeek fordert Branchenführer mit Open-Source-Modell heraus

5. Februar 202525. Januar 2025

Das chinesische KI-Unternehmen DeepSeek hat mit der Veröffentlichung seines Sprachmodells DeepSeek-R1 große Aufmerksamkeit in der Technologiebranche erregt. Das von Hedgefonds-Manager Liang Wenfengs Team entwickelte Modell erreicht nach Unternehmensangaben die Leistung des führenden OpenAI-Modells, wurde jedoch zu einem Bruchteil der Kosten – etwa 5,6 Millionen Dollar unter Verwendung von 2.048 Nvidia H800-Chips – trainiert. Im Gegensatz …

DeepSeek veröffentlicht neue Reasoning-Modelle

5. Februar 202520. Januar 2025

Das chinesische KI-Unternehmen DeepSeek hat seine neuen Sprachmodelle DeepSeek-R1-Zero und DeepSeek-R1 sowie sechs kleinere destillierte Versionen vorgestellt. Die Hauptmodelle, die auf DeepSeeks V3-Architektur basieren, verfügen über insgesamt 671 Milliarden Parameter, von denen 37 Milliarden aktiv sind, und eine Kontextlänge von 128.000 Token. Laut Unternehmensangaben erreicht DeepSeek-R1 eine mit OpenAI-Modellen vergleichbare Leistung in den Bereichen Mathematik, …

Im Test: DeepSeek-V3 konkurriert mit Marktführern bei niedrigeren Kosten

5. Februar 20252. Januar 2025

Das neue KI-Modell DeepSeek-V3 erreicht vergleichbare Leistungen wie führende proprietäre Systeme bei deutlich niedrigeren Kosten. Dies geht aus einer umfassenden Analyse von Sunil Kumar Dash hervor. Das Modell übertrifft demnach die Fähigkeiten von GPT-4 und Claude 3.5 Sonnet bei mathematischen Aufgaben und erreicht ähnliche Leistungen im Programmierbereich. Diese Erfolge basieren auf mehreren technischen Innovationen, darunter …

DeepSeek-V3 auf Augenhöhe mit GPT-4 und Claude 3.5 Sonnet

5. Februar 202527. Dezember 2024

Das chinesische KI-Startup DeepSeek hat sein neues KI-Modell DeepSeek-V3 vorgestellt. Wie Shubham Sharma für VentureBeat berichtet, verfügt das Modell über 671 Milliarden Parameter, aktiviert jedoch durch seine Experten-Mischarchitektur nur 37 Milliarden für jede Aufgabe. Das Modell wurde mit 14,8 Billionen verschiedenen Tokens trainiert und zeigt überlegene Leistung in mehreren Bereichen, besonders in Mathematik und Programmierung. …

Chinesisches KI-Unternehmen DeepSeek zeigt Reasoning-Modell als Konkurrenz zu OpenAI o1

5. Februar 202523. November 2024

DeepSeek, ein chinesisches KI-Forschungsunternehmen unterstützt vom Hedgefonds High-Flyer Capital Management, hat DeepSeek-R1-Lite-Preview vorgestellt, ein neues KI-Modell, das mit OpenAIs o1 konkurrieren soll. Das Modell ist auf Reasoning-Fähigkeiten spezialisiert und kann sich mehr Zeit für die Überlegung von Fragen nehmen, bevor es Antworten gibt. Laut DeepSeek erreicht ihr Modell vergleichbare Leistungen wie OpenAIs o1 bei etablierten …