DeepSeek Janus Pro Bild-KI fordert etablierte Wettbewerber heraus

Das chinesische KI-Unternehmen DeepSeek hat eine neue Familie von KI-Modellen namens Janus-Pro eingeführt, die sowohl Bildanalyse als auch Bilderstellung ermöglichen. Die Modelle, die zwischen 1 Milliarde und 7 Milliarden Parameter umfassen, sind auf der Hugging Face-Plattform unter MIT-Lizenz verfügbar und erlauben eine uneingeschränkte kommerzielle Nutzung. Laut DeepSeek übertrifft das größte Modell der Familie, Janus-Pro-7B, mehrere …

Weiterlesen …

Analyse: DeepSeek R1 revolutioniert Kosten und Leistung in KI-Entwicklung

Das chinesische Unternehmen DeepSeek hat mit seinem neuen R1-Modell für Aufsehen in der KI-Branche gesorgt, da es die Leistung von OpenAIs o1 zu nur 3-5% der Kosten erreicht. Das am 20. Januar 2025 veröffentlichte Modell wurde bereits über 109.000 Mal auf HuggingFace heruntergeladen und zeigt damit großes Interesse seitens der Entwicklergemeinschaft. Der Durchbruch basiert auf …

Weiterlesen …

Chinesisches KI-Startup DeepSeek fordert Branchenführer mit Open-Source-Modell heraus

Das chinesische KI-Unternehmen DeepSeek hat mit der Veröffentlichung seines Sprachmodells DeepSeek-R1 große Aufmerksamkeit in der Technologiebranche erregt. Das von Hedgefonds-Manager Liang Wenfengs Team entwickelte Modell erreicht nach Unternehmensangaben die Leistung des führenden OpenAI-Modells, wurde jedoch zu einem Bruchteil der Kosten – etwa 5,6 Millionen Dollar unter Verwendung von 2.048 Nvidia H800-Chips – trainiert. Im Gegensatz …

Weiterlesen …

DeepSeek veröffentlicht neue Reasoning-Modelle

Das chinesische KI-Unternehmen DeepSeek hat seine neuen Sprachmodelle DeepSeek-R1-Zero und DeepSeek-R1 sowie sechs kleinere destillierte Versionen vorgestellt. Die Hauptmodelle, die auf DeepSeeks V3-Architektur basieren, verfügen über insgesamt 671 Milliarden Parameter, von denen 37 Milliarden aktiv sind, und eine Kontextlänge von 128.000 Token. Laut Unternehmensangaben erreicht DeepSeek-R1 eine mit OpenAI-Modellen vergleichbare Leistung in den Bereichen Mathematik, …

Weiterlesen …

Im Test: DeepSeek-V3 konkurriert mit Marktführern bei niedrigeren Kosten

Das neue KI-Modell DeepSeek-V3 erreicht vergleichbare Leistungen wie führende proprietäre Systeme bei deutlich niedrigeren Kosten. Dies geht aus einer umfassenden Analyse von Sunil Kumar Dash hervor. Das Modell übertrifft demnach die Fähigkeiten von GPT-4 und Claude 3.5 Sonnet bei mathematischen Aufgaben und erreicht ähnliche Leistungen im Programmierbereich. Diese Erfolge basieren auf mehreren technischen Innovationen, darunter …

Weiterlesen …

DeepSeek-V3 auf Augenhöhe mit GPT-4 und Claude 3.5 Sonnet

Das chinesische KI-Startup DeepSeek hat sein neues KI-Modell DeepSeek-V3 vorgestellt. Wie Shubham Sharma für VentureBeat berichtet, verfügt das Modell über 671 Milliarden Parameter, aktiviert jedoch durch seine Experten-Mischarchitektur nur 37 Milliarden für jede Aufgabe. Das Modell wurde mit 14,8 Billionen verschiedenen Tokens trainiert und zeigt überlegene Leistung in mehreren Bereichen, besonders in Mathematik und Programmierung. …

Weiterlesen …

Chinesisches KI-Unternehmen DeepSeek zeigt Reasoning-Modell als Konkurrenz zu OpenAI o1

DeepSeek, ein chinesisches KI-Forschungsunternehmen unterstützt vom Hedgefonds High-Flyer Capital Management, hat DeepSeek-R1-Lite-Preview vorgestellt, ein neues KI-Modell, das mit OpenAIs o1 konkurrieren soll. Das Modell ist auf Reasoning-Fähigkeiten spezialisiert und kann sich mehr Zeit für die Überlegung von Fragen nehmen, bevor es Antworten gibt. Laut DeepSeek erreicht ihr Modell vergleichbare Leistungen wie OpenAIs o1 bei etablierten …

Weiterlesen …