Chinesisches KI-Startup DeepSeek fordert Branchenführer mit Open-Source-Modell heraus

Das chinesische KI-Unternehmen DeepSeek hat mit der Veröffentlichung seines Sprachmodells DeepSeek-R1 große Aufmerksamkeit in der Technologiebranche erregt. Das von Hedgefonds-Manager Liang Wenfengs Team entwickelte Modell erreicht nach Unternehmensangaben die Leistung des führenden OpenAI-Modells, wurde jedoch zu einem Bruchteil der Kosten – etwa 5,6 Millionen Dollar unter Verwendung von 2.048 Nvidia H800-Chips – trainiert.

Im Gegensatz zu seinen Wettbewerbern hat DeepSeek R1 als Open-Source-Modell veröffentlicht, wodurch Entwickler das Modell für verschiedene Anwendungen modifizieren und anpassen können. Das Modell ist über eine kostenlose Website und mobile App verfügbar und bietet Funktionen wie Websuchenintegration. Technologieführer wie Marc Andreessen und Metas Yann LeCun haben DeepSeeks Ansatz gelobt, wobei LeCun betont, dass diese Entwicklung das Potenzial von Open-Source-Modellen und nicht die chinesische technologische Überlegenheit demonstriert.

Branchenbeobachter führen DeepSeeks Erfolg auf seinen forschungsorientierten Ansatz und die effiziente Nutzung begrenzter Rechenressourcen zurück, die aufgrund der US-Beschränkungen für fortschrittliche Chip-Exporte nach China notwendig wurde. Das Unternehmen unterhält Büros in Hangzhou und Peking und beschäftigt hauptsächlich chinesische Universitätsabsolventen. Allerdings unterliegt das Modell einigen Einschränkungen, darunter inhaltliche Beschränkungen aufgrund chinesischer Vorschriften, und es bleiben Fragen zur langfristigen Wettbewerbsfähigkeit, während US-Unternehmen massiv in neue KI-Infrastruktur investieren.

VentureBeat, Financial Times, VentureBeat

Mehr zum Thema:

Bleib up-to-date: