OpenEuroLLM: Europäisches Konsortium startet Initiative für Open-Source-KI

Ein europäisches Konsortium aus 20 Forschungseinrichtungen und Unternehmen hat das Projekt OpenEuroLLM angekündigt. Unter der Leitung von Jan Hajič von der Karls-Universität und Peter Sarlin von AMD Silo AI sollen mehrsprachige KI-Sprachmodelle als Open-Source entwickelt werden. Das Projekt startet im Februar 2025 und wird von der Europäischen Kommission im Rahmen des Digital Europe Programme gefördert. …

Weiterlesen …

Forscher entwickeln Reasoning KI für unter 50 Dollar

Wissenschaftler der Stanford University und der University of Washington haben ein KI-Modell namens s1 entwickelt, das mit den Fähigkeiten teurer kommerzieller KI-Systeme konkurriert und weniger als 50 Dollar an Rechenressourcen für das Training benötigte. Das Modell, das durch einen als Destillation bezeichneten Prozess unter Verwendung von Googles Gemini 2.0 Flash Thinking Experimental erstellt wurde, zeigt …

Weiterlesen …

Ai2 Tulu 3 ist eine Open-Source-KI auf Augenhöhe mit führenden Systemen

Das Allen Institute for Artificial Intelligence (Ai2) hat Tulu 3 405B vorgestellt, ein neues KI-Sprachmodell, das laut institutseigenen Tests mehrere führende Systeme wie DeepSeek V3 übertrifft und in bestimmten Benchmarks mit OpenAI’s GPT-4o gleichauf liegt. Das Modell verfügt über 405 Milliarden Parameter und benötigte für das Training 256 parallel laufende GPUs. Die zentrale Innovation von …

Weiterlesen …

Mistral Small 3 kann mit größeren Konkurrenten mithalten

Das französische KI-Startup Mistral AI hat Mistral Small 3 veröffentlicht, ein Sprachmodell mit 24 Milliarden Parametern, das laut Unternehmensangaben die Leistung von dreimal größeren Modellen erreicht. Dem Unternehmen zufolge erzielt das neue Modell eine Genauigkeit von 81% bei Standardtests und verarbeitet 150 Token pro Sekunde, was es mit Metas Llama 3.3 70B Modell vergleichbar macht, …

Weiterlesen …

DeepSeek-R1 senkt Entwicklungskosten für Enterprise KI

DeepSeeks neues KI-Reasoning-Modell R1 reduziert die Kosten für KI-Entwicklung erheblich. Wie Ben Dickson in VentureBeat berichtet, bietet DeepSeek-R1 vergleichbare Fähigkeiten wie führende Modelle zu einem Bruchteil des Preises. Das Modell kostet 2,19 Dollar pro Million Output-Token, während OpenAIs o1 mit 60 Dollar pro Million Token zu Buche schlägt. Auch über US-amerikanische Anbieter wie Together.ai und …

Weiterlesen …

Hugging Face arbeitet an Open-Source-Version von DeepSeeks R1

Hugging Face hat ein Projekt gestartet, um eine vollständig offene Version des KI-Reasoning-Modells R1 von DeepSeek zu entwickeln. Wie Kyle Wiggers für TechCrunch berichtet, zielt das Open-R1-Projekt darauf ab, sämtliche Komponenten des Originalmodells nachzubauen. Das Forschungsteam unter der Leitung von Leandro von Werra nutzt dafür den firmeneigenen Science Cluster mit 768 Nvidia H100 GPUs. Das …

Weiterlesen …

DeepSeek Janus Pro Bild-KI fordert etablierte Wettbewerber heraus

Das chinesische KI-Unternehmen DeepSeek hat eine neue Familie von KI-Modellen namens Janus-Pro eingeführt, die sowohl Bildanalyse als auch Bilderstellung ermöglichen. Die Modelle, die zwischen 1 Milliarde und 7 Milliarden Parameter umfassen, sind auf der Hugging Face-Plattform unter MIT-Lizenz verfügbar und erlauben eine uneingeschränkte kommerzielle Nutzung. Laut DeepSeek übertrifft das größte Modell der Familie, Janus-Pro-7B, mehrere …

Weiterlesen …

Analyse: DeepSeek R1 revolutioniert Kosten und Leistung in KI-Entwicklung

Das chinesische Unternehmen DeepSeek hat mit seinem neuen R1-Modell für Aufsehen in der KI-Branche gesorgt, da es die Leistung von OpenAIs o1 zu nur 3-5% der Kosten erreicht. Das am 20. Januar 2025 veröffentlichte Modell wurde bereits über 109.000 Mal auf HuggingFace heruntergeladen und zeigt damit großes Interesse seitens der Entwicklergemeinschaft. Der Durchbruch basiert auf …

Weiterlesen …

Chinesisches KI-Startup DeepSeek fordert Branchenführer mit Open-Source-Modell heraus

Das chinesische KI-Unternehmen DeepSeek hat mit der Veröffentlichung seines Sprachmodells DeepSeek-R1 große Aufmerksamkeit in der Technologiebranche erregt. Das von Hedgefonds-Manager Liang Wenfengs Team entwickelte Modell erreicht nach Unternehmensangaben die Leistung des führenden OpenAI-Modells, wurde jedoch zu einem Bruchteil der Kosten – etwa 5,6 Millionen Dollar unter Verwendung von 2.048 Nvidia H800-Chips – trainiert. Im Gegensatz …

Weiterlesen …

Tencent Hunyuan3D 2.0 erstellt 3D-Modelle in Sekunden

Tencent hat ein neues KI-System namens Hunyuan3D 2.0 entwickelt, das innerhalb von Sekunden 3D-Modelle aus Einzelbildern oder Textbeschreibungen erstellt. Die Technologie, über die Michael Nuñez berichtet, automatisiert einen Prozess, der Künstler üblicherweise Tage oder Wochen kostet. Das System nutzt zwei Hauptkomponenten für Form und Oberflächendetails und erreicht laut Tencent bessere Ergebnisse als bisherige Lösungen. Die …

Weiterlesen …