Analyse: DeepSeek R1 revolutioniert Kosten und Leistung in KI-Entwicklung

Das chinesische Unternehmen DeepSeek hat mit seinem neuen R1-Modell für Aufsehen in der KI-Branche gesorgt, da es die Leistung von OpenAIs o1 zu nur 3-5% der Kosten erreicht. Das am 20. Januar 2025 veröffentlichte Modell wurde bereits über 109.000 Mal auf HuggingFace heruntergeladen und zeigt damit großes Interesse seitens der Entwicklergemeinschaft. Der Durchbruch basiert auf …

Weiterlesen …

Googles Gemini 2.0 Flash Thinking jetzt kostenlos testen

Google hat ein neues KI-Modell namens Gemini 2.0 Flash Thinking veröffentlicht, das bis zu eine Million Texttoken verarbeiten kann. Wie Michael Nuñez von VentureBeat berichtet, ist das Modell kostenlos im Google AI Studio unter der experimentellen Bezeichnung „Exp-01-21“ verfügbar. Das System erreichte bei mathematischen und wissenschaftlichen Tests beachtliche Ergebnisse: 73,3% beim American Invitational Mathematics Examination …

Weiterlesen …

Reasoning

Reasoning (engl. für „Schlussfolgerung“ oder „logisches Denken“) beschreibt in der künstlichen Intelligenz die Fähigkeit eines Systems, logische Schlüsse zu ziehen, Zusammenhänge zu erkennen und auf Basis vorhandener Informationen neue Erkenntnisse abzuleiten. Bei KI-Systemen wie ChatGPT bedeutet Reasoning, dass sie nicht nur auswendig gelernte Antworten wiedergeben, sondern durch Verknüpfung verschiedener Informationen zu eigenständigen Schlussfolgerungen gelangen können.  …

Weiterlesen …

So nutzt du das OpenAI o1 Sprachmodell richtig

Ben Hylak hat in einem Gastbeitrag eine detaillierte Analyse vorgelegt, wie man das o1 Modell von OpenAI optimal einsetzt. Das Modell funktioniert anders als klassische Chat-Modelle und sollte besser als eine Art „Berichtgenerator“ verstanden werden. Der Schlüssel zur erfolgreichen Nutzung liegt in der ausführlichen Bereitstellung von Kontext. Nutzer sollten deutlich mehr Hintergrundinformationen liefern als bei …

Weiterlesen …

DeepSeek veröffentlicht neue Reasoning-Modelle

Das chinesische KI-Unternehmen DeepSeek hat seine neuen Sprachmodelle DeepSeek-R1-Zero und DeepSeek-R1 sowie sechs kleinere destillierte Versionen vorgestellt. Die Hauptmodelle, die auf DeepSeeks V3-Architektur basieren, verfügen über insgesamt 671 Milliarden Parameter, von denen 37 Milliarden aktiv sind, und eine Kontextlänge von 128.000 Token. Laut Unternehmensangaben erreicht DeepSeek-R1 eine mit OpenAI-Modellen vergleichbare Leistung in den Bereichen Mathematik, …

Weiterlesen …

LlamaV-o1 macht seine Denkprozesse nachvollziehbar

Wissenschaftler der Mohamed bin Zayed University of Artificial Intelligence haben ein neues KI-Modell entwickelt, das seine Schlussfolgerungen transparent macht. Wie Michael Nuñez in VentureBeat berichtet, vereint LlamaV-o1 die Analyse von Bildern und Text mit einer schrittweisen Erklärung seiner Denkprozesse. Das Modell überzeugt bei komplexen Aufgaben wie der Interpretation von Finanzdiagrammen und medizinischen Bildern. Es erreichte …

Weiterlesen …

Neue Prompt-Strategie für KI-Reasoning-Modelle erforderlich

KI-Systeme mit Reasoning-Fähigkeiten benötigen einen neuen Ansatz bei der Formulierung von Anfragen. Wie Carl Franzen in VentureBeat berichtet, sollten Nutzer detaillierte Kontextinformationen in Form von „Briefings“ bereitstellen. Der ehemalige Apple-Designer Ben Hylak zeigte, dass bessere Ergebnisse erzielt werden, wenn man dem o1-Modell von OpenAI die Planung der Analyseschritte selbst überlässt. OpenAI-Mitgründer Greg Brockman bestätigte, dass …

Weiterlesen …

Meta entwickelt neue KI-Denkmethode „Coconut“

Meta AI hat eine neuartige Methode entwickelt, die es großen Sprachmodellen ermöglicht, in einem kontinuierlichen latenten Raum zu denken, statt nur mit Worten zu arbeiten. Die als „Coconut“ (Chain of Continuous Thought) bezeichnete Methode wechselt zwischen Sprach- und Gedankenmodus. Dies ermöglicht eine flexiblere Herangehensweise an komplexe Probleme. Das Verfahren zeigt besondere Stärken bei Aufgaben, die …

Weiterlesen …

Analyse: Stärken und Schwächen von OpenAI o3

OpenAIs neuestes KI-Modell o3 erzielt bedeutende Fortschritte. Wie Matt Marshall für VentureBeat berichtet, zeichnet es sich durch fünf zentrale Innovationen aus: Die größte Herausforderung liegt im hohen Rechenaufwand des Modells. Es verbraucht Millionen von Tokens pro Aufgabe, was Bedenken hinsichtlich der Wirtschaftlichkeit aufwirft. OpenAI plant daher die Veröffentlichung einer vereinfachten Version „o3-mini“ Ende Januar. Experten …

Weiterlesen …

Alibaba Vision-Modell QVQ mit erweiterten Analysefähigkeiten

Das Qwen-Team von Alibaba hat mit QVQ-72B-Preview ein neues experimentelles visuelles KI-Modell veröffentlicht, das die Fähigkeiten zur visuellen Analyse verbessern soll. Aufbauend auf der Qwen2-VL-72B-Architektur kombiniert das Modell Sprach- und Bildverarbeitung zur Bewältigung komplexer analytischer Aufgaben. Nach Unternehmensangaben erreichte QVQ einen Wert von 70,3 im MMMU-Benchmark, was eine Verbesserung gegenüber dem Vorgängermodell darstellt. Das Modell …

Weiterlesen …