Im Test: DeepSeek-V3 konkurriert mit Marktführern bei niedrigeren Kosten

Das neue KI-Modell DeepSeek-V3 erreicht vergleichbare Leistungen wie führende proprietäre Systeme bei deutlich niedrigeren Kosten. Dies geht aus einer umfassenden Analyse von Sunil Kumar Dash hervor. Das Modell übertrifft demnach die Fähigkeiten von GPT-4 und Claude 3.5 Sonnet bei mathematischen Aufgaben und erreicht ähnliche Leistungen im Programmierbereich. Diese Erfolge basieren auf mehreren technischen Innovationen, darunter …

Weiterlesen …

Nvidia übernimmt Run:ai und macht Software quelloffen

Der Chiphersteller Nvidia hat die Übernahme des Software-Unternehmens Run:ai abgeschlossen, wie Dean Takahashi berichtet. Der nicht offiziell bestätigte Kaufpreis soll bei 700 Millionen Dollar liegen. Run:ai entwickelt Software zur Verwaltung von GPU-Ressourcen für KI in der Cloud. Das 2018 in Israel gegründete Unternehmen hat sich auf die Optimierung von KI-Infrastrukturen spezialisiert. Nvidia kündigte an, die …

Weiterlesen …

OpenAI verschiebt Einführung des Copyright-Tools Media Manager

OpenAI hat sein angekündigtes Tool Media Manager nicht wie versprochen eingeführt. Wie Kyle Wiggers für TechCrunch berichtet, wurde das Tool im Mai angekündigt, zeigt aber bisher keine Entwicklungsfortschritte. Ehemalige Mitarbeiter berichten, dass das Projekt intern keine Priorität hatte. Media Manager sollte Urhebern ermöglichen, die Nutzung ihrer Werke im KI-Training zu kontrollieren. Das Tool war als …

Weiterlesen …

Meta entwickelt neue KI-Denkmethode „Coconut“

Meta AI hat eine neuartige Methode entwickelt, die es großen Sprachmodellen ermöglicht, in einem kontinuierlichen latenten Raum zu denken, statt nur mit Worten zu arbeiten. Die als „Coconut“ (Chain of Continuous Thought) bezeichnete Methode wechselt zwischen Sprach- und Gedankenmodus. Dies ermöglicht eine flexiblere Herangehensweise an komplexe Probleme. Das Verfahren zeigt besondere Stärken bei Aufgaben, die …

Weiterlesen …

Analyse: Stärken und Schwächen von OpenAI o3

OpenAIs neuestes KI-Modell o3 erzielt bedeutende Fortschritte. Wie Matt Marshall für VentureBeat berichtet, zeichnet es sich durch fünf zentrale Innovationen aus: Die größte Herausforderung liegt im hohen Rechenaufwand des Modells. Es verbraucht Millionen von Tokens pro Aufgabe, was Bedenken hinsichtlich der Wirtschaftlichkeit aufwirft. OpenAI plant daher die Veröffentlichung einer vereinfachten Version „o3-mini“ Ende Januar. Experten …

Weiterlesen …

DeepSeek-V3 auf Augenhöhe mit GPT-4 und Claude 3.5 Sonnet

Das chinesische KI-Startup DeepSeek hat sein neues KI-Modell DeepSeek-V3 vorgestellt. Wie Shubham Sharma für VentureBeat berichtet, verfügt das Modell über 671 Milliarden Parameter, aktiviert jedoch durch seine Experten-Mischarchitektur nur 37 Milliarden für jede Aufgabe. Das Modell wurde mit 14,8 Billionen verschiedenen Tokens trainiert und zeigt überlegene Leistung in mehreren Bereichen, besonders in Mathematik und Programmierung. …

Weiterlesen …

Alibaba Vision-Modell QVQ mit erweiterten Analysefähigkeiten

Das Qwen-Team von Alibaba hat mit QVQ-72B-Preview ein neues experimentelles visuelles KI-Modell veröffentlicht, das die Fähigkeiten zur visuellen Analyse verbessern soll. Aufbauend auf der Qwen2-VL-72B-Architektur kombiniert das Modell Sprach- und Bildverarbeitung zur Bewältigung komplexer analytischer Aufgaben. Nach Unternehmensangaben erreichte QVQ einen Wert von 70,3 im MMMU-Benchmark, was eine Verbesserung gegenüber dem Vorgängermodell darstellt. Das Modell …

Weiterlesen …

KI-Assistent Claude revolutioniert Softwareentwicklung

Der KI-Assistent Claude von Anthropic verzeichnet einen bemerkenswerten Erfolg im globalen Softwareentwicklungsmarkt. Michael Nuñez berichtet in VentureBeat über einen Anstieg der coding-bezogenen Einnahmen um 1.000% innerhalb von drei Monaten. Softwareentwicklung macht mittlerweile mehr als 10% aller Claude-Interaktionen aus. Das KI-Tool kann bis zu 200.000 Token an Kontext analysieren und dabei die Übersicht behalten. Große Unternehmen …

Weiterlesen …

OpenAI entwickelt neues Sicherheitssystem für KI-Modelle

OpenAI hat ein neues Sicherheitssystem namens „deliberative alignment“ für seine KI-Modelle entwickelt, berichtet Maxwell Zeff. Das System wurde in die neuen KI-Modelle o1 und o3 integriert. Die Technologie ermöglicht es den Modellen, vor jeder Antwort die Sicherheitsrichtlinien von OpenAI zu berücksichtigen. Dies geschieht in der Inferenzphase, nachdem ein Benutzer eine Anfrage gestellt hat. Die KI-Modelle …

Weiterlesen …

OpenAIs GPT-5-Projekt kommt nicht voran

Die Entwicklung des neuen KI-Modells GPT-5 von OpenAI, intern als „Orion“ bezeichnet, verzögert sich erheblich und verursacht massive Kosten. Wie Deepa Seetharaman im Wall Street Journal berichtet, kämpft das Unternehmen seit über 18 Monaten mit verschiedenen technischen Herausforderungen. Jeder Trainingsversuch des Systems verschlingt etwa eine halbe Milliarde Dollar allein an Rechenkosten. Microsoft, der größte Investor …

Weiterlesen …

×