Claude Sonnet 4.5 kann länger denn je autonom arbeiten

Anthropic har Claude Sonnet 4.5 vorgestellt, ein KI-Modell, das bis zu 30 Stunden autonom an komplexen Aufgaben arbeiten kann. Das Unternehmen demonstrierte diese Fähigkeit, indem das Modell eine Chat-Anwendung ähnlich Slack erstellte und dabei 11.000 Zeilen Code produzierte, bevor es nach Aufgabenabschluss stoppte. Das neue Modell ist eine erhebliche Verbesserung gegenüber Anthropics vorherigem Opus 4 …

Weiterlesen …

Qwen3-Omni ist ein Open-Source-Modell für Text, Bild, Audio und Video

Das chinesische Technologieunternehmen Alibaba hat Qwen3-Omni veröffentlicht. Es ist ein neues generatives KI-Modell, das eine Kombination aus Text, Bildern, Audio und Video verarbeiten kann. Das Modell zeichnet sich durch seine „omni-modalen“ Fähigkeiten und seine Open-Source-Lizenz aus. Damit positioniert es sich als direkter Konkurrent zu proprietären Modellen von US-Technologiekonzernen wie OpenAI und Google. Nach von Alibaba …

Weiterlesen …

Hugging Face veröffentlicht kleines Sprachmodell mit vollständiger Bauanleitung

Hugging Face hat mit SmolLM3 ein neues kleines Sprachmodell veröffentlicht. Laut der offiziellen Ankündigung des Unternehmens ist das 3-Milliarden-Parameter-Modell besonders leistungsstark und effizient. Eine Besonderheit ist der duale Modus: Das Modell kann entweder direkt antworten oder seinen Denkprozess transparent aufzeigen. Es verarbeitet zudem lange Texte mit bis zu 128.000 Tokens und unterstützt sechs europäische Sprachen. …

Weiterlesen …

MiniMax veröffentlicht leistungsstarkes Open-Source-KI-Modell

Das chinesische Unternehmen MiniMax hat MiniMax-M1 veröffentlicht, ein neues Open-Source-Sprachmodell mit einem Kontextfenster von einer Million Token. Damit kann es ganze Buchsammlungen in einem Gespräch verarbeiten, berichtet Carl Franzen für VentureBeat. Das Modell steht unter Apache 2.0 Lizenz kostenlos für kommerzielle Nutzung auf Plattformen wie Hugging Face zur Verfügung. MiniMax-M1 gibt es in zwei Varianten …

Weiterlesen …

DeepSeek veröffentlicht großes Update

Das chinesische KI-Startup DeepSeek hat ein bedeutendes Update für sein Open-Source-Reasoning-Modell veröffentlicht. Die neue Version DeepSeek-R1-0528 kommt kostenpflichtigen Diensten von OpenAI und Google deutlich näher. Das Modell zeigt erhebliche Verbesserungen bei komplexen Denkaufgaben in Mathematik, Wissenschaft und Programmierung. Carl Franzen von VentureBeat berichtet, dass das aktualisierte Modell 87,5 Prozent Genauigkeit im AIME 2025 Test erreichte. …

Weiterlesen …

Google stellt schnelle Text-KI mit Diffusion-Technologie vor

Google präsentierte auf seiner I/O-Entwicklerkonferenz Gemini Diffusion und markiert damit einen wichtigen Wandel in der Texterzeugung von KI-Modellen. Das experimentelle Modell nutzt Diffusion-Technologie anstelle des traditionellen Transformer-Ansatzes, der ChatGPT und ähnliche Systeme antreibt. Der Hauptvorteil ist die Geschwindigkeit. Gemini Diffusion erzeugt Text mit 857 bis 2.000 Token pro Sekunde und damit vier- bis fünfmal schneller …

Weiterlesen …

Prime Intellects neue KI wurde dezentral trainiert

Prime Intellect hat mit INTELLECT-2 ein KI-Modell mit 32 Milliarden Parametern veröffentlicht, das erstmals durch global verteiltes Reinforcement Learning trainiert wurde. Das Modell nutzt einen dezentralen Ansatz mit Rechenressourcen von Mitwirkenden weltweit anstatt zentralisierter GPU-Cluster. Die speziell entwickelte Infrastruktur umfasst Komponenten wie PRIME-RL, TOPLOC und SHARDCAST, die asynchrones Training über heterogene Netzwerke ermöglichen. Laut Prime …

Weiterlesen …

Anthropic führt „Max“-Tarif für mehr Claude-Nutzung ein

Anthropic hat eine neue Abonnementstufe namens „Max“ für seinen KI-Assistenten Claude eingeführt, die bis zu 20-mal höhere Nutzungslimits als der Pro-Plan bietet. Der neue Plan richtet sich an Nutzer, die intensiv mit Claude zusammenarbeiten und erweiterten Zugriff für anspruchsvolle Projekte benötigen. Das Max-Abonnement ist in zwei Preisstufen erhältlich: 100 Dollar monatlich für die fünffache Nutzung …

Weiterlesen …

Google macht Gemini 2.5 Pro zu günstigen Preisen allgemein verfügbar

Google hat bekannt gegeben, dass sein Gemini 2.5 Pro-Modell jetzt als öffentliche Vorschau über die Gemini API in Google AI Studio verfügbar ist, wobei die Einführung in Vertex AI in Kürze erwartet wird. Laut Google ist dieses Modell ihr bisher „intelligentestes“ und wurde mit 1,24 $ pro Million Input-Tokens und 10 $ pro Million Output-Tokens …

Weiterlesen …

Midjourney entwickelt Methoden für kreativere KI-Texte

Midjourney, bekannt für KI-Bildgenerierung, hat gemeinsam mit der New York University eine Forschungsarbeit veröffentlicht, die sich mit kreativeren Texten von Sprachmodellen befasst. Wie Carl Franzen für VentureBeat berichtet, stellt die Studie zwei neue Techniken vor: Diversified Direct Preference Optimization (DDPO) und Diversified Odds Ratio Preference Optimization (DORPO). Diese Methoden trainieren Sprachmodelle wie Meta’s Llama und …

Weiterlesen …