Hugging Face veröffentlicht kleines Sprachmodell mit vollständiger Bauanleitung

Hugging Face hat mit SmolLM3 ein neues kleines Sprachmodell veröffentlicht. Laut der offiziellen Ankündigung des Unternehmens ist das 3-Milliarden-Parameter-Modell besonders leistungsstark und effizient. Eine Besonderheit ist der duale Modus: Das Modell kann entweder direkt antworten oder seinen Denkprozess transparent aufzeigen. Es verarbeitet zudem lange Texte mit bis zu 128.000 Tokens und unterstützt sechs europäische Sprachen. …

Weiterlesen …

MiniMax veröffentlicht leistungsstarkes Open-Source-KI-Modell

Das chinesische Unternehmen MiniMax hat MiniMax-M1 veröffentlicht, ein neues Open-Source-Sprachmodell mit einem Kontextfenster von einer Million Token. Damit kann es ganze Buchsammlungen in einem Gespräch verarbeiten, berichtet Carl Franzen für VentureBeat. Das Modell steht unter Apache 2.0 Lizenz kostenlos für kommerzielle Nutzung auf Plattformen wie Hugging Face zur Verfügung. MiniMax-M1 gibt es in zwei Varianten …

Weiterlesen …

DeepSeek veröffentlicht großes Update

Das chinesische KI-Startup DeepSeek hat ein bedeutendes Update für sein Open-Source-Reasoning-Modell veröffentlicht. Die neue Version DeepSeek-R1-0528 kommt kostenpflichtigen Diensten von OpenAI und Google deutlich näher. Das Modell zeigt erhebliche Verbesserungen bei komplexen Denkaufgaben in Mathematik, Wissenschaft und Programmierung. Carl Franzen von VentureBeat berichtet, dass das aktualisierte Modell 87,5 Prozent Genauigkeit im AIME 2025 Test erreichte. …

Weiterlesen …

Google stellt schnelle Text-KI mit Diffusion-Technologie vor

Google präsentierte auf seiner I/O-Entwicklerkonferenz Gemini Diffusion und markiert damit einen wichtigen Wandel in der Texterzeugung von KI-Modellen. Das experimentelle Modell nutzt Diffusion-Technologie anstelle des traditionellen Transformer-Ansatzes, der ChatGPT und ähnliche Systeme antreibt. Der Hauptvorteil ist die Geschwindigkeit. Gemini Diffusion erzeugt Text mit 857 bis 2.000 Token pro Sekunde und damit vier- bis fünfmal schneller …

Weiterlesen …

Prime Intellects neue KI wurde dezentral trainiert

Prime Intellect hat mit INTELLECT-2 ein KI-Modell mit 32 Milliarden Parametern veröffentlicht, das erstmals durch global verteiltes Reinforcement Learning trainiert wurde. Das Modell nutzt einen dezentralen Ansatz mit Rechenressourcen von Mitwirkenden weltweit anstatt zentralisierter GPU-Cluster. Die speziell entwickelte Infrastruktur umfasst Komponenten wie PRIME-RL, TOPLOC und SHARDCAST, die asynchrones Training über heterogene Netzwerke ermöglichen. Laut Prime …

Weiterlesen …

Anthropic führt „Max“-Tarif für mehr Claude-Nutzung ein

Anthropic hat eine neue Abonnementstufe namens „Max“ für seinen KI-Assistenten Claude eingeführt, die bis zu 20-mal höhere Nutzungslimits als der Pro-Plan bietet. Der neue Plan richtet sich an Nutzer, die intensiv mit Claude zusammenarbeiten und erweiterten Zugriff für anspruchsvolle Projekte benötigen. Das Max-Abonnement ist in zwei Preisstufen erhältlich: 100 Dollar monatlich für die fünffache Nutzung …

Weiterlesen …

Google macht Gemini 2.5 Pro zu günstigen Preisen allgemein verfügbar

Google hat bekannt gegeben, dass sein Gemini 2.5 Pro-Modell jetzt als öffentliche Vorschau über die Gemini API in Google AI Studio verfügbar ist, wobei die Einführung in Vertex AI in Kürze erwartet wird. Laut Google ist dieses Modell ihr bisher „intelligentestes“ und wurde mit 1,24 $ pro Million Input-Tokens und 10 $ pro Million Output-Tokens …

Weiterlesen …

Midjourney entwickelt Methoden für kreativere KI-Texte

Midjourney, bekannt für KI-Bildgenerierung, hat gemeinsam mit der New York University eine Forschungsarbeit veröffentlicht, die sich mit kreativeren Texten von Sprachmodellen befasst. Wie Carl Franzen für VentureBeat berichtet, stellt die Studie zwei neue Techniken vor: Diversified Direct Preference Optimization (DDPO) und Diversified Odds Ratio Preference Optimization (DORPO). Diese Methoden trainieren Sprachmodelle wie Meta’s Llama und …

Weiterlesen …

Statistik zeigt beliebteste KI-Modelle für Text, Bild, Video

Die KI-Plattform Poe hat einen Trendbericht für das Frühjahr 2025 veröffentlicht, der bedeutende Veränderungen in den Nutzerpräferenzen bei KI-Modellen aufzeigt. Bei der Texterstellung dominieren OpenAI und Anthropic mit zusammen rund 85% der Nachrichten, wobei seit der Einführung von Claude 3.5 Sonnet im Juni 2024 beide Anbieter bei Poe-Abonnenten nahezu gleichauf liegen. Im Bereich der Bildgenerierung …

Weiterlesen …

Cohere stellt Aya Vision vor, ein mehrsprachiges Bildverarbeitungsmodell

Die Forschungsabteilung von Cohere hat Aya Vision eingeführt, ein Bildverarbeitungsmodell mit offenen Gewichten, das 23 Sprachen unterstützt. Laut VentureBeat-Bericht von Carl Franzen gibt es das Modell in Versionen mit 8 und 32 Milliarden Parametern. Es kann Bilder analysieren, Text generieren und visuelle Inhalte übersetzen. Aya Vision übertrifft größere Modelle wie Llama 90B bei geringerem Ressourcenbedarf. …

Weiterlesen …