DeepSeek veröffentlicht großes Update

Das chinesische KI-Startup DeepSeek hat ein bedeutendes Update für sein Open-Source-Reasoning-Modell veröffentlicht. Die neue Version DeepSeek-R1-0528 kommt kostenpflichtigen Diensten von OpenAI und Google deutlich näher. Das Modell zeigt erhebliche Verbesserungen bei komplexen Denkaufgaben in Mathematik, Wissenschaft und Programmierung. Carl Franzen von VentureBeat berichtet, dass das aktualisierte Modell 87,5 Prozent Genauigkeit im AIME 2025 Test erreichte. … Weiterlesen …

Google stellt schnelle Text-KI mit Diffusion-Technologie vor

Google präsentierte auf seiner I/O-Entwicklerkonferenz Gemini Diffusion und markiert damit einen wichtigen Wandel in der Texterzeugung von KI-Modellen. Das experimentelle Modell nutzt Diffusion-Technologie anstelle des traditionellen Transformer-Ansatzes, der ChatGPT und ähnliche Systeme antreibt. Der Hauptvorteil ist die Geschwindigkeit. Gemini Diffusion erzeugt Text mit 857 bis 2.000 Token pro Sekunde und damit vier- bis fünfmal schneller … Weiterlesen …

Prime Intellects neue KI wurde dezentral trainiert

Prime Intellect hat mit INTELLECT-2 ein KI-Modell mit 32 Milliarden Parametern veröffentlicht, das erstmals durch global verteiltes Reinforcement Learning trainiert wurde. Das Modell nutzt einen dezentralen Ansatz mit Rechenressourcen von Mitwirkenden weltweit anstatt zentralisierter GPU-Cluster. Die speziell entwickelte Infrastruktur umfasst Komponenten wie PRIME-RL, TOPLOC und SHARDCAST, die asynchrones Training über heterogene Netzwerke ermöglichen. Laut Prime … Weiterlesen …

Anthropic führt „Max“-Tarif für mehr Claude-Nutzung ein

Anthropic hat eine neue Abonnementstufe namens „Max“ für seinen KI-Assistenten Claude eingeführt, die bis zu 20-mal höhere Nutzungslimits als der Pro-Plan bietet. Der neue Plan richtet sich an Nutzer, die intensiv mit Claude zusammenarbeiten und erweiterten Zugriff für anspruchsvolle Projekte benötigen. Das Max-Abonnement ist in zwei Preisstufen erhältlich: 100 Dollar monatlich für die fünffache Nutzung … Weiterlesen …

Google macht Gemini 2.5 Pro zu günstigen Preisen allgemein verfügbar

Google hat bekannt gegeben, dass sein Gemini 2.5 Pro-Modell jetzt als öffentliche Vorschau über die Gemini API in Google AI Studio verfügbar ist, wobei die Einführung in Vertex AI in Kürze erwartet wird. Laut Google ist dieses Modell ihr bisher „intelligentestes“ und wurde mit 1,24 $ pro Million Input-Tokens und 10 $ pro Million Output-Tokens … Weiterlesen …

Midjourney entwickelt Methoden für kreativere KI-Texte

Midjourney, bekannt für KI-Bildgenerierung, hat gemeinsam mit der New York University eine Forschungsarbeit veröffentlicht, die sich mit kreativeren Texten von Sprachmodellen befasst. Wie Carl Franzen für VentureBeat berichtet, stellt die Studie zwei neue Techniken vor: Diversified Direct Preference Optimization (DDPO) und Diversified Odds Ratio Preference Optimization (DORPO). Diese Methoden trainieren Sprachmodelle wie Meta’s Llama und … Weiterlesen …

Statistik zeigt beliebteste KI-Modelle für Text, Bild, Video

Die KI-Plattform Poe hat einen Trendbericht für das Frühjahr 2025 veröffentlicht, der bedeutende Veränderungen in den Nutzerpräferenzen bei KI-Modellen aufzeigt. Bei der Texterstellung dominieren OpenAI und Anthropic mit zusammen rund 85% der Nachrichten, wobei seit der Einführung von Claude 3.5 Sonnet im Juni 2024 beide Anbieter bei Poe-Abonnenten nahezu gleichauf liegen. Im Bereich der Bildgenerierung … Weiterlesen …

Cohere stellt Aya Vision vor, ein mehrsprachiges Bildverarbeitungsmodell

Die Forschungsabteilung von Cohere hat Aya Vision eingeführt, ein Bildverarbeitungsmodell mit offenen Gewichten, das 23 Sprachen unterstützt. Laut VentureBeat-Bericht von Carl Franzen gibt es das Modell in Versionen mit 8 und 32 Milliarden Parametern. Es kann Bilder analysieren, Text generieren und visuelle Inhalte übersetzen. Aya Vision übertrifft größere Modelle wie Llama 90B bei geringerem Ressourcenbedarf. … Weiterlesen …

Microsoft bringt Copilot-App für Mac mit neuen Funktionen

Microsoft hat eine native Copilot-App für macOS-Nutzer in den USA, Großbritannien und Kanada veröffentlicht. Tom Warren von The Verge berichtet, dass die App Zugang zum webbasierten KI-Assistenten von Microsoft bietet. Nutzer können damit Bilder und Texte generieren oder Bilder hochladen. Die Mac-Version verfügt über einen Dunkelmodus und lässt sich mit Command + Space aktivieren, ähnlich … Weiterlesen …

Diese Sprachmodelle sind zehnmal schneller als die Konkurrenz

Inception Labs hat mit Mercury eine neue Familie von Sprachmodellen vorgestellt, die auf Diffusionstechnologie basieren und Texte bis zu zehnmal schneller generieren können als herkömmliche LLMs. Die Mercury-Modelle erreichen laut Unternehmensangaben mehr als 1.000 Token pro Sekunde auf NVIDIA H100 Grafikprozessoren – eine Geschwindigkeit, die bisher nur mit Spezialchips möglich war. Das erste öffentlich verfügbare … Weiterlesen …