Pleias veröffentlicht kleine KI-Modelle für RAG mit integrierter Quellenangabe

Das französische KI-Startup Pleias hat zwei quelloffene Reasoning-Modelle für Retrieval-Augmented Generation (RAG) mit nativer Zitierunterstützung vorgestellt. Laut Carl Franzen von VentureBeat sind die neuen Modelle – Pleias-RAG-350M und Pleias-RAG-1B – unter der Apache 2.0-Lizenz verfügbar und erlauben kommerzielle Nutzung. Trotz ihrer geringen Größe übertreffen die Modelle viele größere Alternativen bei komplexen Reasoning-Aufgaben und bieten starke …

Weiterlesen …

Adobe Firefly: neue KI-Modelle, neues Web-Interface

Adobe hat ein umfassendes Update seiner Firefly KI-Plattform veröffentlicht, das neue Bildgenerierungsmodelle und eine überarbeitete Web-App umfasst, die nun auch KI-Modelle von Wettbewerbern integriert. Das Unternehmen stellte Firefly Image Model 4 vor, das laut Adobe verbesserte Qualität, Geschwindigkeit und mehr Kontrolle über Bildergebnisse mit Auflösungen bis zu 2K bietet. Eine fortschrittlichere Version, Image Model 4 …

Weiterlesen …

Perplexity bringt Sprachassistenten mit App-übergreifenden Funktionen auch zu älteren iPhones

Perplexity hat ein Update seiner iOS-App veröffentlicht, das einen Sprachassistenten hinzufügt. Wie Umar Shakir von The Verge berichtet, können iPhone-Nutzer nun per Sprachbefehl Erinnerungen erstellen, Nachrichten senden und Restaurantreservierungen vornehmen. Der Assistent funktioniert auch, wenn Nutzer die App verlassen, bietet jedoch nicht die Bildschirmfreigabe wie die Android-Version. Im Gegensatz zu Apples künftigen KI-Siri-Funktionen arbeitet Perplexitys …

Weiterlesen …

Character.AI AvatarFX für realistische Videogenerierung

Character.AI hat AvatarFX vorgestellt, ein neues Videogenerierungsmodell, das sowohl KI-Charaktere als auch hochgeladene Bilder animieren kann. Laut Unternehmen kann die Technologie fotorealistische Videos mit Audio erzeugen, die Konsistenz bei Gesichts-, Hand- und Körperbewegungen auch bei längeren Inhalten bewahren. Das System baut auf einer Diffusionsmodell-Architektur mit einem parametereffizienten Trainingsprozess auf, um realistische Lippen-, Kopf- und Körperbewegungen …

Weiterlesen …

OpenAIs neue KI-Modelle halluzinieren häufiger

Die neuen Reasoning-KI-Modelle o3 und o4-mini von OpenAI weisen höhere Halluzinationsraten auf als ihre Vorgänger. Interne Tests zeigen, dass o3 bei 33% der Fragen im PersonQA-Benchmark falsche Informationen erzeugt – etwa doppelt so häufig wie frühere Modelle. Das o4-mini schnitt mit 48% noch schlechter ab, wie TechCrunch berichtet. OpenAI gibt in seinem technischen Bericht zu, …

Weiterlesen …

Neues KI-Sprachmodell Dia bietet natürliche Dialogfähigkeiten

Das Startup Nari Labs hat mit Dia ein Open-Source-Sprachmodell veröffentlicht, das natürlich klingende Dialoge erzeugen kann. Wie VentureBeat-Journalist Carl Franzen berichtet, soll das 1,6 Milliarden Parameter umfassende Modell mit Angeboten von ElevenLabs, OpenAI und Googles NotebookLM konkurrieren können. Mitgründer Toby Kim entwickelte Dia „ohne Finanzierung“ mit Unterstützung von Google, das Zugang zu TPU-Chips gewährte. Das …

Weiterlesen …

Google macht KI-Modelle Gemma 3 auf üblichen Grafikkarten lauffähig

Google hat neue Versionen seiner Gemma 3 KI-Modelle veröffentlicht, die dank einer speziellen Technik namens Quantization-Aware Training (QAT) auf handelsüblichen Grafikkarten laufen können. Diese Entwicklung macht leistungsstarke KI-Modelle für Nutzer ohne High-End-Hardware zugänglich. Der Speicherbedarf wurde durch QAT erheblich reduziert, während die Qualität der Modelle erhalten bleibt. Das größte Gemma 3 Modell mit 27 Milliarden …

Weiterlesen …

Kagi Assistant jetzt für alle Nutzer verfügbar

Der Suchmaschinenbetreiber Kagi hat angekündigt, dass sein KI-Assistant nun für alle Nutzer unabhängig vom Abonnement ohne zusätzliche Kosten verfügbar ist. Das Angebot kombiniert führende Large Language Models (LLMs) mit optionaler Integration von Kagi-Suchergebnissen. Das Feature war bisher ausschließlich Ultimate-Abonnenten vorbehalten und wird nun allen Kunden im Rahmen ihrer bestehenden Abonnements angeboten. Datenschutz bleibt laut Kagi …

Weiterlesen …

Google stellt Gemini 2.5 Flash mit einstellbaren „Thinking“-Fähigkeiten vor

Google hat Gemini 2.5 Flash als Vorschauversion veröffentlicht und bietet Entwicklern beispiellose Kontrolle über die Reasoning-Fähigkeiten des KI-Modells. Diese neue Version ermöglicht es Nutzern, „Thinking“ (das Denken des Modells) ein- oder auszuschalten und spezifische „Thinking-Budgets“ festzulegen, um Qualität, Kosten und Antwortzeit zu optimieren. Die Preisstruktur zeigt die Kostenauswirkungen des Reasonings deutlich: Die Eingabe kostet 0,15 …

Weiterlesen …

Leitfaden: GPT-4.1 erfordert präzisere Anweisungen als Vorgängermodelle

OpenAI hat einen umfassenden Leitfaden für die Prompt-Erstellung bei der neuen GPT-4.1-Modellfamilie veröffentlicht. Der Leitfaden hebt bedeutende Verbesserungen in den Bereichen Programmierung, Befolgung von Anweisungen und Verarbeitung langer Kontexte im Vergleich zu GPT-4o hervor. Laut der Veröffentlichung müssen Entwickler ihre Prompts möglicherweise anpassen, da GPT-4.1 Anweisungen wörtlicher befolgt als frühere Versionen, die Benutzerabsichten freier interpretierten. …

Weiterlesen …