Character.AI AvatarFX für realistische Videogenerierung

Character.AI hat AvatarFX vorgestellt, ein neues Videogenerierungsmodell, das sowohl KI-Charaktere als auch hochgeladene Bilder animieren kann. Laut Unternehmen kann die Technologie fotorealistische Videos mit Audio erzeugen, die Konsistenz bei Gesichts-, Hand- und Körperbewegungen auch bei längeren Inhalten bewahren. Das System baut auf einer Diffusionsmodell-Architektur mit einem parametereffizienten Trainingsprozess auf, um realistische Lippen-, Kopf- und Körperbewegungen …

Weiterlesen …

OpenAIs neue KI-Modelle halluzinieren häufiger

Die neuen Reasoning-KI-Modelle o3 und o4-mini von OpenAI weisen höhere Halluzinationsraten auf als ihre Vorgänger. Interne Tests zeigen, dass o3 bei 33% der Fragen im PersonQA-Benchmark falsche Informationen erzeugt – etwa doppelt so häufig wie frühere Modelle. Das o4-mini schnitt mit 48% noch schlechter ab, wie TechCrunch berichtet. OpenAI gibt in seinem technischen Bericht zu, …

Weiterlesen …

Neues KI-Sprachmodell Dia bietet natürliche Dialogfähigkeiten

Das Startup Nari Labs hat mit Dia ein Open-Source-Sprachmodell veröffentlicht, das natürlich klingende Dialoge erzeugen kann. Wie VentureBeat-Journalist Carl Franzen berichtet, soll das 1,6 Milliarden Parameter umfassende Modell mit Angeboten von ElevenLabs, OpenAI und Googles NotebookLM konkurrieren können. Mitgründer Toby Kim entwickelte Dia „ohne Finanzierung“ mit Unterstützung von Google, das Zugang zu TPU-Chips gewährte. Das …

Weiterlesen …

Google macht KI-Modelle Gemma 3 auf üblichen Grafikkarten lauffähig

Google hat neue Versionen seiner Gemma 3 KI-Modelle veröffentlicht, die dank einer speziellen Technik namens Quantization-Aware Training (QAT) auf handelsüblichen Grafikkarten laufen können. Diese Entwicklung macht leistungsstarke KI-Modelle für Nutzer ohne High-End-Hardware zugänglich. Der Speicherbedarf wurde durch QAT erheblich reduziert, während die Qualität der Modelle erhalten bleibt. Das größte Gemma 3 Modell mit 27 Milliarden …

Weiterlesen …

Kagi Assistant jetzt für alle Nutzer verfügbar

Der Suchmaschinenbetreiber Kagi hat angekündigt, dass sein KI-Assistant nun für alle Nutzer unabhängig vom Abonnement ohne zusätzliche Kosten verfügbar ist. Das Angebot kombiniert führende Large Language Models (LLMs) mit optionaler Integration von Kagi-Suchergebnissen. Das Feature war bisher ausschließlich Ultimate-Abonnenten vorbehalten und wird nun allen Kunden im Rahmen ihrer bestehenden Abonnements angeboten. Datenschutz bleibt laut Kagi …

Weiterlesen …

Google stellt Gemini 2.5 Flash mit einstellbaren „Thinking“-Fähigkeiten vor

Google hat Gemini 2.5 Flash als Vorschauversion veröffentlicht und bietet Entwicklern beispiellose Kontrolle über die Reasoning-Fähigkeiten des KI-Modells. Diese neue Version ermöglicht es Nutzern, „Thinking“ (das Denken des Modells) ein- oder auszuschalten und spezifische „Thinking-Budgets“ festzulegen, um Qualität, Kosten und Antwortzeit zu optimieren. Die Preisstruktur zeigt die Kostenauswirkungen des Reasonings deutlich: Die Eingabe kostet 0,15 …

Weiterlesen …

Leitfaden: GPT-4.1 erfordert präzisere Anweisungen als Vorgängermodelle

OpenAI hat einen umfassenden Leitfaden für die Prompt-Erstellung bei der neuen GPT-4.1-Modellfamilie veröffentlicht. Der Leitfaden hebt bedeutende Verbesserungen in den Bereichen Programmierung, Befolgung von Anweisungen und Verarbeitung langer Kontexte im Vergleich zu GPT-4o hervor. Laut der Veröffentlichung müssen Entwickler ihre Prompts möglicherweise anpassen, da GPT-4.1 Anweisungen wörtlicher befolgt als frühere Versionen, die Benutzerabsichten freier interpretierten. …

Weiterlesen …

OpenAI o3 und o4-mini bringen neue Fähigkeiten zu Reasoning-KI

OpenAI hat zwei neue KI-Modelle, o3 und o4-mini, veröffentlicht, die erweiterte Reasoning-Fähigkeiten bieten und neue Funktionen wie das „Denken mit Bildern“ einführen. Diese Modelle sind die neueste Entwicklung in der o-Serie des Unternehmens und erscheinen nur wenige Tage nach der Veröffentlichung von GPT-4.1. Die markanteste Eigenschaft der Modelle ist ihre Fähigkeit, Bilder nicht nur zu …

Weiterlesen …

OpenAI stellt Zugang zu GPT-4.5 über API bis Mitte Juli ein

OpenAI wird seinen bisher größten KI-Modell GPT-4.5 bis zum 14. Juli aus seiner API entfernen. Wie Kyle Wiggers von TechCrunch berichtet, müssen Entwickler auf andere Modelle umsteigen, wobei GPT-4.1 als bevorzugter Ersatz empfohlen wird. Ein OpenAI-Sprecher erklärte, dass GPT-4.1 „ähnliche oder bessere Leistung als GPT-4.5 in wichtigen Bereichen zu deutlich niedrigeren Kosten“ biete. Das erst …

Weiterlesen …

Coheres neues Embed 4-Modell verarbeitet 200-seitige Dokumente

Cohere hat ein verbessertes multimodales Embedding-Modell namens Embed 4 vorgestellt. Das Modell verfügt über ein Kontextfenster von 128.000 Token und kann Dokumente mit bis zu 200 Seiten verarbeiten. Wie Emilia David von VentureBeat berichtet, stärkt Embed 4 die Fähigkeiten im Bereich Retrieval Augmented Generation (RAG) für Unternehmen. Das Modell unterstützt unstrukturierte Daten in mehr als …

Weiterlesen …

×