OpenAI verbessert ChatGPTs Sprachassistenten und reduziert Unterbrechungen

OpenAI hat seinen Advanced Voice Mode aktualisiert, um Gespräche mit ChatGPT natürlicher zu gestalten, indem Unterbrechungen bei Sprechpausen verringert werden. Die Verbesserungen wurden laut TechCrunch-Autor Maxwell Zeff von OpenAI-Forscherin Manuka Stratta angekündigt. Kostenlose Nutzer erhalten nun Zugang zu einer Version, die Pausen ohne Unterbrechungen ermöglicht. Zahlende Abonnenten profitieren zusätzlich von selteneren Unterbrechungen und einer „verbesserten …

Weiterlesen …

Tencent stellt KI-Modell Hunyuan T1 als Konkurrenz zu DeepSeek R1 vor

Der chinesische Tech-Konzern Tencent hat sein KI-Reasoning-Modell Hunyuan T1 vorgestellt, das in Leistung und Preis mit DeepSeeks R1 konkurriert. Wie Coco Feng für South China Morning Post berichtet, erreicht das Modell 87,2 Punkte im MMLU Pro Benchmark und übertrifft damit DeepSeek-R1 (84 Punkte), liegt aber hinter OpenAIs o1 (89,3 Punkte). Die Preisgestaltung ist mit 1 …

Weiterlesen …

OpenAI: Neue KI-Modelle für Sprache und Transkription

OpenAI hat drei neue KI-Modelle eingeführt, die Sprache-zu-Text- und Text-zu-Sprache-Funktionen verbessern. Die Modelle gpt-4o-transcribe, gpt-4o-mini-transcribe und gpt-4o-mini-tts bieten Entwicklern höhere Genauigkeit und erweiterte Anpassungsoptionen für Sprachanwendungen. Laut OpenAI übertreffen die neuen Transkriptionsmodelle ihren Vorgänger Whisper deutlich, besonders in lauten Umgebungen und bei verschiedenen Akzenten. Die internen Benchmarks des Unternehmens zeigen, dass das gpt-4o-transcribe-Modell eine Wortfehlerrate …

Weiterlesen …

Claude erhält Websuche-Funktion und Zugriff auf Echtzeit-Informationen

Anthropic hat offiziell eine Websuche-Funktion für seinen KI-Chatbot Claude eingeführt, über die der Assistenten nun auf Echtzeit-Informationen aus dem Internet zugreifen und diese verarbeiten kann. Die neue Funktion, die eine der am häufigsten gewünschten Features der Nutzer erfüllt, ist derzeit als Vorschau für zahlende Claude-Nutzer in den USA verfügbar. Eine Erweiterung auf kostenlose Nutzer und …

Weiterlesen …

Google gibt sechs Tipps zur Nutzung von Gemini Deep Research

Google hat Ratschläge dazu veröffentlicht, wie Nutzer das Deep Research-Tool optimal einsetzen können, das jetzt für alle verfügbar ist. Das Tool erstellt umfassende Berichte zu komplexen Themen und kann dabei erheblich Zeit für Recherchen sparen. Gemini Senior Product Manager Aarush Selvan erklärt im offiziellen Google Blog, dass Deep Research besonders nützlich ist für Aufgaben, die …

Weiterlesen …

o1-pro ist OpenAIs bisher teuerste KI-Modell

OpenAI hat o1-pro veröffentlicht, eine leistungsstärkere Version seines Reasoning-KI-Modells o1. Das neue Modell ist ausgewählten Entwicklern zugänglich, die mindestens 5 Dollar für OpenAI-API-Dienste ausgegeben haben. Laut des Berichts von Kyle Wiggers kostet o1-pro 150 Dollar pro Million Token für Eingaben und 600 Dollar pro Million Token für Ausgaben. Dies macht es doppelt so teuer wie …

Weiterlesen …

Operative Games stellt neue KI-Plattform für interaktives Storytelling vor

Operative Games hat seine KI-basierte Plattform für interaktives Storytelling präsentiert. Das Unternehmen trat aus seiner Entwicklungsphase mit Investitionen von 1AM Gaming, Samsung Next und LongJourney.vc hervor. Dean Takahashi berichtet, dass die Firma von Jon Snoddy, ehemaliger Leiter der Walt Disney Forschung, Jon Kraft, Gründer von Pandora Media, und der Spielebranchenveteranin Pegi Bryant gegründet wurde. Die …

Weiterlesen …

Stable Virtual Camera verwandelt 2D-Bilder in Videos

Stability AI hat Stable Virtual Camera vorgestellt, ein neues KI-Modell zur Umwandlung von 2D-Bildern in Videos. Wie Ana Guillen im offiziellen Post berichtet, ermöglicht die Forschungsvorschau immersive Videos mit realistischer Tiefe und Perspektive ohne komplexe Rekonstruktionsverfahren. Das System kann aus einem einzelnen oder bis zu 32 Bildern Videos generieren und folgt dabei benutzerdefinierten Kamerapfaden oder …

Weiterlesen …

Nvidia zeigt Llama Nemotron-Modelle für KI-Agenten und Reasoning

Auf der GPU Technology Conference (GTC) 2025 kündigte Nvidia eine neue Familie von KI-Modellen namens Llama Nemotron an, die entwickelt wurden, um die Reasoning-Fähigkeiten autonomer KI-Agenten zu verbessern. Diese Modelle basieren auf Metas Open-Source-Llama-Modellen, wurden jedoch durch Post-Training-Optimierungstechniken verfeinert, um ihre Leistung bei komplexen Aufgaben wie mehrstufiger Mathematik, Programmierung und Entscheidungsfindung zu verbessern. Die Llama …

Weiterlesen …

Adobe stellt KI-Agenten für Marketingautomatisierung vor

Adobe hat neue KI-Agenten-Tools eingeführt, die Marketing- und Vertriebsprozesse automatisieren. Der auf dem Adobe Summit vorgestellte Adobe Experience Agent Orchestrator kann mehrere KI-Agenten verwalten, die mit Kundendaten arbeiten. Wie SiliconANGLE berichtet, hat Adobe zehn vorgefertigte „Experience Agents“ veröffentlicht, die spezialisierte Aufgaben übernehmen, etwa Verkaufskontakte bewerten, Zielgruppensegmente optimieren und Marketingmaterialien erstellen. Das Unternehmen stellte auch den …

Weiterlesen …