Amazon testet KI-Assistenten für Shopping und Gesundheitsberatung

Amazon entwickelt neue generative KI-Tools für sein E-Commerce-Angebot. Der Konzern testet derzeit zwei neue Assistenten: Interests AI für personalisierte Produktempfehlungen und Health AI für medizinische Beratung. Wie Annie Palmer von CNBC berichtet, sind beide Funktionen aktuell nur für eine begrenzte Nutzergruppe verfügbar. Interests AI ermöglicht es Kunden, ihre Wünsche in natürlicher Sprache zu beschreiben und …

Weiterlesen …

OpenAI bringt KI-Bildgenerierung auf ein neues Level

OpenAI hat native Bildgenerierungsfunktionen direkt in ChatGPT eingeführt, die vom multimodalen Modell GPT-4o angetrieben werden. Diese neue Funktion, „Images in ChatGPT“ genannt, steht jetzt Nutzern der Plus-, Pro-, Team- und kostenlosen Zugänge zur Verfügung. Optionen für Enterprise, Edu und über die API folgen in Kürze. Im Gegensatz zum bisherigen DALL-E 3-Bildgenerator, der ein separates Diffusionsmodell …

Weiterlesen …

Googles Gemini 2.5 Pro hat Reasoning-Funktionen integriert

Google hat Gemini 2.5 Pro veröffentlicht und beschreibt es als sein bisher „intelligentestes KI-Modell“. Das neue Modell stellt einen bedeutenden Fortschritt in Googles KI-Fähigkeiten dar, mit besonderem Fokus auf Reasoning-Funktionen, die jetzt direkt ins System integriert sind. Laut Googles Ankündigung sind Gemini 2.5-Modelle „denkende Modelle“, die in einem Zwischenschritt überlegen können, bevor sie antworten, was …

Weiterlesen …

Reve Image 1.0 ist ein vielversprechender neuer KI-Bildgenerator

Reve AI hat Reve Image 1.0 veröffentlicht, ein neues Text-zu-Bild-Modell, das laut des unabhängigen Bewertungsdienstes Artificial Analysis derzeit auf Platz eins im Bereich Bildqualität rangiert. Wie Carl Franzen in VentureBeat berichtet, übertrifft das Modell Konkurrenten wie Midjourney v6.1 und Googles Imagen 3 besonders bei der Einhaltung von Eingabeaufforderungen, Ästhetik und Typografie. Das in Palo Alto …

Weiterlesen …

OpenAI verbessert ChatGPTs Sprachassistenten und reduziert Unterbrechungen

OpenAI hat seinen Advanced Voice Mode aktualisiert, um Gespräche mit ChatGPT natürlicher zu gestalten, indem Unterbrechungen bei Sprechpausen verringert werden. Die Verbesserungen wurden laut TechCrunch-Autor Maxwell Zeff von OpenAI-Forscherin Manuka Stratta angekündigt. Kostenlose Nutzer erhalten nun Zugang zu einer Version, die Pausen ohne Unterbrechungen ermöglicht. Zahlende Abonnenten profitieren zusätzlich von selteneren Unterbrechungen und einer „verbesserten …

Weiterlesen …

Tencent stellt KI-Modell Hunyuan T1 als Konkurrenz zu DeepSeek R1 vor

Der chinesische Tech-Konzern Tencent hat sein KI-Reasoning-Modell Hunyuan T1 vorgestellt, das in Leistung und Preis mit DeepSeeks R1 konkurriert. Wie Coco Feng für South China Morning Post berichtet, erreicht das Modell 87,2 Punkte im MMLU Pro Benchmark und übertrifft damit DeepSeek-R1 (84 Punkte), liegt aber hinter OpenAIs o1 (89,3 Punkte). Die Preisgestaltung ist mit 1 …

Weiterlesen …

OpenAI: Neue KI-Modelle für Sprache und Transkription

OpenAI hat drei neue KI-Modelle eingeführt, die Sprache-zu-Text- und Text-zu-Sprache-Funktionen verbessern. Die Modelle gpt-4o-transcribe, gpt-4o-mini-transcribe und gpt-4o-mini-tts bieten Entwicklern höhere Genauigkeit und erweiterte Anpassungsoptionen für Sprachanwendungen. Laut OpenAI übertreffen die neuen Transkriptionsmodelle ihren Vorgänger Whisper deutlich, besonders in lauten Umgebungen und bei verschiedenen Akzenten. Die internen Benchmarks des Unternehmens zeigen, dass das gpt-4o-transcribe-Modell eine Wortfehlerrate …

Weiterlesen …

Claude erhält Websuche-Funktion und Zugriff auf Echtzeit-Informationen

Anthropic hat offiziell eine Websuche-Funktion für seinen KI-Chatbot Claude eingeführt, über die der Assistenten nun auf Echtzeit-Informationen aus dem Internet zugreifen und diese verarbeiten kann. Die neue Funktion, die eine der am häufigsten gewünschten Features der Nutzer erfüllt, ist derzeit als Vorschau für zahlende Claude-Nutzer in den USA verfügbar. Eine Erweiterung auf kostenlose Nutzer und …

Weiterlesen …

Google gibt sechs Tipps zur Nutzung von Gemini Deep Research

Google hat Ratschläge dazu veröffentlicht, wie Nutzer das Deep Research-Tool optimal einsetzen können, das jetzt für alle verfügbar ist. Das Tool erstellt umfassende Berichte zu komplexen Themen und kann dabei erheblich Zeit für Recherchen sparen. Gemini Senior Product Manager Aarush Selvan erklärt im offiziellen Google Blog, dass Deep Research besonders nützlich ist für Aufgaben, die …

Weiterlesen …

o1-pro ist OpenAIs bisher teuerste KI-Modell

OpenAI hat o1-pro veröffentlicht, eine leistungsstärkere Version seines Reasoning-KI-Modells o1. Das neue Modell ist ausgewählten Entwicklern zugänglich, die mindestens 5 Dollar für OpenAI-API-Dienste ausgegeben haben. Laut des Berichts von Kyle Wiggers kostet o1-pro 150 Dollar pro Million Token für Eingaben und 600 Dollar pro Million Token für Ausgaben. Dies macht es doppelt so teuer wie …

Weiterlesen …

×