OpenAI: Neue Modelle für Reasoning, Übersetzung und Transkription in der Sprach-API

OpenAI hat drei neue Audio-Sprachmodelle über seine Realtime API veröffentlicht. Jedes Modell erfüllt eine andere Aufgabe: Reasoning, Übersetzung und Transkription. Das erste Modell, GPT-Realtime-2, bringt Reasoning auf GPT-5-Niveau in Live-Gespräche. Laut OpenAI kann es komplexe Anfragen bearbeiten, Unterbrechungen verarbeiten und externe Tools aufrufen, ohne den Gesprächsfluss zu unterbrechen. Das zweite Modell, GPT-Realtime-Translate, übersetzt gesprochene Sprache …

Weiterlesen …

Google arbeitet an neuem KI-Agenten namens Remy

Google entwickelt einen neuen KI-Agenten für seine Gemini-Plattform. Der Agent soll eigenständig Aufgaben für Nutzer erledigen. Hilary Langley berichtet für Business Insider, dass das Projekt intern „Remy“ heißt und derzeit von Google-Mitarbeitern getestet wird. Laut einem internen Dokument, das Business Insider vorliegt, läuft Remy in einer mitarbeiterexklusiven Version der Gemini-App. Der Agent ist mit verschiedenen …

Weiterlesen …

Google zeigt nun Reddit-Zitate und Forenlinks in KI-Suchergebnissen

Google aktualisiert seine KI-gestützte Suche und zeigt künftig Zitate und Links aus Online-Foren, sozialen Medien und Diskussionsplattformen direkt in den KI-Antworten an. Laut Google suchen Nutzer zunehmend nach Erfahrungen anderer Menschen statt nach klassischen Websites. Die wichtigste Neuerung: Google blendet sogenannte „Perspectives“ ein, also Ausschnitte aus öffentlichen Diskussionen auf Plattformen wie Reddit. Diese Vorschauen erscheinen …

Weiterlesen …

GPT-5.5 Instant: Weniger Rauschen, mehr Präzision, besseres Gedächtnis

OpenAI hat GPT-5.5 Instant als neues Standard-Modell für ChatGPT veröffentlicht. Es ersetzt GPT-5.3 Instant für alle Nutzer. Laut OpenAI verbessert das Update drei Bereiche: weniger Fehler bei Fakten, kürzere Antworten und bessere Personalisierung. Interne Auswertungen von OpenAI zeigen laut dem Unternehmen, dass GPT-5.5 Instant bei heiklen Themen wie Medizin, Recht und Finanzen 52,5 Prozent weniger …

Weiterlesen …

Mistral startet cloudbasierte Coding-Agenten und neues KI-Modell

Mistral hat cloudbasierte Coding-Agenten sowie ein neues KI-Modell namens Mistral Medium 3.5 veröffentlicht. Das Unternehmen erklärt, dass Programmieraufgaben künftig autonom in der Cloud ablaufen können, ohne dass ein Entwickler dauerhaft am Rechner bleiben muss. Das neue Modell verfügt über 128 Milliarden Parameter und ein Kontextfenster von 256.000 Token. Es vereint Instruktionsbefolgung, logisches Schlussfolgern und Code-Generierung …

Weiterlesen …

Nvidia bündelt Sprache, Bild und Ton in Nemotron 3 Nano Omni

Nvidia hat Nemotron 3 Nano Omni vorgestellt, ein offenes KI-Modell, das Text, Bild und Audio in einem System vereint. Bisherige KI-Agenten nutzen für jede dieser Aufgaben separate Modelle. Das verlangsamt die Verarbeitung und erhöht die Kosten. Nvidia will dieses Problem mit dem neuen Modell lösen. Das Modell basiert auf einer hybriden Mixture-of-Experts-Architektur mit 30 Milliarden …

Weiterlesen …

Forscher veröffentlichen „talkie“, ein Sprachmodell auf Basis von Texten aus dem Jahr 1930

Ein neues Sprachmodell namens „talkie“ zeigt, wie künstliche Intelligenz aussieht, wenn sie ausschließlich auf historischen Texten trainiert wird. Das Modell basiert auf 13 Milliarden Parametern und nutzt Daten aus der Zeit um 1930. Seine Antworten verbinden stilistisch überzeugende Texte mit sachlichen Fehlern. Der offizielle Vorstellungspost beschreibt talkie als eine Art Vintage-KI. Die Ausgaben des Modells …

Weiterlesen …

Anthropic verbindet Claude mit Adobe, Blender und anderen Kreativ-Tools

Anthropic hat eine Reihe von Konnektoren veröffentlicht, die den KI-Assistenten Claude mit weit verbreiteter Software aus der Kreativbranche verbinden. Die Integrationen umfassen Tools für Grafikdesign, 3D-Modellierung, Musikproduktion und Videobearbeitung. Zu den Partnern gehören Adobe, Blender, Ableton, Autodesk, Affinity by Canva, Splice, SketchUp und Resolume. Konnektoren erlauben es Claude, externe Plattformen direkt anzusprechen, Daten abzurufen und …

Weiterlesen …

Mistral AI startet „Workflows“-Plattform für den Unternehmenseinsatz

Mistral AI hat Workflows veröffentlicht, eine Orchestrierungsplattform für den produktiven Einsatz in Unternehmen. Michael Nuñez berichtet für VentureBeat, dass das Pariser Unternehmen mit einem Wert von rund 13,8 Milliarden Dollar das Produkt als öffentliche Vorschau im Rahmen seiner Studio-Plattform lanciert hat. Workflows ermöglicht Entwicklern, mehrstufige KI-Prozesse in Python zu definieren, auszuführen und zu überwachen. Die …

Weiterlesen …

Google testet KI-gestützte Suche für YouTube

Google erprobt eine neue KI-Suchfunktion für YouTube namens „Ask YouTube.“ Jay Peters berichtet für The Verge, dass die Funktion derzeit nur für YouTube-Premium-Abonnenten in den USA ab 18 Jahren verfügbar ist. Nutzer können statt einzelner Suchbegriffe vollständige Fragen in natürlicher Sprache eingeben. YouTube erstellt daraufhin eine Ergebnisseite mit Textzusammenfassungen, langen Videos, YouTube Shorts und Vorschlägen …

Weiterlesen …

×