Alexa+ produziert Podcasts nach Wunsch mit KI

Amazon hat seinen KI-Sprachassistenten Alexa+ um eine Podcast-Funktion erweitert. Todd Spangler berichtet für Variety, dass das neue Feature namens Alexa Podcasts Audioepisoden vollständig durch künstliche Intelligenz erstellt, mit zwei synthetischen Stimmen als Gastgeber. Nutzer nennen Alexa+ per Sprache ein gewünschtes Thema. Der Assistent erstellt daraufhin eine Übersicht des geplanten Inhalts. Länge und Schwerpunkte lassen sich …

Weiterlesen …

Thinking Machines zeigt KI-Modell, das in Echtzeit zuhört und antwortet

Das KI-Unternehmen Thinking Machines, mitgegründet von der früheren OpenAI-Technikchefin Mira Murati, hat eine Forschungsvorschau sogenannter „Interaction Models“ veröffentlicht. Diese KI-Systeme sollen in Echtzeit wahrnehmen und antworten, anstatt auf das Ende einer Eingabe zu warten. Bisherige KI-Modelle arbeiten im Wechsel: Der Nutzer schickt eine Eingabe, das Modell verarbeitet sie und antwortet. Thinking Machines sieht darin eine …

Weiterlesen …

Claude for Small Business: Tool-Integrationen und kostenloses Training für KMU

Anthropic hat Claude for Small Business gestartet. Das Produkt ist ein Paket aus Software-Integrationen und vorgefertigten Arbeitsabläufen, das den KI-Assistenten Claude in den Alltag kleiner und mittlerer Unternehmen bringen soll. Es läuft innerhalb von Claude Cowork, der Automatisierungsplattform von Anthropic, und verbindet sich mit Tools, die Kleinunternehmen oftmals bereits nutzen. Das Paket umfasst Integrationen mit …

Weiterlesen …

Google bringt KI-Automatisierung und Kreativfunktionen zu Android 17

Google hat eine Reihe neuer Funktionen für Android 17 angekündigt und mehrere KI-Fähigkeiten unter dem Namen Gemini Intelligence zusammengefasst. Die Funktionen sollen Nutzern helfen, alltägliche Aufgaben mit weniger manuellem Aufwand zu erledigen. Laut Google beginnt der Rollout von Gemini Intelligence zunächst auf Samsung-Galaxy- und Google-Pixel-Smartphones. Weitere Geräte wie Uhren, Autos, Brillen und Laptops sollen im …

Weiterlesen …

OpenAI: Neue Modelle für Reasoning, Übersetzung und Transkription in der Sprach-API

OpenAI hat drei neue Audio-Sprachmodelle über seine Realtime API veröffentlicht. Jedes Modell erfüllt eine andere Aufgabe: Reasoning, Übersetzung und Transkription. Das erste Modell, GPT-Realtime-2, bringt Reasoning auf GPT-5-Niveau in Live-Gespräche. Laut OpenAI kann es komplexe Anfragen bearbeiten, Unterbrechungen verarbeiten und externe Tools aufrufen, ohne den Gesprächsfluss zu unterbrechen. Das zweite Modell, GPT-Realtime-Translate, übersetzt gesprochene Sprache …

Weiterlesen …

Google arbeitet an neuem KI-Agenten namens Remy

Google entwickelt einen neuen KI-Agenten für seine Gemini-Plattform. Der Agent soll eigenständig Aufgaben für Nutzer erledigen. Hilary Langley berichtet für Business Insider, dass das Projekt intern „Remy“ heißt und derzeit von Google-Mitarbeitern getestet wird. Laut einem internen Dokument, das Business Insider vorliegt, läuft Remy in einer mitarbeiterexklusiven Version der Gemini-App. Der Agent ist mit verschiedenen …

Weiterlesen …

Google zeigt nun Reddit-Zitate und Forenlinks in KI-Suchergebnissen

Google aktualisiert seine KI-gestützte Suche und zeigt künftig Zitate und Links aus Online-Foren, sozialen Medien und Diskussionsplattformen direkt in den KI-Antworten an. Laut Google suchen Nutzer zunehmend nach Erfahrungen anderer Menschen statt nach klassischen Websites. Die wichtigste Neuerung: Google blendet sogenannte „Perspectives“ ein, also Ausschnitte aus öffentlichen Diskussionen auf Plattformen wie Reddit. Diese Vorschauen erscheinen …

Weiterlesen …

GPT-5.5 Instant: Weniger Rauschen, mehr Präzision, besseres Gedächtnis

OpenAI hat GPT-5.5 Instant als neues Standard-Modell für ChatGPT veröffentlicht. Es ersetzt GPT-5.3 Instant für alle Nutzer. Laut OpenAI verbessert das Update drei Bereiche: weniger Fehler bei Fakten, kürzere Antworten und bessere Personalisierung. Interne Auswertungen von OpenAI zeigen laut dem Unternehmen, dass GPT-5.5 Instant bei heiklen Themen wie Medizin, Recht und Finanzen 52,5 Prozent weniger …

Weiterlesen …

Mistral startet cloudbasierte Coding-Agenten und neues KI-Modell

Mistral hat cloudbasierte Coding-Agenten sowie ein neues KI-Modell namens Mistral Medium 3.5 veröffentlicht. Das Unternehmen erklärt, dass Programmieraufgaben künftig autonom in der Cloud ablaufen können, ohne dass ein Entwickler dauerhaft am Rechner bleiben muss. Das neue Modell verfügt über 128 Milliarden Parameter und ein Kontextfenster von 256.000 Token. Es vereint Instruktionsbefolgung, logisches Schlussfolgern und Code-Generierung …

Weiterlesen …

Nvidia bündelt Sprache, Bild und Ton in Nemotron 3 Nano Omni

Nvidia hat Nemotron 3 Nano Omni vorgestellt, ein offenes KI-Modell, das Text, Bild und Audio in einem System vereint. Bisherige KI-Agenten nutzen für jede dieser Aufgaben separate Modelle. Das verlangsamt die Verarbeitung und erhöht die Kosten. Nvidia will dieses Problem mit dem neuen Modell lösen. Das Modell basiert auf einer hybriden Mixture-of-Experts-Architektur mit 30 Milliarden …

Weiterlesen …

×