Hume AI stellt Octave vor, ein Text-to-Speech-Modell mit emotionalen Steuerelementen

Das Startup Hume AI hat ein neues Text-to-Speech-System namens Octave eingeführt, das emotional nuancierte KI-Stimmen erzeugt. Laut einem Bericht von Carl Franzen für VentureBeat basiert das Modell auf einem Large Language Model, das Ton, Rhythmus und Sprachmelodie kontextabhängig anpassen kann. Nutzer können Emotionen auf Satzebene durch einfache Textbefehle wie „fröhlicher“ oder „sarkastischer“ steuern. Octave richtet …

Weiterlesen …

Microsoft macht Voice und Think Deeper für alle Copilot-Nutzer verfügbar

Microsoft bietet ab sofort unbegrenzten Zugang zu den Funktionen Voice und Think Deeper kostenlos für alle Copilot-Nutzer an. Das Copilot-Team stellte diese erweiterten Fähigkeiten vor, um den KI-Assistenten weiterzuentwickeln. Voice ermöglicht ausgedehnte Sprachgespräche mit der KI. Think Deeper, das auf OpenAIs o1-Modell basiert, bewältigt komplexe Denkaufgaben. Bisher stießen Nutzer bei diesen Funktionen auf Nutzungsbeschränkungen. Das …

Weiterlesen …

Psychologen warnen vor KI-Chatbots als Therapeuten

Der größte psychologische Fachverband der USA, die American Psychological Association (APA), hat ernste Bedenken gegenüber KI-Chatbots geäußert, die sich fälschlicherweise als Therapeuten präsentieren. Wie die New York Times berichtet, warnte bei einer Anhörung der Federal Trade Commission der APA-Geschäftsführer Arthur C. Evans Jr., dass diese KI-Systeme gefährdete Nutzer zu selbstschädigendem oder gewalttätigem Verhalten ermutigen könnten. …

Weiterlesen …

Britische Musiker veröffentlichen stilles Album als Protest gegen KI-Urheberrechtspläne

Mehr als 1.000 britische Musiker, darunter Kate Bush, Damon Albarn und Annie Lennox, haben ein stilles Album veröffentlicht, um gegen die geplanten Änderungen der britischen Regierung am Urheberrecht zu protestieren. Das Album mit dem Titel „Is This What We Want?“ enthält 12 Tracks mit Aufnahmen leerer Studios und Aufführungsräume, die symbolisieren, welche Auswirkungen es auf …

Weiterlesen …

OpenAI führt Sora in Europa ein

OpenAI hat sein Videogenerierungstool Sora nun in Großbritannien und Kontinentaleuropa verfügbar gemacht. Das Werkzeug, das per Texteingabe Videos erstellt, steht zahlenden ChatGPT Plus und Pro Nutzern zur Verfügung. Wie Dan Milmo vom Guardian berichtet, präsentierte OpenAI Beispiele von Künstlern aus der Region, darunter die britische Digitalkünstlerin Josephine Miller mit einem zweiminütigen Video von Models in …

Weiterlesen …

Microsoft zeigt effizientes Phi-4 für Text-, Bild- und Sprachverarbeitung

Microsoft hat zwei neue KI-Modelle in seiner Phi-Serie vorgestellt: Phi-4-multimodal mit 5,6 Milliarden Parametern und Phi-4-mini mit 3,8 Milliarden Parametern. Diese kleinen Sprachmodelle (SLMs) liefern außergewöhnliche Leistung bei deutlich geringerem Rechenaufwand als größere Systeme und stellen damit die Vorstellung in Frage, dass größere KI-Modelle immer besser sind. Das Phi-4-multimodal-Modell zeichnet sich durch seine Fähigkeit aus, …

Weiterlesen …

Amazon stellt Alexa+ mit erweiterten KI-Fähigkeiten vor

Amazon hat Alexa+ vorgestellt, ein bedeutendes Upgrade seines Sprachassistenten mit fortschrittlicher KI. Diese überarbeitete Version zeigte das Unternehmen bei einer Pressekonferenz in New York City und ist die umfassendste Überarbeitung der Plattform seit ihrer Einführung vor über einem Jahrzehnt. Alexa+ verwendet einen von Amazon als „modellagnostisch“ beschriebenen Ansatz mit einem ausgeklügelten Routing-System, das für jede …

Weiterlesen …

OpenAI stellt GPT-4.5-Modell vor

OpenAI hat offiziell GPT-4.5 eingeführt, sein neuestes und größtes KI-Sprachmodell. Das intern zuvor als „Orion“ bekannte Modell wird als Forschungsvorschau veröffentlicht und verspricht verbesserte Gesprächsfähigkeiten, reduzierte Halluzinationsraten und eine verbesserte emotionale Intelligenz im Vergleich zu früheren Modellen. Während OpenAI GPT-4.5 als „größtes und bestes Modell für Chat“ positioniert, räumt das Unternehmen ein, dass es kein …

Weiterlesen …

App „touch grass“ blockiert Ablenkungen, bis Nutzer frische Luft schnappen

Mal eine andere Anwendung für KI: Eine neue iOS-App namens „touch grass“ bekämpft Smartphone-Abhängigkeit, indem sie ablenkende Anwendungen blockiert, bis Nutzer wortwörtlich Gras berühren und dies per Computervision nachweisen. Die App will Menschen mit einem Augenzwinkern helfen, ihre Zeit zurückzugewinnen und gleichzeitig den Kontakt mit der Natur fördern. Zu den Grundfunktionen gehören App-Blockierung, intelligente Graserkennung …

Weiterlesen …

OpenAIs Deep Research verfügbar für alle zahlenden ChatGPT-Nutzer

OpenAI hat seine „Deep Research“-Funktion für alle zahlenden Kunden zugänglich gemacht, darunter Plus, Team, Edu und Enterprise-Abonnenten. Igor Bonifacic berichtet für Engadget, dass OpenAI damit sein Anfang Februar gegebenes Versprechen einhält, das Tool innerhalb eines Monats für Plus-Nutzer bereitzustellen. Zuvor war die Funktion nur für Abonnenten des monatlich 200 Dollar teuren Pro-Plans verfügbar. Plus-Nutzer erhalten …

Weiterlesen …

×