Der Technologiekonzern Nvidia hat ein neues KI-Modell namens Fugatto entwickelt, das Audio generieren und modifizieren kann. Wie Stephen Nellis für Reuters berichtet, ermöglicht die Technologie die Umwandlung bestehender Klänge, die Änderung von Sprachakzenten und die Erzeugung neuartiger Audioeffekte durch Texteingaben. Das Modell kann beispielsweise Klavierpassagen in Gesang umwandeln oder eine Trompete wie einen bellenden Hund klingen lassen. Die Software richtet sich an Produzenten aus der Musik-, Film- und Spielebranche. Nvidia hat das Modell mit Open-Source-Daten trainiert, plant aber vorerst keine öffentliche Freigabe, um möglichem Missbrauch vorzubeugen. Damit reiht sich das Unternehmen in die Gruppe von Technologiefirmen wie Meta und OpenAI ein, die ähnliche Tools entwickeln.