DeepMind V2A generiert Audio für Videos automatisch

Googles KI-Forschungslabor DeepMind hat eine neue Technologie namens V2A entwickelt, die automatisch passende Soundtracks, Soundeffekte und sogar Dialoge für Videos generieren kann. Obwohl V2A vielversprechend scheint, räumt DeepMind ein, dass die generierte Audioqualität noch nicht perfekt ist. Es ist vorerst nicht allgemein erhältlich.

Googles Gecko bewertet Bildgeneratoren

Google DeepMind entwickelt mit „Gecko“ einen neuen Standard, um die Fähigkeiten von KI-Bildgeneratoren genauer zu bewerten. Es soll dabei helfen, die Stärken und Schwächen der KI-Modelle besser zu verstehen und ihre Entwicklung voranzutreiben.

Forscher zeigen wie nützlich Beispiele in Prompts sind

Forscher von DeepMind haben herausgefunden, dass große Sprachmodelle  durch hunderte oder sogar tausende von Beispielen im Prompt neue Fähigkeiten erlernen können, ohne dass ein Fine Tuning des Modells erforderlich ist. Diese Methode ermöglicht es Unternehmen, schnell Prototypen von KI-Anwendungen zu erstellen und zu entwickeln.