Google erweitert Vids um KI-Musik und anpassbare Avatare

Google hat sein Videoerstellungstool Google Vids um mehrere KI-Funktionen erweitert. Die Neuerungen betreffen Musikgenerierung, anpassbare Avatare und den direkten Export zu YouTube. Nutzer können jetzt Musik direkt in Google Vids erstellen. Die Funktion basiert auf Googles Modellen Lyria 3 und Lyria 3 Pro. Per Texteingabe, also per prompt, lassen sich Clips von etwa 30 Sekunden …

Weiterlesen …

Lumas neues Bildmodell übertrifft Google und OpenAI bei Reasoning-Benchmarks

Das KI-Startup Luma AI hat Uni-1 veröffentlicht, ein Bildgenerierungsmodell, das Googles Nano Banana 2 und OpenAIs GPT Image 1.5 bei zentralen Reasoning-Benchmarks übertrifft und dabei bis zu 30 Prozent günstiger ist. Michael Nuñez berichtet für VentureBeat, dass das Modell ein Beispiel für einen grundlegenden Wandel in der KI-Bildgenerierung darstellt. Viele ältere Bildgeneratoren nutzen Diffusion: Dabei …

Weiterlesen …

Google Gemma 4 ist die stärkste Open-Source-KI des Unternehmens

Google hat Gemma 4 vorgestellt, eine neue Familie von Open-Weight-KI-Modellen. Das Unternehmen bezeichnet sie als die bislang fähigsten Modelle dieser Reihe. Sie basieren auf derselben Forschung und Technologie wie Googles proprietäres Gemini-3-System und werden unter einer Apache-2.0-Open-Source-Lizenz veröffentlicht. Diese Lizenz erlaubt es Entwicklern, die Modelle für kommerzielle Zwecke frei zu nutzen und zu verändern. Die …

Weiterlesen …

Slack bringt Meeting-Notizen und einen Desktop-KI-Agenten

Slack hat mehr als 30 neue Funktionen für Slackbot angekündigt, seinen KI-gestützten Assistenten. Das Update verwandelt Slackbot von einem einfachen Chat-Tool in einen Agenten, der Meeting-Notizen erstellen, auf dem Desktop arbeiten, externe Apps verbinden und Kundendaten verwalten kann. Die wichtigste neue Funktion ist Meeting-Intelligence. Wenn der Nutzer sie aktiviert, hört Slackbot über die Slack-Desktop-App dem …

Weiterlesen …

Google halbiert Kosten für KI-Videogenerierung mit Veo 3.1 Lite

Google hat Veo 3.1 Lite zur Gemini API hinzugefügt. Das Modell ist das günstigste der Veo-3.1-Familie und richtet sich laut Google an Entwickler, die viele Videos in großem Umfang erstellen wollen. Laut Google kostet Veo 3.1 Lite weniger als die Hälfte von Veo 3.1 Fast, arbeitet aber genauso schnell. Im kostenpflichtigen Tier kostet die Generierung …

Weiterlesen …

Google TurboQuant kann KI-Kosten spürbar verringern

Google Research hat TurboQuant veröffentlicht, einen neuen Kompressionsalgorithmus für große Sprachmodelle. Laut des Unternehmens lässt sich der Key-Value-Cache eines Modells damit auf mindestens ein Sechstel reduzieren. Zudem wird die Attention-Berechnung – ein zentraler Verarbeitungsschritt – um das bis zu Achtfache beschleunigt, ohne dass das Modell neu trainiert werden muss oder an Präzision verliert. Um zu …

Weiterlesen …

Googles Lyria 3 Pro komponiert jetzt ganze Songs

Google hat sein KI-Musikmodell Lyria 3 Pro vorgestellt. Myriam Hamed Torres schreibt für Google DeepMind, dass das Modell Tracks von bis zu drei Minuten Länge erzeugen kann. Dabei versteht es musikalische Strukturen wie Intros, Verse, Refrains und Bridges. Das Modell ist auf mehreren Google-Plattformen verfügbar. Unternehmen können es über Vertex AI für die Produktion großer …

Weiterlesen …

ByteDance startet KI-Videomodell Seedance 2.0 in CapCut

ByteDance führt sein neues KI-Modell zur Video- und Audiogenerierung, Dreamina Seedance 2.0, in der Bearbeitungsplattform CapCut ein. Sarah Perez berichtet für TechCrunch, dass das Modell es Nutzern ermöglicht, Videoinhalte per Textprompt, Bild oder Referenzvideo zu erstellen, zu bearbeiten und mit Audio zu synchronisieren. Der Start erfolgt zunächst in Brasilien, Indonesien, Malaysia, Mexiko, den Philippinen, Thailand …

Weiterlesen …

Anthropic bestätigt neues KI-Modell Claude Mythos nach Datenpanne

Anthropic entwickelt ein neues KI-Modell namens Claude Mythos. Das Unternehmen bezeichnet es als das leistungsfähigste, das es je entwickelt hat. Beatrice Nolan berichtet für Fortune, dass die Existenz des Modells durch einen Fehler bekannt wurde: Interne Dokumente landeten versehentlich in einem öffentlich zugänglichen Datenspeicher. Ein Sprecher von Anthropic bezeichnete das Modell als einen „step change“, …

Weiterlesen …

Google Search Live weltweit verfügbar

Google hat Search Live, seine sprach- und kamerabasierte Suchfunktion, auf alle Länder und Sprachen ausgeweitet, in denen AI Mode verfügbar ist. Das Rollout umfasst mehr als 200 Länder und Territorien. Mit Search Live können Nutzer Fragen laut aussprechen, anstatt sie einzutippen. Die Funktion antwortet mit Audio und kann zusätzlich die Kamera des Smartphones einbeziehen. Wer …

Weiterlesen …