Adobe Premiere Pro kann jetzt Videoclips mit KI verlängern

Adobe hat Version 25.2 von Premiere Pro veröffentlicht, die neue KI-gestützte Funktionen enthält, darunter Generative Extend. Diese auf Adobes Firefly-KI-Modell basierende Funktion ermöglicht es Editoren, Videoclips um bis zu zwei Sekunden und Hintergrundaudio um bis zu zehn Sekunden zu verlängern. Laut Jess Weatherbeds Bericht ist das Tool zunächst kostenlos, bevor Firefly-Guthaben erforderlich werden. Das Update …

Weiterlesen …

OpenAI kündigt erstes Open-Source-Sprachmodell seit Jahren an

OpenAI plant in den kommenden Monaten sein erstes „offenes“ Sprachmodell seit GPT-2 zu veröffentlichen. Dies geht aus einem Feedback-Formular hervor, das das Unternehmen auf seiner Website veröffentlicht hat. Laut eines Berichts von Kyle Wiggers bittet OpenAI Entwickler, Forscher und Community-Mitglieder um Rückmeldungen zu dem neuen Modell. Das Unternehmen wird Entwickler-Events organisieren, beginnend in San Francisco …

Weiterlesen …

Manus AI führt Abomodell für KI-Agenten ein

Manus AI bietet seinen KI-Agenten ab sofort als kostenpflichtigen Dienst an, berichtet Bloomberg News. Das Startup aus Peking hat zwei Preisstufen eingeführt: 39 Dollar und 199 Dollar pro Monat. Die teurere Option entspricht preislich OpenAIs ChatGPT Pro. Der Premium-Zugang lässt bis zu fünf Aufgaben gleichzeitig zu und bietet mehr Rechenleistung. Der KI-Agent, der auf Sprachmodellen …

Weiterlesen …

Runway zeigt KI-Videomodell Gen-4

Runway hat sein neuestes KI-Videomodell Gen-4 veröffentlicht, das deutliche Verbesserungen bei der Konsistenz von Charakteren und Szenen bieten soll. Wie Kyle Wiggers berichtet, ist das Modell nun für Einzel- und Unternehmenskunden von Runway verfügbar. Das Unternehmen gibt an, dass Gen-4 kohärente Umgebungen und Charaktere über verschiedene Szenen hinweg beibehalten kann, während es realistische Physik simuliert. …

Weiterlesen …

Amazon stellt Nova Act vor: KI-Agent zur Steuerung von Webbrowsern

Amazon hat mit Nova Act einen neuen KI-Agenten eingeführt, der Webbrowser steuern und einfache Aktionen ausführen kann. Wie Maxwell Zeff von TechCrunch berichtet, wird diese Technologie auch Funktionen des kommenden Alexa+-Updates antreiben. Entwickler können mit dem Nova Act SDK Agenten-Prototypen erstellen, die Aufgaben wie Essensbestellungen oder Reservierungen automatisieren. Amazon behauptet, Nova Act übertreffe ähnliche Technologien …

Weiterlesen …

Googles Gemini 2.5 Pro führt in Benchmarks und du kannst es kostenlos ausprobieren

Google hat überraschend sein neuestes KI-Modell, Gemini 2.5 Pro, für alle Nutzer kostenlos zugänglich gemacht, nicht nur für Premium-Abonnenten. Das Modell hat schnell Anerkennung für seine außergewöhnlichen Reasoning-Fähigkeiten gewonnen und führt derzeit die Branchenbenchmarks an. Gemini 2.5 Pro zeichnet sich durch sein enormes Kontextfenster von 1 Million Token aus (mit Plänen zur Erweiterung auf 2 …

Weiterlesen …

ChatGPTs neue Bildfunktion: Was macht diese Bild-KI so besonders?

ChatGPTs neuer Bildgenerator ist nicht nur ein Upgrade – er verändert grundlegend, wie KI Bilder erstellt. Das bedeutet: Exaktere Resultate, bessere Handhabung komplexer Szenen und lesbarer, verwendbarer Text im Bild selbst. Das ist ein erheblicher Fortschritt, wenn du im Bereich Design, Content-Erstellung, Marketing oder in einem anderen visuellen Bereich arbeitest. Während andere Bildgeneratoren ebenfalls große Fortschritte …

Weiterlesen …

ChatGPT kann nun auf unternehmensinterne Datenquellen zugreifen

OpenAI hat eine neue Funktion eingeführt, die es ChatGPT-Team-Nutzern ermöglicht, interne Wissensdatenbanken direkt mit der Plattform zu verbinden. Wie Emilia David von VentureBeat berichtet, befindet sich diese lang erwartete Funktion derzeit in der Beta-Phase. Administratoren können zunächst Google Drive mit ChatGPT verbinden, wobei laut OpenAI-Produktmanager Nate Gonzales weitere Datenquellen folgen werden. Das System führt semantische …

Weiterlesen …

Groq und PlayAI stellen neues Text-to-Speech-System Dialog vor

Groq und PlayAI haben gemeinsam das Text-to-Speech-System Dialog entwickelt, das natürlicher klingende KI-Stimmen ermöglicht. Wie Michael Nuñez von VentureBeat berichtet, verbindet das System PlayAIs Expertise in Sprach-KI mit Groqs schneller Inferenz-Plattform. Dialog nutzt einen „adaptive speech contextualizer“, der den gesamten Gesprächsverlauf berücksichtigt und so Antworten mit passender Betonung und Emotion erzeugt. Das System ist sowohl …

Weiterlesen …

Microsofts neue KI-Tools für Recherche und Datenanalyse

Microsoft hat zwei neue KI-Agenten namens Researcher und Analyst für die Microsoft 365 Copilot-Plattform vorgestellt. Wie Richard Lawler von The Verge berichtet, sind diese Tools für komplexe Rechercheaufgaben und Datenanalysen konzipiert. Researcher, der auf OpenAIs Forschungsmodell basiert, kann mehrstufige Recherchen durchführen und auf Daten von Drittanbietern wie Salesforce zugreifen. Analyst hingegen nutzt OpenAIs o3-mini-Modell und …

Weiterlesen …

×