Anthropic veröffentlicht KI-Skills für Unternehmen als offenen Standard

Anthropic hat Agent Skills als offenen Standard veröffentlicht und macht die Technologie damit auf verschiedenen KI-Plattformen verfügbar. Das Unternehmen führte Skills im Oktober ein, um Claude wiederholbare Arbeitsabläufe beizubringen. Jetzt funktioniert das System über Claude hinaus, Microsoft, Cursor und andere Plattformen haben es übernommen. Skills sind Ordner mit Anweisungen und Skripten, die KI-Systemen zeigen, wie …

Weiterlesen …

Ray3 Modify: Transformiere deine Videos mit AI

Luma AI hat Ray3 Modify veröffentlicht, ein neues Video-Generierungsmodell, das Nutzern erlaubt, bestehendes Filmmaterial zu bearbeiten und dabei die ursprüngliche Performance zu erhalten. Das Tool ist über die Dream Machine Plattform des Unternehmens verfügbar. Ray3 Modify adressiert eine Einschränkung in der KI-Videogenerierung: die Schwierigkeit, Timing, Bewegung und emotionale Intention bei der Transformation von Szenen beizubehalten. …

Weiterlesen …

OpenAI öffnet ChatGPT für externe App-Entwickler

OpenAI verwandelt seinen Chatbot in eine vielseitige Softwareplattform und öffnet das ChatGPT App Directory für externe Entwickler. Carl Franzen berichtet für VentureBeat, dass das Unternehmen ab sofort Einreichungen für neue Anwendungen entgegennimmt. Diese Apps ermöglichen es den über 800 Millionen Nutzern, spezialisierte Werkzeuge direkt in ihren Unterhaltungen aufzurufen. Anwender können die Programme über ein Menü …

Weiterlesen …

Meta veröffentlicht SAM Audio zur einfachen Tonbearbeitung

Meta Platforms veröffentlicht mit SAM Audio ein neues KI-Modell für die einfache Bearbeitung von Tonaufnahmen. Das System kann einzelne Geräusche aus komplexen Audio-Dateien isolieren oder entfernen. Mike Wheatley berichtet für Silicon Angle über diese Entwicklung. Nutzer finden das Werkzeug ab sofort im Segment Anything Playground von Meta. Die Bedienung erfolgt über einfache Befehle. Wer eine …

Weiterlesen …

Google Gemini 3 Flash verspricht das Ende des Kompromisses zwischen Leistung und Kosten

Google hat Gemini 3 Flash veröffentlicht und positioniert das Modell als Lösung für einen Kompromiss in der künstlichen Intelligenz zwischen Geschwindigkeit und Leistungsfähigkeit. Das Modell kombiniert laut Google Reasoning auf Doktorandenniveau mit höheren Verarbeitungsgeschwindigkeiten und niedrigeren Kosten im Vergleich zu größeren Modellen. Gemini 3 Flash ist jetzt das Standard-Modell in der Gemini App weltweit und …

Weiterlesen …

Adobe Firefly unterstützt jetzt textbasierte Videobearbeitung

Adobe erweitert sein KI-Werkzeug Firefly um einen neuen Videoeditor, der auf Textbefehle reagiert. Das berichtet Ivan Mehta für TechCrunch. Die Funktion ermöglicht Nutzern eine präzise Bearbeitung von Videoclips. Anstatt ganze Szenen neu zu erstellen, können nun einzelne Elemente, Farben oder Kamerawinkel per Texteingabe gezielt verändert werden. Adobe integriert zudem KI-Modelle von anderen Anbietern. So erlaubt …

Weiterlesen …

OpenAI entfernt automatische Modellauswahl für kostenlose ChatGPT-Nutzer

OpenAI hat eine zentrale Funktion in ChatGPT zurückgenommen, die Nutzer automatisch zu fortgeschrittenen KI-Modellen leitete. Kostenlose Nutzer und Abonnenten des $5-Tarifs Go erhalten jetzt standardmäßig GPT-5.2 Instant, die schnellste Version von OpenAIs Modellreihe. Maxwell Zeff berichtet für Wired, dass die Änderung Hunderte Millionen Nutzer betrifft. Der Model Router wurde erst vor vier Monaten eingeführt. Er …

Weiterlesen …

Eigene KI-Mini-Apps in Gemini erstellen (ganz ohne Programmierung)

Google hat Opal, sein Tool zum Erstellen KI-gestützter Mini-Apps, direkt in die Gemini Web-Anwendung integriert. Nutzer können nun über den Gems-Manager auf Opal zugreifen und eigene Anwendungen erstellen, ohne Code zu schreiben. Opal ermöglicht es Nutzern, gewünschte Anwendungen in natürlicher Sprache zu beschreiben. Das Tool nutzt dann Gemini-Modelle, um diese Mini-Apps zu erstellen, die Google …

Weiterlesen …

ChatGPT erstellt Bilder jetzt viermal schneller als zuvor

OpenAI hat eine aktualisierte Version seiner Bildgenerierungsfunktion in ChatGPT veröffentlicht. Das neue Modell erstellt Bilder bis zu viermal schneller als die vorherige Version und bietet präzisere Bearbeitungsmöglichkeiten. Das Unternehmen führte außerdem einen eigenen Bereich für Bilderstellung in der ChatGPT-Oberfläche ein. Das aktualisierte Modell steht allen ChatGPT-Nutzern zur Verfügung und kann über die API als GPT …

Weiterlesen …

Runway GWM-1 ist ein World Model für Robotik und Simulation

Runway hat GWM-1 veröffentlicht, sein erstes World Model System zur Simulation physischer Umgebungen in Echtzeit. Die Ankündigung positioniert das KI-Video-Unternehmen neben Konkurrenten wie Google im aufkommenden World-Model-Bereich. Ein World Model ist ein KI-System, das eine interne Darstellung von Umgebungen aufbaut und damit zukünftige Ereignisse vorhersagen kann, ohne explizit für jedes Szenario trainiert zu werden. Runways …

Weiterlesen …

×