Googles neues KI-Modell kann Apps und Websites nutzen

Google DeepMind hat ein neues, spezialisiertes KI-Modell veröffentlicht, mit dem Software-Agenten grafische Benutzeroberflächen bedienen können. In einem offiziellen Beitrag berichtet Google DeepMind, dass das „Gemini 2.5 Computer Use“-Modell einer KI ermöglicht, Aufgaben auf Webseiten und in mobilen Apps wie ein Mensch durch Klicken, Tippen und Scrollen zu erledigen. Das Modell analysiert eine Nutzeranfrage zusammen mit …

Weiterlesen …

OpenAIs AgentKit soll die Entwicklung von KI-Agenten vereinfachen

OpenAI hat AgentKit vorgestellt, ein neues Set an Werkzeugen für Entwickler und Unternehmen. Es soll das Erstellen, Bereitstellen und Optimieren von KI-Agenten erleichtern. Laut OpenAI zielt das Toolkit darauf ab, einen Prozess zu bündeln, der bisher unzusammenhängende Werkzeuge und komplexe manuelle Arbeit erforderte. Der Schritt wird als Versuch gewertet, die Erstellung von Agenten zu beschleunigen …

Weiterlesen …

ChatGPT integriert nun Apps wie Canva und Spotify

OpenAI hat eine neue Funktion eingeführt, über die Anwendungen von Drittanbietern direkt in der Benutzeroberfläche von ChatGPT laufen können. Nutzer können darüber mit Diensten wie Zillow, Canva und Spotify über natürlichsprachliche Prompts interagieren. Dabei werden die Konversationsfähigkeiten des Chatbots mit den spezifischen Funktionen externer Tools kombiniert. Das Unternehmen veröffentlichte zudem ein neues Software Development Kit …

Weiterlesen …

IBM veröffentlicht Granite 4.0 Sprachmodelle mit neuer, effizienter Hybrid-Architektur

IBM hat die Einführung von Granite 4.0 angekündigt, der nächsten Generation seiner Open-Source-Sprachmodelle. Die neuen Modelle nutzen eine Hybrid-Architektur, die die KI-Technologien Transformer und Mamba kombiniert. Ziel ist es, hohe Leistung mit deutlich geringerem Speicherbedarf und niedrigeren Kosten zu vereinen. Die Modelle sind für den Unternehmenseinsatz konzipiert und legen einen starken Fokus auf Sicherheit, Governance …

Weiterlesen …

Dieses Startup will mit virtuellen Welten neue Daten für KI erzeugen

Die KI-Branche leidet unter einem Mangel an hochwertigen Daten, die für das Training leistungsfähigerer Modelle benötigt werden. Das neue Start-up Moonlake AI will dieses Problem lösen, indem es Daten aus interaktiven 3D-Welten generiert. Das berichtet Rashi Shrivastava für Forbes. Das Unternehmen wurde von den ehemaligen Stanford-Doktorandinnen Sharon Lee und Fan-Yun Sun gegründet. Sie entwickeln eine …

Weiterlesen …

Google teilt Tipps für sein Bildmodell Nano Banana, das jetzt allgemein verfügbar ist

Google hat sein Bildmodell Gemini 2.5 Flash Image, auch bekannt als Nano Banana, allgemein für den produktiven Einsatz freigegeben. Laut dem Unternehmen gehören zu den neuen Funktionen die Unterstützung für zehn verschiedene Bildformate, von Querformat für Filme bis zu vertikalen Formaten, sowie die Möglichkeit, reine Bildausgaben festzulegen. In einem Beitrag gab Google mehrere Tipps, wie …

Weiterlesen …

OpenAIs Sora: virale Reichweite und tonnenweise Copyright-Probleme

OpenAI hat eine neue Version seines Video-Generation-Tools Sora veröffentlicht, verpackt als TikTok-ähnliche Social App. Der Launch hat erhebliches User-Engagement erzeugt und wirft Fragen zu Copyright-Verletzungen und Content-Moderation auf. Tech-Kommentator M.G. Siegler beschrieb die App als „extrem einfach zu nutzen“ und berichtete, nach dem Zugang nicht mehr aufhören zu können, Video-Remixes zu erstellen. Die App erlaubt …

Weiterlesen …

Perplexity bietet seinen KI-Browser Comet ab sofort kostenlos an

Das KI-Unternehmen Perplexity stellt seinen Browser Comet allen Nutzern kostenlos zur Verfügung. Die Nutzung der neuen Gratisversion ist allerdings eingeschränkt. Zuvor war die Software nur als Teil eines Abonnements für 200 US-Dollar pro Monat erhältlich. Das berichtet Charles Rollet für Business Insider. Laut CEO Aravind Srinivas will das Unternehmen mit diesem Schritt gegen die Zunahme …

Weiterlesen …

Ehemalige OpenAI-Forscher veröffentlichen ihr erstes Tool

Das Start-up Thinking Machines Lab hat sein erstes Produkt vorgestellt. Es heißt Tinker und soll die Erstellung von spezialisierten KI-Modellen vereinfachen. Das berichtet Will Knight für das Magazin Wired. Das Unternehmen wurde von bekannten ehemaligen Forschern von OpenAI gegründet, darunter CEO Mira Murati. Tinker automatisiert das sogenannte Fine-Tuning von leistungsstarken Open-Source-Modellen. Damit können Entwickler und …

Weiterlesen …

Googles KI-Bildersuche wird umgangssprachlicher

Google aktualisiert den KI-Modus seiner Bildersuche. Nutzer können nun Bilder mit natürlicheren und auch vagen Beschreibungen finden. Dies berichtet The Verge. Die Funktion soll laut einer Ankündigung von Google besonders das Onlineshopping erleichtern. Anstatt Filter für Farbe oder Marke zu verwenden, können Nutzer beschreiben, wonach sie suchen. Das System versteht auch Folgefragen, um die Ergebnisse …

Weiterlesen …

×