Google Veo 3.1: besseres Audio und mehr Bearbeitungsfunktionen

Google DeepMind präsentiert umfangreiche Updates für seine Videoplattform Flow. Die Neuerungen umfassen das Modell Veo 3.1 und erweiterte kreative Steuerungsmöglichkeiten. Jess Gallegos und Thomas Iljic berichten im offiziellen Google Blog. Nutzer haben seit dem Start vor fünf Monaten über 275 Millionen Videos mit Flow erstellt. Die aktuellen Updates reagieren auf Nutzerwünsche nach mehr künstlerischer Kontrolle …

Weiterlesen …

Microsoft AI kündigt sein erstes hauseigenes Text-zu-Bild-Modell an

Microsoft AI hat MAI-Image-1 angekündigt, seinen ersten Text-zu-Bild-Generator, der vollständig firmenintern entwickelt wurde. Das Modell hat bereits einen Platz in den Top 10 auf LMArena erreicht, einer öffentlichen Benchmark-Plattform, auf der menschliche Nutzer die Qualität der Ergebnisse verschiedener KI-Systeme vergleichen und bewerten. Laut der offiziellen Mitteilung soll MAI-Image-1 vielfältige und abwechslungsreiche Ergebnisse liefern. Microsoft gibt …

Weiterlesen …

Slack verwandelt seinen Slackbot in einen persönlichen KI-Assistenten

Der Kollaborationsdienst Slack testet ein Update, das den Slackbot in einen umfassenden KI-Assistenten verwandelt. Das neue Werkzeug kann natürliche Sprache verstehen, um Informationen zu suchen, Konversationen zusammenzufassen und Projektpläne zu erstellen. Darüber berichtet The Verge. Laut Rob Seaman, dem Produktchef von Slack, wurde der Slackbot „von Grund auf als persönlicher KI-Begleiter neu entwickelt“. Der Assistent …

Weiterlesen …

Googles Bildgenerator „Nano Banana“ in weitere Produkte integriert

Google hat sein Bildgenerierungs-Modell Nano Banana in mehrere Produkte integriert, darunter die AI Mode-Suche, Google Lens und NotebookLM. Das Modell trägt offiziell die Bezeichnung Gemini 2.5 Flash Image und ermöglicht es Nutzern, Bilder über Text-Prompts zu erstellen und zu bearbeiten. In der AI Mode-Suchoberfläche von Google können Nutzer die Bildgenerierung nun über ein neues Plus-Symbol …

Weiterlesen …

Adobe stellt KI-Agenten für das Marketing an Geschäftskunden vor

Adobe hat eine Reihe neuer KI-Agenten vorgestellt, die sich gezielt an Marketingexperten im Geschäftskundenbereich (B2B) richten. Die Software soll komplexe Verkaufsprozesse automatisieren, indem sie hilft, wichtige Entscheidungsträger zu identifizieren und Marketingkampagnen zu steuern. Wie Silicon Angle berichtet, reagiert Adobe damit auf die besonderen Herausforderungen im B2B-Vertrieb. Dort werden Kaufentscheidungen oft von mehreren Personen in einem …

Weiterlesen …

Googles Gemini Enterprise soll seine KI in Unternehmen etablieren

Google Cloud hat Gemini Enterprise vorgestellt, eine neue KI-Plattform, die KI für alle Mitarbeiter in Unternehmen zugänglich machen soll. Google Cloud CEO Thomas Kurian bezeichnet sie als „das neue Eingangstor für KI am Arbeitsplatz“. Die Plattform kostet 30 Dollar pro Nutzer und Monat. Sie soll Mitarbeitern in allen Abteilungen helfen, Aufgaben zu automatisieren, Unternehmensdaten zu …

Weiterlesen …

Googles neues KI-Modell kann Apps und Websites nutzen

Google DeepMind hat ein neues, spezialisiertes KI-Modell veröffentlicht, mit dem Software-Agenten grafische Benutzeroberflächen bedienen können. In einem offiziellen Beitrag berichtet Google DeepMind, dass das „Gemini 2.5 Computer Use“-Modell einer KI ermöglicht, Aufgaben auf Webseiten und in mobilen Apps wie ein Mensch durch Klicken, Tippen und Scrollen zu erledigen. Das Modell analysiert eine Nutzeranfrage zusammen mit …

Weiterlesen …

OpenAIs AgentKit soll die Entwicklung von KI-Agenten vereinfachen

OpenAI hat AgentKit vorgestellt, ein neues Set an Werkzeugen für Entwickler und Unternehmen. Es soll das Erstellen, Bereitstellen und Optimieren von KI-Agenten erleichtern. Laut OpenAI zielt das Toolkit darauf ab, einen Prozess zu bündeln, der bisher unzusammenhängende Werkzeuge und komplexe manuelle Arbeit erforderte. Der Schritt wird als Versuch gewertet, die Erstellung von Agenten zu beschleunigen …

Weiterlesen …

ChatGPT integriert nun Apps wie Canva und Spotify

OpenAI hat eine neue Funktion eingeführt, über die Anwendungen von Drittanbietern direkt in der Benutzeroberfläche von ChatGPT laufen können. Nutzer können darüber mit Diensten wie Zillow, Canva und Spotify über natürlichsprachliche Prompts interagieren. Dabei werden die Konversationsfähigkeiten des Chatbots mit den spezifischen Funktionen externer Tools kombiniert. Das Unternehmen veröffentlichte zudem ein neues Software Development Kit …

Weiterlesen …

IBM veröffentlicht Granite 4.0 Sprachmodelle mit neuer, effizienter Hybrid-Architektur

IBM hat die Einführung von Granite 4.0 angekündigt, der nächsten Generation seiner Open-Source-Sprachmodelle. Die neuen Modelle nutzen eine Hybrid-Architektur, die die KI-Technologien Transformer und Mamba kombiniert. Ziel ist es, hohe Leistung mit deutlich geringerem Speicherbedarf und niedrigeren Kosten zu vereinen. Die Modelle sind für den Unternehmenseinsatz konzipiert und legen einen starken Fokus auf Sicherheit, Governance …

Weiterlesen …