Googles neue KI nutzt Reasoning vor dem Erstellen von Bildern

Googles neuer Bildgenerator Gemini 3 Pro Image verändert die Funktionsweise dieser Toolkategorie grundlegend. Das Modell erstellt ein Bild nicht sofort aus einer Texteingabe. Stattdessen nutzt es einen „Thinking Mode“, um einen Plan zu entwerfen, zu kritisieren und zu korrigieren. Stephen Smith schreibt bei Intelligence by Intent, dass dieser Ansatz einen wichtigen Fortschritt darstellt. Er beschreibt …

Weiterlesen …

Googles neueste Bild-KI Nano Banana Pro sorgt für Aufsehen

Google hat ein neues Modell zur Bilderzeugung und -bearbeitung namens Nano Banana Pro vorgestellt, das offiziell als Gemini 3 Pro Image bezeichnet wird. Das Modell basiert auf dem kürzlich veröffentlichten Large Language Model Gemini 3 Pro des Unternehmens und führt eine Reihe neuer Funktionen ein, um Bilder mit einem hohen Maß an Kontrolle und Genauigkeit …

Weiterlesen …

Google Fotos erhält neue KI-Werkzeuge für die Bildbearbeitung

Google stattet seine Fotos-App mit drei neuen KI-Funktionen aus. Sie sollen die Bildbearbeitung vereinfachen und realistischere Ergebnisse liefern. Die Werkzeuge nutzen das Bildbearbeitungsmodell Nano Banana von Google DeepMind. Dieses ist darauf spezialisiert, das Aussehen von Personen bei Änderungen beizubehalten. Elyse Betters Picaro berichtet für ZDNet, dass die Funktion „Hilf mir beim Bearbeiten“ gezielte Änderungen durch …

Weiterlesen …

Adobe: Umfassende KI-Updates für Firefly und Creative Suite

Auf seiner jährlichen MAX-Konferenz hat Adobe eine breite Palette neuer KI-Funktionen in seiner Creative Suite angekündigt. Der Schwerpunkt liegt auf der generativen KI-Plattform Firefly und führenden Anwendungen wie Photoshop und Premiere Pro. Das Unternehmen erweitert die Möglichkeiten von Firefly, seinem generativen KI-Tool für Bilder und Videos. Einzelne Nutzer können nun benutzerdefinierte KI-Modelle auf bestimmte Charaktere …

Weiterlesen …

Filmemacher erschafft populäres Sci-Fi-Universum mit KI-Werkzeugen

Der Filmemacher Josh Kerrigan hat mit verschiedenen Werkzeugen der generativen KI eine erfolgreiche Science-Fiction-Webserie namens Neural Viz geschaffen. Christopher Beam berichtet für das Magazin Wired, dass das Projekt als eines der ersten Beispiele für qualitativ hochwertiges Filmschaffen mit KI gilt. Die Serie hebt sich damit von Inhalten ab, die oft als minderwertig kritisiert werden. Kerrigans …

Weiterlesen …

Microsoft AI kündigt sein erstes hauseigenes Text-zu-Bild-Modell an

Microsoft AI hat MAI-Image-1 angekündigt, seinen ersten Text-zu-Bild-Generator, der vollständig firmenintern entwickelt wurde. Das Modell hat bereits einen Platz in den Top 10 auf LMArena erreicht, einer öffentlichen Benchmark-Plattform, auf der menschliche Nutzer die Qualität der Ergebnisse verschiedener KI-Systeme vergleichen und bewerten. Laut der offiziellen Mitteilung soll MAI-Image-1 vielfältige und abwechslungsreiche Ergebnisse liefern. Microsoft gibt …

Weiterlesen …

Googles Bildgenerator „Nano Banana“ in weitere Produkte integriert

Google hat sein Bildgenerierungs-Modell Nano Banana in mehrere Produkte integriert, darunter die AI Mode-Suche, Google Lens und NotebookLM. Das Modell trägt offiziell die Bezeichnung Gemini 2.5 Flash Image und ermöglicht es Nutzern, Bilder über Text-Prompts zu erstellen und zu bearbeiten. In der AI Mode-Suchoberfläche von Google können Nutzer die Bildgenerierung nun über ein neues Plus-Symbol …

Weiterlesen …

Googles Gemini Enterprise soll seine KI in Unternehmen etablieren

Google Cloud hat Gemini Enterprise vorgestellt, eine neue KI-Plattform, die KI für alle Mitarbeiter in Unternehmen zugänglich machen soll. Google Cloud CEO Thomas Kurian bezeichnet sie als „das neue Eingangstor für KI am Arbeitsplatz“. Die Plattform kostet 30 Dollar pro Nutzer und Monat. Sie soll Mitarbeitern in allen Abteilungen helfen, Aufgaben zu automatisieren, Unternehmensdaten zu …

Weiterlesen …

Google teilt Tipps für sein Bildmodell Nano Banana, das jetzt allgemein verfügbar ist

Google hat sein Bildmodell Gemini 2.5 Flash Image, auch bekannt als Nano Banana, allgemein für den produktiven Einsatz freigegeben. Laut dem Unternehmen gehören zu den neuen Funktionen die Unterstützung für zehn verschiedene Bildformate, von Querformat für Filme bis zu vertikalen Formaten, sowie die Möglichkeit, reine Bildausgaben festzulegen. In einem Beitrag gab Google mehrere Tipps, wie …

Weiterlesen …

Neues KI-Modell Qwen3-VL soll sehen, verstehen und handeln

Das QwenTeam hat eine neue Serie quelloffener Vision-Language-Modelle namens Qwen3-VL veröffentlicht. Laut der offiziellen Ankündigung sollen die Modelle nicht nur Bilder und Videos erkennen, sondern auch Kontexte verstehen, logisch schlussfolgern und Aktionen ausführen. Das Spitzenmodell der Reihe, Qwen3-VL-235B-A22B, wird in zwei Versionen angeboten. Die Entwickler berichten, dass die „Instruct“-Version in wichtigen Tests zur visuellen Wahrnehmung …

Weiterlesen …