Microsoft AI kündigt sein erstes hauseigenes Text-zu-Bild-Modell an

Microsoft AI hat MAI-Image-1 angekündigt, seinen ersten Text-zu-Bild-Generator, der vollständig firmenintern entwickelt wurde. Das Modell hat bereits einen Platz in den Top 10 auf LMArena erreicht, einer öffentlichen Benchmark-Plattform, auf der menschliche Nutzer die Qualität der Ergebnisse verschiedener KI-Systeme vergleichen und bewerten. Laut der offiziellen Mitteilung soll MAI-Image-1 vielfältige und abwechslungsreiche Ergebnisse liefern. Microsoft gibt …

Weiterlesen …

Googles Bildgenerator „Nano Banana“ in weitere Produkte integriert

Google hat sein Bildgenerierungs-Modell Nano Banana in mehrere Produkte integriert, darunter die AI Mode-Suche, Google Lens und NotebookLM. Das Modell trägt offiziell die Bezeichnung Gemini 2.5 Flash Image und ermöglicht es Nutzern, Bilder über Text-Prompts zu erstellen und zu bearbeiten. In der AI Mode-Suchoberfläche von Google können Nutzer die Bildgenerierung nun über ein neues Plus-Symbol …

Weiterlesen …

Googles Gemini Enterprise soll seine KI in Unternehmen etablieren

Google Cloud hat Gemini Enterprise vorgestellt, eine neue KI-Plattform, die KI für alle Mitarbeiter in Unternehmen zugänglich machen soll. Google Cloud CEO Thomas Kurian bezeichnet sie als „das neue Eingangstor für KI am Arbeitsplatz“. Die Plattform kostet 30 Dollar pro Nutzer und Monat. Sie soll Mitarbeitern in allen Abteilungen helfen, Aufgaben zu automatisieren, Unternehmensdaten zu …

Weiterlesen …

Google teilt Tipps für sein Bildmodell Nano Banana, das jetzt allgemein verfügbar ist

Google hat sein Bildmodell Gemini 2.5 Flash Image, auch bekannt als Nano Banana, allgemein für den produktiven Einsatz freigegeben. Laut dem Unternehmen gehören zu den neuen Funktionen die Unterstützung für zehn verschiedene Bildformate, von Querformat für Filme bis zu vertikalen Formaten, sowie die Möglichkeit, reine Bildausgaben festzulegen. In einem Beitrag gab Google mehrere Tipps, wie …

Weiterlesen …

Neues KI-Modell Qwen3-VL soll sehen, verstehen und handeln

Das QwenTeam hat eine neue Serie quelloffener Vision-Language-Modelle namens Qwen3-VL veröffentlicht. Laut der offiziellen Ankündigung sollen die Modelle nicht nur Bilder und Videos erkennen, sondern auch Kontexte verstehen, logisch schlussfolgern und Aktionen ausführen. Das Spitzenmodell der Reihe, Qwen3-VL-235B-A22B, wird in zwei Versionen angeboten. Die Entwickler berichten, dass die „Instruct“-Version in wichtigen Tests zur visuellen Wahrnehmung …

Weiterlesen …

Qwen3-Omni ist ein Open-Source-Modell für Text, Bild, Audio und Video

Das chinesische Technologieunternehmen Alibaba hat Qwen3-Omni veröffentlicht. Es ist ein neues generatives KI-Modell, das eine Kombination aus Text, Bildern, Audio und Video verarbeiten kann. Das Modell zeichnet sich durch seine „omni-modalen“ Fähigkeiten und seine Open-Source-Lizenz aus. Damit positioniert es sich als direkter Konkurrent zu proprietären Modellen von US-Technologiekonzernen wie OpenAI und Google. Nach von Alibaba …

Weiterlesen …

Google: Fotobearbeitung per Sprachbefehl für mehr Android-Nutzer

Google stellt seine dialogbasierte Fotobearbeitung für weitere Android-Nutzer in den USA bereit. Mit dem Werkzeug können Nutzer Bilder durch Sprach- oder Texteingaben bearbeiten. Artie Beaty berichtet für ZDNet, dass die Funktion bisher nur für das Google Pixel 10 verfügbar war. Die Bearbeitung wird über die Schaltfläche „Bearbeitungshilfe“ in Google Fotos gestartet. Nutzer können dann ihre …

Weiterlesen …

Google veröffentlicht Tipps für bessere Bilderzeugung mit Gemini

Google DeepMind erklärt in einem neuen Beitrag, wie Nutzer die verbesserte Bilderzeugung in Gemini optimal nutzen können. Produktmanagerin Naina Raisinghani teilte konkrete Strategien für wirksamere Eingaben mit dem aktualisierten Modell. Das Unternehmen empfiehlt sechs wichtige Elemente in Eingaben: Motiv, Komposition, Handlung, Ort, Stil und Bearbeitungsanweisungen. Nutzer sollten bei der Motivbeschreibung spezifisch und bei Änderungswünschen direkt …

Weiterlesen …

„Nano Banana“: Google begeistert mit neuem KI-Bildgenerator

Google hat ein aktualisiertes KI-Modell namens Gemini 2.5 Flash Image veröffentlicht. Es soll Nutzern mehr Kontrolle über die Erstellung und Bearbeitung von Bildern geben. Das Modell wurde zuvor anonym auf der Bewertungsplattform LMArena unter dem Codenamen „Nano Banana“ getestet. Nun ist es in die Gemini-App integriert und steht Entwicklern über die Gemini API, Google AI …

Weiterlesen …

Neues KI-Modell von Alibaba bearbeitet Bilder mit Textbefehlen

Das Qwen-Team von Alibaba hat ein neues Open-Source-KI-Modell namens Qwen-Image Edit veröffentlicht. Es ermöglicht Nutzern, Bilder mit einfachen Textanweisungen zu bearbeiten. Das Werkzeug kann eine Vielzahl komplexer Aufgaben ausführen und konkurriert damit mit etablierter Software wie Adobe Photoshop. Das berichtet Carl Franzen für VentureBeat. Nutzer laden ein Bild hoch und geben eine Anweisung ein, zum …

Weiterlesen …