Google Imagen 4 verbessert KI-Bilderzeugung mit Textelementen

Google hat Imagen 4 veröffentlicht, sein neuestes KI-Modell zur Bilderzeugung aus Textbeschreibungen. Das Modell ist zunächst nur über die Gemini API und Google AI Studio verfügbar. Die Ankündigung erfolgte im offiziellen Google Developer Blog. Das Unternehmen bietet zwei Modellvarianten an: Google erklärt, Imagen 4 biete deutliche Verbesserungen bei der Darstellung von Text in Bildern. Die …

Weiterlesen …

YouTube integriert Googles fortgeschrittene Video-KI Veo 3

YouTube wird Googles neuesten KI-Videogenerator Veo 3 im Sommer in seine Shorts-Plattform einbauen. CEO Neal Mohan kündigte die Integration beim Cannes Lions Festival an, berichtete Alex Weprin für The Hollywood Reporter. Das KI-Tool kann Videos und Ton aus Textbefehlen erstellen. Mohan sagte, die Technologie werde „die Grenzen menschlicher Kreativität erweitern“ und Kreativen helfen, „neue kreative …

Weiterlesen …

Googles KI-Suche hat jetzt einen Sprachmodus

Google hat Sprachkonversationen für seine KI-Suchfunktion AI Mode in den USA eingeführt. Die neue Funktion „Search Live“ ermöglicht es Nutzern, gesprochene Dialoge mit Googles künstlicher Intelligenz zu führen. Dies berichtete TechCrunch-Journalistin Aisha Malik. Nutzer können die Funktion über die Google-App durch Antippen eines „Live“-Symbols aktivieren und Fragen laut stellen. Die KI antwortet mit generiertem Audio. …

Weiterlesen …

Meta stellt KI-Werkzeuge für Werbetreibende vor

Meta hat beim Cannes Lions International Festival of Creativity neue generative KI-Funktionen für seine Advantage+ Werbeplattform vorgestellt. Die Social-Media-Plattform führte Werkzeuge ein, die die Kampagnenleistung für Werbetreibende und Agenturen verbessern sollen, berichtet AdWeek. Zu den wichtigsten Funktionen gehören einheitliche Branding-Möglichkeiten zur Integration von Logos, Farben und Schriftarten. Meta testet Video-Generierungstools, die Standbilder in dynamische Videos …

Weiterlesen …

Adobe bringt mobile App für Firefly KI-Bildgenerierung heraus

Adobe hat eine mobile Anwendung für seine Firefly KI-Plattform veröffentlicht. Die App steht für iPhone und Android zur Verfügung. Berichtet hat darüber Jess Weatherbed von The Verge. Nutzer können mit Textbeschreibungen Bilder und Videos erstellen. Die App enthält beliebte KI-Bearbeitungsfunktionen wie Generative Fill und Generative Expand aus Photoshop. Verfügbar sind auch KI-Modelle von Drittanbietern. Dazu …

Weiterlesen …

Midjourney startet seinen ersten KI-Video-Generator

Midjourney hat sein erstes KI-Video-Modell veröffentlicht. Nutzer können damit Standbilder in kurze Videoclips verwandeln. Das Unternehmen stellte sein V1 Video Model fast 20 Millionen Nutzern weltweit zur Verfügung. Die neue Funktion arbeitet über einen „Image-to-Video“-Workflow. Nutzer erstellen oder laden ein Bild hoch und drücken dann einen „Animate“-Button, um Bewegung zu erzeugen. Das System bietet automatische …

Weiterlesen …

MiniMax veröffentlicht leistungsstarkes Open-Source-KI-Modell

Das chinesische Unternehmen MiniMax hat MiniMax-M1 veröffentlicht, ein neues Open-Source-Sprachmodell mit einem Kontextfenster von einer Million Token. Damit kann es ganze Buchsammlungen in einem Gespräch verarbeiten, berichtet Carl Franzen für VentureBeat. Das Modell steht unter Apache 2.0 Lizenz kostenlos für kommerzielle Nutzung auf Plattformen wie Hugging Face zur Verfügung. MiniMax-M1 gibt es in zwei Varianten …

Weiterlesen …

AlphaSense Deep Research durchsucht das Web und interne Firmendaten

Die Finanzanalyse-Plattform AlphaSense hat Deep Research eingeführt. Der KI-Agent automatisiert komplexe Recherchen durch die gleichzeitige Suche in öffentlichen Webinhalten und privaten Unternehmensdatenbanken. Carl Franzen von VentureBeat berichtete über die Ankündigung. Anders als viele bestehende KI-Recherche-Tools von OpenAI, Google und anderen greift Deep Research auch auf interne Firmendaten und AlphaSenses proprietäre Datenbank mit über 500 Millionen …

Weiterlesen …

Google: stabile Versionen der Gemini 2.5 Modelle und neue Flash-Lite Variante

Google gab bekannt, dass die KI-Modelle Gemini 2.5 Pro und Flash von der Vorschau zur allgemeinen Verfügbarkeit wechseln. Das Unternehmen erklärte, dass Entwickler nun mit Vertrauen Produktionsanwendungen mit diesen stabilen Versionen erstellen können. Mehrere Organisationen wie Snap, SmartBear, Spline und Rooms nutzen bereits seit einigen Wochen die neuesten Versionen produktiv, so Google. Die Ankündigung machte …

Weiterlesen …

KI-Browser Dia steht dir immer zur Seite

The Browser Company hat Dia veröffentlicht, einen neuen Webbrowser mit Fokus auf künstliche Intelligenz. Die Beta-Version startete am Mittwoch für bestehende Nutzer des Vorgänger-Browsers Arc. Andere Interessenten müssen sich auf eine Warteliste setzen lassen. Dia verfügt über einen ChatGPT-ähnlichen Chatbot, der über eine Seitenleiste und die URL-Leiste zugänglich ist. Der KI-Assistent kann geöffnete Browser-Tabs analysieren, …

Weiterlesen …