Stable Diffusion 3.5 startet auf Amazons Enterprise-KI-Plattform

Stability AI hat sein neuestes Text-zu-Bild-Modell, Stable Diffusion 3.5 Large, auf Amazons Bedrock-Dienst eingeführt. Wie Sean Michael Kerner für VentureBeat berichtet, ist AWS damit der einzige öffentliche Cloud-Anbieter für Stability AIs Hauptmodelle. Die Integration ermöglicht Unternehmen den Zugriff auf verschiedene KI-Modelle über eine einheitliche API. Die National Football League nutzt bereits diese Technologie für ihr … Weiterlesen …

Midjourney führt neue Personalisierungsfunktionen ein

Der KI-Bildgenerator Midjourney hat neue Anpassungsmöglichkeiten für seine Plattform vorgestellt. Wie Carl Franzen für VentureBeat berichtet, umfassen die Neuerungen Pinterest-ähnliche Moodboards und mehrere benutzerdefinierte Modellprofile. Die Moodboard-Funktion ermöglicht es Nutzern, Bildsammlungen hochzuladen, die als Inspirationsquelle für den KI-Generator dienen. Das Unternehmen hat außerdem den Anpassungsprozess vereinfacht. Nutzer müssen jetzt nur noch 40 statt 200 Bildbewertungen … Weiterlesen …

Google stellt Whisk für bildbasierte KI-Generierung vor

Google hat ein neues KI-Bildgenerierungstool namens Whisk vorgestellt, das Bilder mithilfe von anderen Bildern statt Textbeschreibungen erstellt. Wie Jay Peters von The Verge berichtet, können Nutzer Motiv, Szene und Stil durch Bildvorlagen oder von Google vorgeschlagene Beispiele festlegen. Das Tool basiert auf Googles neuester Imagen 3-Technologie und erzeugt Ergebnisse innerhalb weniger Sekunden. Nutzer haben die … Weiterlesen …

Midjourney stellt kollaboratives Storytelling-Tool Patchwork vor

Midjourney hat eine neue webbasierte Plattform namens Patchwork eingeführt, die gemeinsames Geschichtenerzählen ermöglicht. Wie Carl Franzen für VentureBeat berichtet, können mehrere Nutzer gleichzeitig digitale Welten erschaffen und entwickeln. Die Plattform bietet eine unbegrenzte Arbeitsfläche, auf der Charaktere, Ereignisse und KI-generierte Bilder erstellt werden können. Für die Nutzung ist eine Verknüpfung des Midjourney Discord-Kontos mit Google … Weiterlesen …

Tests zeigen beeindruckende Leistung von Googles Gemini 2.0 Flash

Der unabhängige Entwickler Simon Willison hat umfangreiche Tests des neuen Gemini 2.0 Flash Modells von Google durchgeführt und die Ergebnisse in seinem Blog dokumentiert. Das Modell zeigte demnach herausragende Fähigkeiten bei der Analyse komplexer Bilder. Bei einem Test mit einem chaotischen Pelikanbild lieferte es etwa präzise Beschreibungen der Vogelarten und ihrer Umgebung. In räumlichen Erkennungstests … Weiterlesen …

Google stellt Gemini 2.0 KI-Modell mit erweiterten Fähigkeiten und Agentenfunktionen vor

Google hat Gemini 2.0 vorgestellt, sein neuestes KI-Modell, das bedeutende Fortschritte in multimodalen Fähigkeiten und autonomen Agentenfunktionen bietet. Die experimentelle Version, Gemini 2.0 Flash, wird zunächst Entwicklern und ausgewählten Testern über Googles KI-Plattformen zur Verfügung gestellt. Laut Google kann das neue Modell Text, Bilder und mehrsprachiges Audio generieren und arbeitet dabei doppelt so schnell wie … Weiterlesen …

NitroFusion erstellt Bilder blitzschnell auf Standardhardware

Die Universität Surrey hat ein bahnbrechendes KI-Modell namens NitroFusion vorgestellt. Das System erzeugt Bilder in Echtzeit, während Benutzer tippen. Die Entwicklung stammt aus dem SketchX-Labor des universitären Instituts für Menschen-zentrierte Künstliche Intelligenz (PAI). Das Besondere: NitroFusion läuft auf handelsüblichen Grafikkarten. Im Gegensatz zu bestehenden Bildgenerierungssystemen benötigt das Modell keine aufwendige Computerinfrastruktur. Es nutzt ein dynamisches … Weiterlesen …

X (ehemals Twitter) führt KI-Bildgenerator Aurora ein

Der Social-Media-Dienst X (ehemals Twitter) hat einen neuen KI-Bildgenerator namens Aurora eingeführt. Wie Tech-Journalist Kyle Wiggers für TechCrunch berichtet, wurde das Tool am Samstag freigeschaltet, war jedoch kurzzeitig für einige Nutzer nicht verfügbar. Aurora ist in den Grok-Assistenten integriert und kann fotorealistische Bilder erstellen. Das System erlaubt die Generierung von Bildern öffentlicher Personen und urheberrechtlich … Weiterlesen …

Amazon stellt neue KI-Modellfamilie Nova für Text-, Bild- und Videogenerierung vor

Amazon Web Services hat Nova vorgestellt, eine neue Familie von künstlichen Intelligenzmodellen für die Generierung von Text, Bildern und Videos. Die Ankündigung erfolgte durch CEO Andy Jassy auf der AWS re:Invent Konferenz im Dezember 2024. Die Nova-Familie umfasst vier textgenerierende Modelle: Micro, Lite, Pro und Premier. Micro, Lite und Pro sind sofort für AWS-Kunden verfügbar, … Weiterlesen …

Luma AI erweitert KI-Plattform mit neuen Video- und Bildfunktionen

Luma AI hat seine „Dream Machine“ KI-Plattform umfassend erweitert und bietet nun erweiterte Videoproduktionsfunktionen über Web und mobile Apps an. Wie Carl Franzen berichtet, steht im Zentrum der Entwicklung das neue Bildmodell Luma Photon, das fortschrittliche Text-zu-Bild und Videoerstellung ermöglicht. Die Plattform, die seit Juni 2024 mehr als 25 Millionen registrierte Nutzer verzeichnet, bietet vier … Weiterlesen …