Moondream entwickelt kompaktes KI-Modell für Bild- und Spracherkennung

Das Startup Moondream hat in einer Pre-Seed-Finanzierungsrunde 4,5 Millionen US-Dollar eingeworben. Das Unternehmen hat ein quelloffenes Modell für Bild- und Spracherkennung entwickelt, das mit nur 1,6 Milliarden Parametern auskommt. Dennoch erreicht es laut CEO Jay Allen eine Leistung, die mit viermal größeren Modellen vergleichbar ist. Der Ansatz von Moondream ermöglicht den lokalen Einsatz von KI-Modellen … Weiterlesen …

Apple Intelligence: Erste Features jetzt verfügbar, Testergebnisse gemischt

Apple hat iOS 18.1, iPadOS 18.1 und macOS Sequoia 15.1 veröffentlicht und damit die ersten Apple Intelligence Funktionen eingeführt. Diese KI-gestützten Verbesserungen sind auf ausgewählten Geräten mit A17 Pro-, M1- oder neueren Chips verfügbar. Nutzer können nach dem Herunterladen des Updates Apple Intelligence aktivieren und werden auf eine kurze Warteliste gesetzt, um Apples Server auf … Weiterlesen …

Google Photos zeigt bald KI-Bearbeitungen an

Google Photos wird künftig bei Bildern anzeigen, ob diese mit Künstlicher Intelligenz bearbeitet wurden. Wie Chris Welch in seinem Beitrag für The Verge berichtet, werden die KI-Hinweise ab nächster Woche in der „AI info“-Sektion der Bilddetails sichtbar sein. Die Kennzeichnung gilt für Bearbeitungen mit Tools wie Magic Editor, Magic Eraser und Zoom Enhance sowie für … Weiterlesen …

Midjourney jetzt mit Bildeditor

Der KI-Bildgenerator Midjourney hat einen neuen KI-Bildeditor eingeführt, der es Nutzern ermöglicht, hochgeladene Bilder direkt zu bearbeiten und deren Stil zu verändern. Wie Carl Franzen für VentureBeat berichtet, können Nutzer mit dem neuen „Edit“-Feature beispielsweise Vintage-Fotografien in Anime-Stil umwandeln oder Handzeichnungen in Sekundenschnelle in vollwertige Kunstwerke verwandeln. Die neue Funktion ist zunächst nur für langjährige … Weiterlesen …

OpenAIs neues Modell generiert Medien 50-mal schneller

OpenAI hat ein neues KI-Modell entwickelt, das Medieninhalte wie Bilder, Videos und Audio 50-mal schneller generieren kann als bisherige Systeme. Das neue Modell, ein sogenanntes „continuous-time consistency model“, benötigt für die Erstellung eines Bildes nur noch etwa eine Zehntelsekunde statt der üblichen fünf Sekunden, berichten die OpenAI-Forscher Cheng Lu und Yang Song in einem Fachartikel. … Weiterlesen …

Playground v3 ist spezialisiert auf Grafikdesign

Das Forschungsunternehmen Playground Research stellt mit „Playground v3“ ein neues KI-Modell zur Text-Bild-Generierung vor, das offenbar in mehreren Testverfahren Spitzenleistungen erzielt. Das System zeichnet sich demnach besonders durch seine präzise Umsetzung von Textanweisungen, die Fähigkeit zum logischen Denken und eine überragende Qualität bei der Textdarstellung aus. In Nutzerstudien übertraf das Modell sogar menschliche Designer bei … Weiterlesen …

Drei Dienste für KI-generierte Porträtfotos

Künstliche Intelligenz macht professionelle Porträtfotos auch ohne Fotograf möglich. Drei KI-Dienste – Portrait Pal, PixelPose und Dreamwave – verwandeln einfache Fotos in hochwertige Bewerbungsbilder, wie Jon Stojan in einem Beitrag für VentureBeat berichtet. Die Anbieter unterscheiden sich dabei vor allem in Preis, Bearbeitungszeit und Anzahl der gelieferten Fotos. Die drei Dienste arbeiten nach einem ähnlichen … Weiterlesen …

Bildgenerator Ideogram jetzt mit interaktivem „Canvas“

Das kanadische KI-Startup Ideogram erweitert seine Bildgenerierung um einen neuen interaktiven „Canvas“. Wie Carl Franzen berichtet, können Nutzer damit KI-generierte Bilder auf einer unbegrenzten Arbeitsfläche anordnen, vergleichen und zu neuen Kompositionen verbinden. Das neue Tool beinhaltet auch die Funktionen „Magic Fill“ zum gezielten Bearbeiten von Bildbereichen und „Extend“ zum Erweitern von Bildgrenzen. Ideogram bietet den … Weiterlesen …

Canva stellt Bildgenerator „Dream Lab“ vor

Die Design-Plattform Canva hat einen neuen KI-Bildgenerator namens „Dream Lab“ eingeführt. Das auf der Leonardo.ai-Technologie basierende Tool kann Bilder aus Textbeschreibungen in verschiedenen Stilen wie „3D-Render“ oder „Illustration“ erzeugen, berichtet Jess Weatherbed. Im Vergleich zum bisherigen Stable Diffusion-Generator von Canva soll Dream Lab besonders bei fotografischen Stilen und Bildern mit mehreren Motiven bessere Ergebnisse liefern. … Weiterlesen …

Stable Diffusion 3.5 ist die neueste Version der Open-Source-Bild-KI

Stability AI hat seine neueste Familie von Bildgenerierungsmodellen vorgestellt: Stable Diffusion 3.5. Laut Unternehmensangaben umfasst sie drei Varianten – Large, Large Turbo und Medium – die sich durch verbesserte Anpassungsfähigkeit und Vielseitigkeit auszeichnen sollen. Die Large-Variante mit 8 Milliarden Parametern ist ab sofort verfügbar, während das Medium-Modell am 29. Oktober veröffentlicht werden soll. Das Unternehmen … Weiterlesen …