Microsoft Florence-2 ist spezialisiert auf Bildverarbeitung

Microsoft hat mit Florence-2 ein vielseitiges KI-Modell vorgestellt, das verschiedene Bildverarbeitungsaufgaben mit einem einzigen, einheitlichen Ansatz bewältigen kann. Das unter MIT-Lizenz verfügbare Modell übertrifft trotz seiner kompakten Größe offenbar größere Spezialmodelle in Bereichen wie Bildbeschriftung und Objekterkennung und könnte Unternehmen helfen, Investitionen in separate aufgabenspezifische Modelle einzusparen.

Meta veröffentlicht zahlreiche neue KI-Modelle

Meta veröffentlicht eine Reihe neuer KI-Modelle für Audio, Text und Wasserzeichen. Außerdem stellt Meta zwei Größen seines multimodalenTextmodells Chameleon für Forschungszwecke zur Verfügung. Diese Modelle ermöglichen es, Aufgaben zu erledigen, die visuelles und textuelles Verständnis erfordern, wie z. B. Bildbeschriftung.

Adobe Lightroom entfernt Objekte aus Fotos mit einem Klick

Adobe ergänzt mit „Generative Remove“ ein neues, KI-gestütztes Bildbearbeitungs-Tool in Lightroom. Die Funktion entfernt unerwünschte Objekte aus Fotos mit nur einem Klick und erzeugt dabei realistische Hintergründe. 

Ideogram kann nun auch nahtlose Muster generieren

KI-Bildgenerator Ideogram hat mit „Ideogram Tile“ eine neue Funktion eingeführt, um nahtlose, sich wiederholende Muster aus einem einzigen Textprompt zu erstellen.

Meta veröffentlicht KI-Tools für Werbung

Metas neue KI-Tools ermöglichen es Werbetreibenden, nicht nur Hintergründe, sondern vollständige Bilder zu erstellen und so Produktvariationen zu generieren. Diese Funktion birgt allerdings auch die Gefahr, dass Kunden mit nicht existierenden Produkten getäuscht werden könnten, wobei Meta betont, strenge Sicherheitsvorkehrungen getroffen zu haben.

OpenAI veröffentlicht GPT-4o und weitere Neuerungen

Einen Tag vor Googles I/O versuchte OpenAI dem großen Konkurrenten die Show zu stehlen. Und ihre Demo hat definitiv für einiges Aufsehen gesorgt. Im Mittelpunkt stand dabei ihr neuestes KI-Modell GPT-4o, wobei das „o“ für „Omnimodel“ steht. Das wiederum soll deutlich machen, dass diese Version nicht nur Text verarbeitet, sondern etwa auch Bild- und Ton-Informationen. …

Weiterlesen …

Googles Feuerwerk neuer Werkzeuge und Funktionen

Google hat die Keynote seiner Entwicklerkonferenz „I/O“ wie erwartet dazu genutzt, Stärke beim Thema KI zu demonstrieren. Das Unternehmen hat dafür unter anderem neue KI-Modelle für verschiedenste Aufgaben vorgestellt. Einige werden direkt auf Android-Geräten laufen oder finden sich im Chrome-Browser. Andere hingegen nutzen Googles spezialisierte Server. Sie erstellen Text, Bilder, Musik oder auch Videoclips. Außerdem …

Weiterlesen …

Googles Gecko bewertet Bildgeneratoren

Google DeepMind entwickelt mit „Gecko“ einen neuen Standard, um die Fähigkeiten von KI-Bildgeneratoren genauer zu bewerten. Es soll dabei helfen, die Stärken und Schwächen der KI-Modelle besser zu verstehen und ihre Entwicklung voranzutreiben.

Adobe integriert KI-Bildgenerator Firefly in Photoshop

Adobe integriert seine KI-Bildgenerierung Firefly direkt in Photoshop, sodass Nutzer Bilder per Texteingabe erstellen und diese anschließend mit den gewohnten Photoshop-Werkzeugen bearbeiten können.

Metas beeindruckende ChatGPT-Alternative Llama 3

Meta stellt mit Llama 3 die neueste Generation seiner Sprachmodelle vor, die sie frei zum Download zur Verfügung stellen. Die Modelle sollen in puncto Leistung viele Konkurrenten übertreffen und selbst mit einigen der besten proprietären Modelle mithalten können. Llama 3 glänzt offenbar insbesondere bei Multiple-Choice-Fragen, Programmieraufgaben und mathematischen Problemen. Neben den Modellen selbst präsentiert Meta einen eigenständigen …

Weiterlesen …