Bildgenerator Stable Diffusion 3 Medium läuft auch auf schwachen PCs

Stability AI hat mit Stable Diffusion 3 Medium eine kleinere Version seines Bildgenerierungsmodells veröffentlicht, die auf PCs mit nur 5 GB VRAM laufen kann. Das Modell bietet laut Stability AI eine vergleichbare Qualität wie die größere Version und könnte somit eine attraktive Option für Anwender mit begrenzten Ressourcen sein.

Microsoft Florence-2 ist spezialisiert auf Bildverarbeitung

Microsoft hat mit Florence-2 ein vielseitiges KI-Modell vorgestellt, das verschiedene Bildverarbeitungsaufgaben mit einem einzigen, einheitlichen Ansatz bewältigen kann. Das unter MIT-Lizenz verfügbare Modell übertrifft trotz seiner kompakten Größe offenbar größere Spezialmodelle in Bereichen wie Bildbeschriftung und Objekterkennung und könnte Unternehmen helfen, Investitionen in separate aufgabenspezifische Modelle einzusparen.

Meta veröffentlicht zahlreiche neue KI-Modelle

Meta veröffentlicht eine Reihe neuer KI-Modelle für Audio, Text und Wasserzeichen. Außerdem stellt Meta zwei Größen seines multimodalenTextmodells Chameleon für Forschungszwecke zur Verfügung. Diese Modelle ermöglichen es, Aufgaben zu erledigen, die visuelles und textuelles Verständnis erfordern, wie z. B. Bildbeschriftung.

Mit dieser KI-Plattform erstellst du Social-Media-Videos

Augie Studio präsentiert eine neue KI-Plattform, um Videos für soziale Medien einfach und in großem Stil zu erstellen. Die Plattform bietet verschiedene Funktionen wie die KI-gestützte Erstellung von Skripten, Voice-Overs und Bildern sowie Bearbeitungswerkzeuge, um Videos individuell anzupassen.

Genspark ist eine neue KI-Suchmaschine

Genspark ist eine neue KI-gestützte Suchmaschine, die ähnlich wie Googles AI Overviews oder Arc Search mit Hilfe generativer KI Zusammenfassungen von Suchergebnissen erstellt, jedoch laut eigenen Angaben durch spezialisierte Modelle eine höhere Qualität erzielt. 

Füge Sounds zu deinen Videos hinzu mit diesem Tool

ElevenLabs veröffentlicht ein neues Tool, mit dem Videomacher schnell und einfach passende Soundeffekte für ihre Clips erstellen können. Die App analysiert hochgeladene Videos und schlägt verschiedene Soundeffekte vor, die sich über eine Schnittstelle direkt in die Videos integriert lassen.

Neue KI-Modelle für Video: Luma Dream Machine und Runway Gen-3 Alpha

Luma AI, ein Startup aus San Francisco, hat mit „Dream Machine“ ein neues KI-System zur Videogenerierung vorgestellt. Im Gegensatz zu ähnlichen Systemen wie etwa von OpenAI („Sora“) ist Dream Machine ab sofort für alle kostenlos nutzbar. Nutzer können damit durch einfache Texteingaben 5-Sekunden-Videoclips erstellen. Die Qualität der Ergebnisse überzeugt allerdings nicht immer. Das Startup selbst listet die Schwächen von …

Weiterlesen …

Neue Version und Funktionen für ChatGPT-Alternative Claude

Anthropics neues Sprachmodell Claude 3.5 Sonnet sorgt für Aufsehen in der KI-Community. Laut Berichten übertrifft es bisherige Modelle wie GPT-4 in Benchmark-Tests und beeindruckt Nutzer mit seiner Leistungsfähigkeit. Demnach kann es auch komplexe Aufgaben wie Spieleprogrammierung oder Webentwicklung bewältigen.  Trotz Schwächen bei einfachen kognitiven Aufgaben zeigt Claude 3.5 Sonnet das Entwicklungstempo im Bereich der großen Sprachmodelle und setzt damit …

Weiterlesen …

Adapter

Stell dir vor, du hast einen Universal-Werkzeugkasten, der zwar viele verschiedene Werkzeuge enthält, aber für spezielle Aufgaben zu groß und unhandlich ist. Um bestimmte Arbeiten effizient zu erledigen, kannst du kleine, spezialisierte Aufsätze, sogenannte Adapter, verwenden. Diese Adapter werden an das Universal-Werkzeug befestigt und erweitern dessen Funktion. So kannst du zum Beispiel einen Schraubendreher-Adapter an …

Weiterlesen …