Microsoft Florence-2 ist spezialisiert auf Bildverarbeitung

Microsoft hat mit Florence-2 ein vielseitiges KI-Modell vorgestellt, das verschiedene Bildverarbeitungsaufgaben mit einem einzigen, einheitlichen Ansatz bewältigen kann. Das unter MIT-Lizenz verfügbare Modell übertrifft trotz seiner kompakten Größe offenbar größere Spezialmodelle in Bereichen wie Bildbeschriftung und Objekterkennung und könnte Unternehmen helfen, Investitionen in separate aufgabenspezifische Modelle einzusparen.

Meta veröffentlicht zahlreiche neue KI-Modelle

Meta veröffentlicht eine Reihe neuer KI-Modelle für Audio, Text und Wasserzeichen. Außerdem stellt Meta zwei Größen seines multimodalenTextmodells Chameleon für Forschungszwecke zur Verfügung. Diese Modelle ermöglichen es, Aufgaben zu erledigen, die visuelles und textuelles Verständnis erfordern, wie z. B. Bildbeschriftung.

Mit dieser KI-Plattform erstellst du Social-Media-Videos

Augie Studio präsentiert eine neue KI-Plattform, um Videos für soziale Medien einfach und in großem Stil zu erstellen. Die Plattform bietet verschiedene Funktionen wie die KI-gestützte Erstellung von Skripten, Voice-Overs und Bildern sowie Bearbeitungswerkzeuge, um Videos individuell anzupassen.

Genspark ist eine neue KI-Suchmaschine

Genspark ist eine neue KI-gestützte Suchmaschine, die ähnlich wie Googles AI Overviews oder Arc Search mit Hilfe generativer KI Zusammenfassungen von Suchergebnissen erstellt, jedoch laut eigenen Angaben durch spezialisierte Modelle eine höhere Qualität erzielt. 

Füge Sounds zu deinen Videos hinzu mit diesem Tool

ElevenLabs veröffentlicht ein neues Tool, mit dem Videomacher schnell und einfach passende Soundeffekte für ihre Clips erstellen können. Die App analysiert hochgeladene Videos und schlägt verschiedene Soundeffekte vor, die sich über eine Schnittstelle direkt in die Videos integriert lassen.

Neue KI-Modelle für Video: Luma Dream Machine und Runway Gen-3 Alpha

Luma AI, ein Startup aus San Francisco, hat mit „Dream Machine“ ein neues KI-System zur Videogenerierung vorgestellt. Im Gegensatz zu ähnlichen Systemen wie etwa von OpenAI („Sora“) ist Dream Machine ab sofort für alle kostenlos nutzbar. Nutzer können damit durch einfache Texteingaben 5-Sekunden-Videoclips erstellen. Die Qualität der Ergebnisse überzeugt allerdings nicht immer. Das Startup selbst listet die Schwächen von …

Weiterlesen …

Neue Version und Funktionen für ChatGPT-Alternative Claude

Anthropics neues Sprachmodell Claude 3.5 Sonnet sorgt für Aufsehen in der KI-Community. Laut Berichten übertrifft es bisherige Modelle wie GPT-4 in Benchmark-Tests und beeindruckt Nutzer mit seiner Leistungsfähigkeit. Demnach kann es auch komplexe Aufgaben wie Spieleprogrammierung oder Webentwicklung bewältigen.  Trotz Schwächen bei einfachen kognitiven Aufgaben zeigt Claude 3.5 Sonnet das Entwicklungstempo im Bereich der großen Sprachmodelle und setzt damit …

Weiterlesen …

Microsofts „GPT Builder“ eingestellt

Microsoft stellt seinen GPT Builder für Privatanwender bereits drei Monate nach Einführung wieder ein, da das Unternehmen die weitere Entwicklung des Dienstes als nicht wirtschaftlich betrachtet. Nutzer können ihre Daten bis zum 14. Juli sichern, danach werden alle GPTs und zugehörigen Informationen gelöscht.

Mistral bietet mehr Optionen für Anpassungen

Das französische KI-Startup Mistral bietet neue Möglichkeiten zur Anpassung seiner generativen Modelle, darunter kostenpflichtige Tarife und ein neues Software Development Kit (SDK). Damit können Entwickler und Unternehmen die Modelle für spezifische Anwendungsfälle optimieren.

×