Bildgenerator Stable Diffusion 3 Medium läuft auch auf schwachen PCs

Stability AI hat mit Stable Diffusion 3 Medium eine kleinere Version seines Bildgenerierungsmodells veröffentlicht, die auf PCs mit nur 5 GB VRAM laufen kann. Das Modell bietet laut Stability AI eine vergleichbare Qualität wie die größere Version und könnte somit eine attraktive Option für Anwender mit begrenzten Ressourcen sein.

Microsoft Florence-2 ist spezialisiert auf Bildverarbeitung

Microsoft hat mit Florence-2 ein vielseitiges KI-Modell vorgestellt, das verschiedene Bildverarbeitungsaufgaben mit einem einzigen, einheitlichen Ansatz bewältigen kann. Das unter MIT-Lizenz verfügbare Modell übertrifft trotz seiner kompakten Größe offenbar größere Spezialmodelle in Bereichen wie Bildbeschriftung und Objekterkennung und könnte Unternehmen helfen, Investitionen in separate aufgabenspezifische Modelle einzusparen.

Stability AI veröffentlicht Stable Audio Open

Stability AI veröffentlicht mit „Stable Audio Open“ ein neues KI-Modell zur kostenlosen Erstellung von Sounds und Musikstücken mit bis 47 Sekunden Länge. Allerdings ist es aufgrund des Trainingsmaterials auf englischsprachige Beschreibungen und westliche Musikstile beschränkt.

Nvidia Inference Microservices vereinfachen KI-Entwicklung

Nvidia stellt mit NIM (Nvidia Inference Microservices) eine neue Technologie vor, die es Entwicklern ermöglichen soll, KI-Anwendungen innerhalb von Minuten statt Wochen bereitzustellen. Diese Microservices bieten optimierte Modelle als Container, die sich in Clouds, Rechenzentren oder auf Workstations einsetzen. Unternehmen sollen damit generative KI-Anwendungen für Copiloten, Chatbots und mehr einfach und schnell erstellen können. Über 40 Microservices …

Weiterlesen …

Cohere Aya 23 ist mehrsprachig

Cohere for AI veröffentlicht die mehrsprachigen KI-Modelle Aya 23 mit Unterstützung für 23 Sprachen und macht die Model Weights öffentlich zugänglich („Open Weights“). Die Modelle übertreffen sowohl den Vorgänger Aya 101 als auch andere offene Modelle in einer Vielzahl von Aufgaben und ermöglichen Forschern und Praktikern, die mehrsprachigen Modelle und Anwendungen weiterzuentwickeln.

Perplexica ist eine quelloffene KI-Suchmaschine

Perplexica ist eine Open-Source-Suchmaschine mit KI-Unterstützung ähnlich Perplexity. Sie liefert Antworten mit Quellenangaben. Einmal installiert, kann sie lokale Sprachmodelle wie etwa Llama 3 oder Mixtral nutzen.

Falcon 2 11B vorgestellt

Das Technology Innovation Institute (TII) in Abu Dhabi hat mit Falcon 2 11B ein neues, leistungsstarkes KI-Modell veröffentlicht, das frei verfügbar und mehrsprachig ist. Falcon 2 11B übertrifft in seiner Leistung vergleichbare Modelle wie Metas Llama 3.

OpenVoice ist eine KI für Stimmencloning

OpenVoice erlaubt es Nutzern, Stimmen in verschiedenen Sprachen und Akzenten realistisch zu klonen und sogar Emotionen und Sprechstile zu steuern. Die neueste Version, OpenVoice V2, bietet eine verbesserte Audioqualität, native Unterstützung für mehrere Sprachen und ist für die kommerzielle Nutzung kostenlos verfügbar. Quelle: Hacker News

Arctics Snowflake ist speziell für Unternehmen gedacht

Snowflake stellt mit Arctic ein neues, offenes Sprachmodell vor, das speziell für komplexe Aufgaben in Unternehmen entwickelt ist, wie z.B. das Generieren von SQL-Abfragen und Code oder das Befolgen von Anweisungen. 

Apple veröffentlicht OpenELM KI-Modelle

Apple veröffentlicht OpenELM, eine Reihe kleiner, frei angebotener KI-Modelle, die direkt auf Geräten wie Laptops oder Smartphones laufen können und Aufgaben wie Textgenerierung effizient ausführen. Obwohl OpenELM in seiner Leistung nicht branchenführend ist, bietet es eine solide Basis für zukünftige Forschung und Entwicklung im Bereich der On-Device-KI.