Chinesische Modelle führen Topliste an

Die neue Rangliste der besten Sprachmodelle von Hugging Face zeigt: Chinesische Modelle sind unter den frei verfügbaren KIs aktuell führend. Alibabas Qwen-Modelle dominieren die Top-Plätze des Rankings, das auf anspruchsvolleren Tests basiert als sein Vorgänger. Bewertet werden Fähigkeiten wie Wissensabruf, Schlussfolgerungen aus langen Texten, komplexe Mathematik und das Befolgen von Anweisungen. 

Studie: „Open Weights“ ist nicht „Open Source“

Viele KI-Modelle, die Chatbots antreiben, werben mit „Open Source“, geben aber den Code und die Trainingsdaten nicht vollständig frei. Eine neue Studie zeigt, dass viele große Unternehmen ihre Modelle als „Open Weights“ bezeichnen, was bedeutet, dass Forscher sie zwar nutzen, aber nicht einsehen oder grundlegend anpassen können. Besonders hinderlich ist die fehlende Transparenz bei den Trainingsdaten. Kleine Firmen und …

Weiterlesen …

Bildgenerator Stable Diffusion 3 Medium läuft auch auf schwachen PCs

Stability AI hat mit Stable Diffusion 3 Medium eine kleinere Version seines Bildgenerierungsmodells veröffentlicht, die auf PCs mit nur 5 GB VRAM laufen kann. Das Modell bietet laut Stability AI eine vergleichbare Qualität wie die größere Version und könnte somit eine attraktive Option für Anwender mit begrenzten Ressourcen sein.

Microsoft Florence-2 ist spezialisiert auf Bildverarbeitung

Microsoft hat mit Florence-2 ein vielseitiges KI-Modell vorgestellt, das verschiedene Bildverarbeitungsaufgaben mit einem einzigen, einheitlichen Ansatz bewältigen kann. Das unter MIT-Lizenz verfügbare Modell übertrifft trotz seiner kompakten Größe offenbar größere Spezialmodelle in Bereichen wie Bildbeschriftung und Objekterkennung und könnte Unternehmen helfen, Investitionen in separate aufgabenspezifische Modelle einzusparen.

Stability AI veröffentlicht Stable Audio Open

Stability AI veröffentlicht mit „Stable Audio Open“ ein neues KI-Modell zur kostenlosen Erstellung von Sounds und Musikstücken mit bis 47 Sekunden Länge. Allerdings ist es aufgrund des Trainingsmaterials auf englischsprachige Beschreibungen und westliche Musikstile beschränkt.

Nvidia Inference Microservices vereinfachen KI-Entwicklung

Nvidia stellt mit NIM (Nvidia Inference Microservices) eine neue Technologie vor, die es Entwicklern ermöglichen soll, KI-Anwendungen innerhalb von Minuten statt Wochen bereitzustellen. Diese Microservices bieten optimierte Modelle als Container, die sich in Clouds, Rechenzentren oder auf Workstations einsetzen. Unternehmen sollen damit generative KI-Anwendungen für Copiloten, Chatbots und mehr einfach und schnell erstellen können. Über 40 Microservices …

Weiterlesen …

Cohere Aya 23 ist mehrsprachig

Cohere for AI veröffentlicht die mehrsprachigen KI-Modelle Aya 23 mit Unterstützung für 23 Sprachen und macht die Model Weights öffentlich zugänglich („Open Weights“). Die Modelle übertreffen sowohl den Vorgänger Aya 101 als auch andere offene Modelle in einer Vielzahl von Aufgaben und ermöglichen Forschern und Praktikern, die mehrsprachigen Modelle und Anwendungen weiterzuentwickeln.

Perplexica ist eine quelloffene KI-Suchmaschine

Perplexica ist eine Open-Source-Suchmaschine mit KI-Unterstützung ähnlich Perplexity. Sie liefert Antworten mit Quellenangaben. Einmal installiert, kann sie lokale Sprachmodelle wie etwa Llama 3 oder Mixtral nutzen.

Falcon 2 11B vorgestellt

Das Technology Innovation Institute (TII) in Abu Dhabi hat mit Falcon 2 11B ein neues, leistungsstarkes KI-Modell veröffentlicht, das frei verfügbar und mehrsprachig ist. Falcon 2 11B übertrifft in seiner Leistung vergleichbare Modelle wie Metas Llama 3.

OpenVoice ist eine KI für Stimmencloning

OpenVoice erlaubt es Nutzern, Stimmen in verschiedenen Sprachen und Akzenten realistisch zu klonen und sogar Emotionen und Sprechstile zu steuern. Die neueste Version, OpenVoice V2, bietet eine verbesserte Audioqualität, native Unterstützung für mehrere Sprachen und ist für die kommerzielle Nutzung kostenlos verfügbar. Quelle: Hacker News