DeepSeek-V2.5 als neuer Open-Source-Champion gefeiert

DeepSeek-V2.5 gilt als neuer Spitzenreiter unter den Open-Source-KI-Modellen. DeepSeek selbst ist ein Ableger des chinesischen Hedgefonds High-Flyer Capital Management. Das neue Modell kombiniert allgemeine Sprachverarbeitung und Programmierfähigkeiten in einem offenbar leistungsstarken System. Laut Carl Franzen von VentureBeat übertrifft DeepSeek-V2.5 seine Vorgänger in fast allen Benchmarks. Das Modell bietet neue Funktionen wie Function Calling und zeigt …

Weiterlesen …

OLMoE ist ein vollständig quelloffenes MoE-Modell

Ein neues Open-Source-Modell namens OLMoE wurde vom Allen Institute for AI (AI2) in Zusammenarbeit mit Contextual AI veröffentlicht. Wie Emilia David für VentureBeat berichtet, zielt das Modell darauf ab, leistungsstark und gleichzeitig kosteneffektiv zu sein. OLMoE nutzt eine Mixture-of-Experts-Architektur mit 7 Milliarden Parametern, von denen nur 1 Milliarde pro Eingabetoken aktiv sind. Im Gegensatz zu …

Weiterlesen …

Zweifel an der Performance von Reflection 70B

Welchen Unterschied ein Wochenende macht: Noch vor einigen Tagen galt das neue Reflection 70B als potenzieller Champion unter den Open-Source-Modellen. Das Modell basiert nach offiziellen Angaben auf Metas Llama 3.1 70B, aber mit einer Besonderheit: Es ist speziell darauf trainiert, nicht sofort eine Antwort zu geben, sondern das Problem zunächst zu analysieren und die eigene …

Weiterlesen …

Reflection 70B korrigiert eigene Fehler

Ein neues Open-Source-KI-Modell namens Reflection 70B wurde von Matt Shumer vorgestellt, Mitbegründer des KI-Startups HyperWrite. Wie Shumer auf der Plattform X bekannt gab, übertrifft das Modell in Benchmarks führende kommerzielle Systeme. Reflection 70B basiert auf Metas Llama 3.1-70B Instruct und nutzt eine neue Technik zur Selbstkorrektur von Fehlern: Das Modell kann seine eigenen Fehler erkennen …

Weiterlesen …

AnythingLLM: Chat mit Dokumenten

Eine neue KI-Anwendung namens AnythingLLM ermöglicht es Nutzern, mit beliebigen Dokumenten zu chatten. Die Software unterstützt verschiedene KI-Sprachmodelle und Vektordatenbanken. Laut der Entwickler können Nutzer damit eine private ChatGPT-ähnliche Anwendung erstellen, die lokal oder remote gehostet werden kann. AnythingLLM bietet Funktionen wie Multimodalität, Multi-User-Support und eingebettete Chat-Widgets. Die Anwendung ist in drei Hauptteile gegliedert: ein …

Weiterlesen …

Chinesische Modelle führen Topliste an

Die neue Rangliste der besten Sprachmodelle von Hugging Face zeigt: Chinesische Modelle sind unter den frei verfügbaren KIs aktuell führend. Alibabas Qwen-Modelle dominieren die Top-Plätze des Rankings, das auf anspruchsvolleren Tests basiert als sein Vorgänger. Bewertet werden Fähigkeiten wie Wissensabruf, Schlussfolgerungen aus langen Texten, komplexe Mathematik und das Befolgen von Anweisungen. 

Studie: „Open Weights“ ist nicht „Open Source“

Viele KI-Modelle, die Chatbots antreiben, werben mit „Open Source“, geben aber den Code und die Trainingsdaten nicht vollständig frei. Eine neue Studie zeigt, dass viele große Unternehmen ihre Modelle als „Open Weights“ bezeichnen, was bedeutet, dass Forscher sie zwar nutzen, aber nicht einsehen oder grundlegend anpassen können. Besonders hinderlich ist die fehlende Transparenz bei den Trainingsdaten. Kleine Firmen und …

Weiterlesen …

Bildgenerator Stable Diffusion 3 Medium läuft auch auf schwachen PCs

Stability AI hat mit Stable Diffusion 3 Medium eine kleinere Version seines Bildgenerierungsmodells veröffentlicht, die auf PCs mit nur 5 GB VRAM laufen kann. Das Modell bietet laut Stability AI eine vergleichbare Qualität wie die größere Version und könnte somit eine attraktive Option für Anwender mit begrenzten Ressourcen sein.

Microsoft Florence-2 ist spezialisiert auf Bildverarbeitung

Microsoft hat mit Florence-2 ein vielseitiges KI-Modell vorgestellt, das verschiedene Bildverarbeitungsaufgaben mit einem einzigen, einheitlichen Ansatz bewältigen kann. Das unter MIT-Lizenz verfügbare Modell übertrifft trotz seiner kompakten Größe offenbar größere Spezialmodelle in Bereichen wie Bildbeschriftung und Objekterkennung und könnte Unternehmen helfen, Investitionen in separate aufgabenspezifische Modelle einzusparen.

Stability AI veröffentlicht Stable Audio Open

Stability AI veröffentlicht mit „Stable Audio Open“ ein neues KI-Modell zur kostenlosen Erstellung von Sounds und Musikstücken mit bis 47 Sekunden Länge. Allerdings ist es aufgrund des Trainingsmaterials auf englischsprachige Beschreibungen und westliche Musikstile beschränkt.