Metas Llama 4-Modelle stoßen auf gemischte Resonanz

Meta hat seine neueste Generation von Künstliche-Intelligenz-Modellen, Llama 4, mit drei Varianten und verbesserten Fähigkeiten veröffentlicht. Es umfasst zwei sofort verfügbare Angebote – Llama 4 Scout und Llama 4 Maverick – während ein drittes Modell, Llama 4 Behemoth, noch in Entwicklung ist. Laut Meta markieren die Llama 4-Modelle „den Beginn einer neuen Ära“ für ihr … Weiterlesen …

Metas Llama-KI-Modelle erreichen 1 Milliarde Downloads

Die KI-Modelle Llama von Meta haben laut einer Ankündigung von CEO Mark Zuckerberg auf Threads 1 Milliarde Downloads erreicht. Dies entspricht einem Anstieg von 53% seit Dezember 2024, als 650 Millionen Downloads verzeichnet wurden, schreibt Kyle Wiggers. Die Modelle sind unter einer proprietären Lizenz verfügbar und stehen hinter Metas KI-Assistenten auf Facebook, Instagram und WhatsApp. … Weiterlesen …

Nvidia zeigt Llama Nemotron-Modelle für KI-Agenten und Reasoning

Auf der GPU Technology Conference (GTC) 2025 kündigte Nvidia eine neue Familie von KI-Modellen namens Llama Nemotron an, die entwickelt wurden, um die Reasoning-Fähigkeiten autonomer KI-Agenten zu verbessern. Diese Modelle basieren auf Metas Open-Source-Llama-Modellen, wurden jedoch durch Post-Training-Optimierungstechniken verfeinert, um ihre Leistung bei komplexen Aufgaben wie mehrstufiger Mathematik, Programmierung und Entscheidungsfindung zu verbessern. Die Llama … Weiterlesen …

Nous Research stellt KI-Modell mit zuschaltbarem Denkmodus vor

Nous Research hat ein neues KI-Sprachmodell namens DeepHermes-3 entwickelt, das zwischen ausführlichem Reasoning und schnellen Antworten wechseln kann. Das Modell basiert auf Metas Llama-Technologie und verfügt über 8 Milliarden Parameter, berichtet VentureBeat. Benutzer können einen speziellen Denkmodus aktivieren, der die Gedankenprozesse der KI vor der endgültigen Antwort offenlegt. Das System nutzt dabei „Chain of Thought“, … Weiterlesen …

DeepSeek veröffentlicht neue Reasoning-Modelle

Das chinesische KI-Unternehmen DeepSeek hat seine neuen Sprachmodelle DeepSeek-R1-Zero und DeepSeek-R1 sowie sechs kleinere destillierte Versionen vorgestellt. Die Hauptmodelle, die auf DeepSeeks V3-Architektur basieren, verfügen über insgesamt 671 Milliarden Parameter, von denen 37 Milliarden aktiv sind, und eine Kontextlänge von 128.000 Token. Laut Unternehmensangaben erreicht DeepSeek-R1 eine mit OpenAI-Modellen vergleichbare Leistung in den Bereichen Mathematik, … Weiterlesen …

LlamaV-o1 macht seine Denkprozesse nachvollziehbar

Wissenschaftler der Mohamed bin Zayed University of Artificial Intelligence haben ein neues KI-Modell entwickelt, das seine Schlussfolgerungen transparent macht. Wie Michael Nuñez in VentureBeat berichtet, vereint LlamaV-o1 die Analyse von Bildern und Text mit einer schrittweisen Erklärung seiner Denkprozesse. Das Modell überzeugt bei komplexen Aufgaben wie der Interpretation von Finanzdiagrammen und medizinischen Bildern. Es erreichte … Weiterlesen …

Metas KI-Modell mit GPT-4-Leistung läuft auf High-End Notebooks

Meta hat mit Llama 3.3 70B ein neues KI-Sprachmodell vorgestellt, das auf leistungsstarken Notebooks läuft und dabei eine Leistung auf GPT-4-Niveau erreicht. Das berichtet Simon Willison. Er testete das Modell erfolgreich auf einem MacBook Pro M2 mit 64 GB RAM und benötigt etwa 42 GB Speicherplatz für die Installation. In unabhängigen Tests durch LiveBench erreichte … Weiterlesen …

Meta nutzt OpenAIs GPT-4 in firmeninternem Programmierwerkzeug

Meta verwendet in seinem internen Programmierwerkzeug Metamate sowohl das GPT-4-Modell von OpenAI als auch das hauseigene Llama-KI-Modell. Dies berichtet Kali Hays im Wirtschaftsmagazin Fortune. Trotz der öffentlichen Lobpreisung der Llama-KI durch Meta-CEO Mark Zuckerberg nutzt das Unternehmen seit Anfang 2024 auch die Technologie des Konkurrenten. Aktuelle und ehemalige Meta-Mitarbeiter berichten unter Anonymität, dass Metamate je … Weiterlesen …

Meta setzt auf Open-Source-KI-Modell Llama als neue Unternehmensstrategie

Meta hat unter der Führung von Mark Zuckerberg eine grundlegende strategische Neuausrichtung vollzogen, die das Open-Source-KI-Modell Llama in den Mittelpunkt stellt. Wie Sharon Goldman in Fortune berichtet, erfolgte im Juli 2023 die Entscheidung, Llama 2 als Open-Source-Projekt zu veröffentlichen, trotz interner Bedenken bezüglich Monetarisierung und Sicherheit. Das KI-Modell wurde inzwischen über 600 Millionen Mal heruntergeladen … Weiterlesen …

Neue Entwicklerplattform AnyChat vereint führende KI-Sprachmodelle

Eine innovative Plattform namens AnyChat ermöglicht Entwicklern erstmals den gleichzeitigen Zugriff auf verschiedene KI-Sprachmodelle über eine einzige Schnittstelle. Der Entwickler Ahsen Khaliq hat das System so konzipiert, dass Nutzer problemlos zwischen Modellen wie ChatGPT, Google Gemini und Meta’s LLaMA wechseln können. Das berichtet Michael Nuñez für VentureBeat. Die Plattform unterstützt sowohl proprietäre als auch Open-Source-Modelle … Weiterlesen …