Ehemalige OpenAI-Forscher veröffentlichen ihr erstes Tool

Das Start-up Thinking Machines Lab hat sein erstes Produkt vorgestellt. Es heißt Tinker und soll die Erstellung von spezialisierten KI-Modellen vereinfachen. Das berichtet Will Knight für das Magazin Wired. Das Unternehmen wurde von bekannten ehemaligen Forschern von OpenAI gegründet, darunter CEO Mira Murati. Tinker automatisiert das sogenannte Fine-Tuning von leistungsstarken Open-Source-Modellen. Damit können Entwickler und …

Weiterlesen …

Meta-Chef Mark Zuckerberg verstärkt KI-Bemühungen drastisch

Mark Zuckerberg hat eine aggressive Kampagne gestartet, um bei künstlicher Intelligenz aufzuholen, nachdem Metas KI-Produkte bei einer Firmenkonferenz im April enttäuschten. Der Facebook-Mutterkonzern gibt nun Milliarden aus und bietet beispiellose Gehaltspakete, um mit OpenAI und Google bei der Entwicklung von „Superintelligenz“ zu konkurrieren. Laut Berichten von Mike Isaac und Cade Metz in der New York …

Weiterlesen …

KI-Zusammenfassungen: Claude schlägt ChatGPT in Test, aber kein Tool erreicht mehr als 70%

Eine neue Studie zeigt erhebliche Unterschiede bei der Textanalyse verschiedener KI-Chatbots. Geoffrey A. Fowler von der Washington Post testete fünf große KI-Tools auf ihr Verständnis von Literatur, Rechtsdokumenten, wissenschaftlichen Arbeiten und politischen Reden. Der Wettbewerb umfasste ChatGPT, Claude, Copilot, Meta AI Llama und Gemini. Die Systeme beantworteten 115 Fragen zu vier verschiedenen Dokumenttypen. Fachexperten bewerteten …

Weiterlesen …

Meta startet eigenständige KI-App mit sozialen Funktionen

Meta hat eine neue eigenständige Meta AI App veröffentlicht, die auf der Llama 4 Modellfamilie basiert. Die App bietet personalisierte KI-Interaktionen durch Sprach- und Textgespräche, Bildgenerierung und Websuche. Verfügbar für iOS und Android in ausgewählten Ländern, steht die App für Metas Vision, KI persönlicher zu gestalten und stärker in den Alltag zu integrieren. Ein besonderes …

Weiterlesen …

Metas Llama 4-Modelle stoßen auf gemischte Resonanz

Meta hat seine neueste Generation von Künstliche-Intelligenz-Modellen, Llama 4, mit drei Varianten und verbesserten Fähigkeiten veröffentlicht. Es umfasst zwei sofort verfügbare Angebote – Llama 4 Scout und Llama 4 Maverick – während ein drittes Modell, Llama 4 Behemoth, noch in Entwicklung ist. Laut Meta markieren die Llama 4-Modelle „den Beginn einer neuen Ära“ für ihr …

Weiterlesen …

Metas Llama-KI-Modelle erreichen 1 Milliarde Downloads

Die KI-Modelle Llama von Meta haben laut einer Ankündigung von CEO Mark Zuckerberg auf Threads 1 Milliarde Downloads erreicht. Dies entspricht einem Anstieg von 53% seit Dezember 2024, als 650 Millionen Downloads verzeichnet wurden, schreibt Kyle Wiggers. Die Modelle sind unter einer proprietären Lizenz verfügbar und stehen hinter Metas KI-Assistenten auf Facebook, Instagram und WhatsApp. …

Weiterlesen …

Nvidia zeigt Llama Nemotron-Modelle für KI-Agenten und Reasoning

Auf der GPU Technology Conference (GTC) 2025 kündigte Nvidia eine neue Familie von KI-Modellen namens Llama Nemotron an, die entwickelt wurden, um die Reasoning-Fähigkeiten autonomer KI-Agenten zu verbessern. Diese Modelle basieren auf Metas Open-Source-Llama-Modellen, wurden jedoch durch Post-Training-Optimierungstechniken verfeinert, um ihre Leistung bei komplexen Aufgaben wie mehrstufiger Mathematik, Programmierung und Entscheidungsfindung zu verbessern. Die Llama …

Weiterlesen …

Nous Research stellt KI-Modell mit zuschaltbarem Denkmodus vor

Nous Research hat ein neues KI-Sprachmodell namens DeepHermes-3 entwickelt, das zwischen ausführlichem Reasoning und schnellen Antworten wechseln kann. Das Modell basiert auf Metas Llama-Technologie und verfügt über 8 Milliarden Parameter, berichtet VentureBeat. Benutzer können einen speziellen Denkmodus aktivieren, der die Gedankenprozesse der KI vor der endgültigen Antwort offenlegt. Das System nutzt dabei „Chain of Thought“, …

Weiterlesen …

DeepSeek veröffentlicht neue Reasoning-Modelle

Das chinesische KI-Unternehmen DeepSeek hat seine neuen Sprachmodelle DeepSeek-R1-Zero und DeepSeek-R1 sowie sechs kleinere destillierte Versionen vorgestellt. Die Hauptmodelle, die auf DeepSeeks V3-Architektur basieren, verfügen über insgesamt 671 Milliarden Parameter, von denen 37 Milliarden aktiv sind, und eine Kontextlänge von 128.000 Token. Laut Unternehmensangaben erreicht DeepSeek-R1 eine mit OpenAI-Modellen vergleichbare Leistung in den Bereichen Mathematik, …

Weiterlesen …

LlamaV-o1 macht seine Denkprozesse nachvollziehbar

Wissenschaftler der Mohamed bin Zayed University of Artificial Intelligence haben ein neues KI-Modell entwickelt, das seine Schlussfolgerungen transparent macht. Wie Michael Nuñez in VentureBeat berichtet, vereint LlamaV-o1 die Analyse von Bildern und Text mit einer schrittweisen Erklärung seiner Denkprozesse. Das Modell überzeugt bei komplexen Aufgaben wie der Interpretation von Finanzdiagrammen und medizinischen Bildern. Es erreichte …

Weiterlesen …