OpenAI kündigt erstes Open-Source-Sprachmodell seit Jahren an

OpenAI plant in den kommenden Monaten sein erstes „offenes“ Sprachmodell seit GPT-2 zu veröffentlichen. Dies geht aus einem Feedback-Formular hervor, das das Unternehmen auf seiner Website veröffentlicht hat. Laut eines Berichts von Kyle Wiggers bittet OpenAI Entwickler, Forscher und Community-Mitglieder um Rückmeldungen zu dem neuen Modell. Das Unternehmen wird Entwickler-Events organisieren, beginnend in San Francisco … Weiterlesen …

Metas Llama-KI-Modelle erreichen 1 Milliarde Downloads

Die KI-Modelle Llama von Meta haben laut einer Ankündigung von CEO Mark Zuckerberg auf Threads 1 Milliarde Downloads erreicht. Dies entspricht einem Anstieg von 53% seit Dezember 2024, als 650 Millionen Downloads verzeichnet wurden, schreibt Kyle Wiggers. Die Modelle sind unter einer proprietären Lizenz verfügbar und stehen hinter Metas KI-Assistenten auf Facebook, Instagram und WhatsApp. … Weiterlesen …

Googles Gemma 3 läuft auf einer einzelnen GPU oder TPU

Google hat Gemma 3 angekündigt, seine neueste Sammlung von Open-Source-KI-Modellen. Sie wurden mit der gleichen Technologie entwickelt, die auch die Gemini 2.0-Modelle antreibt. Gemma 3 ist speziell dafür konzipiert, effizient auf einer einzelnen GPU oder TPU zu laufen, was es für Entwickler mit begrenzten Hardware-Ressourcen zugänglich macht. Die neue Modellfamilie kommt in vier Größen: 1B, … Weiterlesen …

Chinesischer KI-Agent Manus sorgt für Aufsehen und Skepsis

Manus, ein von dem chinesischen Startup Butterfly Effect entwickelter KI-Agent, hat für erhebliches Aufsehen in der Techwelt gesorgt. Als „erster allgemeiner KI-Agent“ beschrieben, der komplexe Aufgaben autonom ausführen kann, wird Manus von einigen als Chinas zweiter „DeepSeek-Moment“ gefeiert – eine Anspielung auf den früheren Durchbruch, als das chinesische KI-Modell DeepSeek R1 westliche Konkurrenten übertraf. Was … Weiterlesen …

Alibaba veröffentlicht QwQ-32B, ein leistungsstarkes Reasoning-Modell

Alibabas Qwen-Team hat QwQ-32B vorgestellt, ein neues Open-Source-Sprachmodell, das trotz deutlich geringerer Parameterzahl die Leistung viel größerer Modelle wie DeepSeek-R1 erreicht. Das unter der Apache 2.0-Lizenz veröffentlichte Modell mit 32 Milliarden Parametern nutzt Reinforcement Learning (RL), um seine Reasoning-Fähigkeiten für komplexe Problemlösungsaufgaben zu verbessern. Hauptmerkmale und Fähigkeiten QwQ-32B zeigt beeindruckende Leistungen bei mathematischem Denken, Programmierfähigkeiten … Weiterlesen …

Cohere stellt Aya Vision vor, ein mehrsprachiges Bildverarbeitungsmodell

Die Forschungsabteilung von Cohere hat Aya Vision eingeführt, ein Bildverarbeitungsmodell mit offenen Gewichten, das 23 Sprachen unterstützt. Laut VentureBeat-Bericht von Carl Franzen gibt es das Modell in Versionen mit 8 und 32 Milliarden Parametern. Es kann Bilder analysieren, Text generieren und visuelle Inhalte übersetzen. Aya Vision übertrifft größere Modelle wie Llama 90B bei geringerem Ressourcenbedarf. … Weiterlesen …

Alibaba veröffentlicht KI-Modell Wan 2.1 als Open Source

Der chinesische E-Commerce-Konzern Alibaba hat sein KI-Modell Wan 2.1 zur Generierung von Videos und Bildern als Open Source freigegeben. Vier Varianten des Modells sind nun weltweit über die Plattformen ModelScope und HuggingFace für akademische, Forschungs- und kommerzielle Zwecke verfügbar, wie Reuters berichtet. Die leistungsstärksten Versionen können bis zu 14 Milliarden Parameter verarbeiten und damit präzisere … Weiterlesen …

Sesame zeigt KI-Assistenten mit natürlicher Gesprächspräsenz

Sesame, ein Startup unter der Leitung des Oculus-Mitbegründers Brendan Iribe, hat einen neuen KI-Sprachassistenten namens Maya vorgestellt, der darauf abzielt, „das Uncanny Valley der Konversationssprache“ zu überwinden. Laut eines kürzlich erschienenen Artikels des Technologiejournalisten Sean Hollister bietet Maya natürlichere und ansprechendere Gespräche im Vergleich zu bestehenden Sprachassistenten wie Amazon’s Alexa oder Google’s Gemini. Das Unternehmen … Weiterlesen …

Microsoft zeigt effizientes Phi-4 für Text-, Bild- und Sprachverarbeitung

Microsoft hat zwei neue KI-Modelle in seiner Phi-Serie vorgestellt: Phi-4-multimodal mit 5,6 Milliarden Parametern und Phi-4-mini mit 3,8 Milliarden Parametern. Diese kleinen Sprachmodelle (SLMs) liefern außergewöhnliche Leistung bei deutlich geringerem Rechenaufwand als größere Systeme und stellen damit die Vorstellung in Frage, dass größere KI-Modelle immer besser sind. Das Phi-4-multimodal-Modell zeichnet sich durch seine Fähigkeit aus, … Weiterlesen …

Nous Research stellt KI-Modell mit zuschaltbarem Denkmodus vor

Nous Research hat ein neues KI-Sprachmodell namens DeepHermes-3 entwickelt, das zwischen ausführlichem Reasoning und schnellen Antworten wechseln kann. Das Modell basiert auf Metas Llama-Technologie und verfügt über 8 Milliarden Parameter, berichtet VentureBeat. Benutzer können einen speziellen Denkmodus aktivieren, der die Gedankenprozesse der KI vor der endgültigen Antwort offenlegt. Das System nutzt dabei „Chain of Thought“, … Weiterlesen …