Alibabas neues Open-Source-KI-Modell will Text in Bildern meistern

Das Qwen-Team von Alibaba hat mit Qwen-Image einen neuen KI-Bildgenerator veröffentlicht. Nach Angaben der Entwickler ist das Modell darauf spezialisiert, Bilder mit präzisem Text in englischer und chinesischer Sprache zu erzeugen. Dies ist eine bekannte Schwachstelle vieler KI-Systeme. Der Journalist Carl Franzen schreibt für VentureBeat, dass sich damit Inhalte wie Plakate, Präsentationen oder Ladenbeschriftungen mit …

Weiterlesen …

OpenAI veröffentlicht erste Open-Weight-Modelle seit GPT-2

OpenAI hat die Veröffentlichung von zwei neuen Open-Weight-Sprachmodellen angekündigt: gpt-oss-120b und gpt-oss-20b. Dies ist die erste Veröffentlichung von Open-Weight-Modellen des Unternehmens seit über fünf Jahren, seit GPT-2 im Jahr 2019, und markiert einen bedeutenden strategischen Wandel für die Organisation, die sich zuletzt auf proprietäre Systeme wie GPT-4o und ChatGPT konzentriert hat. Die Modelle, ihre Gewichte …

Weiterlesen …

Krea AI veröffentlicht offenes Modell gegen den generischen „KI-Look“

Krea AI hat eine Open-Source-Version seines Bildmodells veröffentlicht. Sie soll Bilder mit einer unverwechselbaren Ästhetik erzeugen und den typischen Look von KI-generierten Inhalten vermeiden. In ihrem Beitrag erläuterten die Autoren Sangwu Lee und Erwann Millon die Philosophie und den Prozess hinter ihrem neuen Modell FLUX.1 Krea. Das Modell wurde in Zusammenarbeit mit Black Forest Labs …

Weiterlesen …

Proton stellt datenschutzorientierten KI-Chatbot Lumo vor

Proton hat einen neuen KI-Assistenten namens Lumo veröffentlicht, der den Schutz der Privatsphäre in den Mittelpunkt stellt. Der Chatbot kann Dokumente zusammenfassen, E-Mails schreiben und Code generieren. Die Daten speichert er lokal auf dem Gerät des Nutzers. Laut einem Artikel von Emma Roth für The Verge nutzt Proton eine „Zero-Access“-Verschlüsselung. Dabei erhält nur der Nutzer …

Weiterlesen …

Mistral veröffentlicht Voxtral, sein erstes Open-Source-KI-Audiomodell

Das französische KI-Unternehmen Mistral hat Voxtral veröffentlicht, seine erste Familie von Open-Source-KI-Modellen für die Audioverarbeitung. Das Unternehmen positioniert Voxtral als Lösung für Entwickler, die bisher zwischen unzuverlässigen Open-Source-Systemen und teuren, geschlossenen Modellen wählen mussten. Mistral gibt an, dass Voxtral hohe Leistung zu „weniger als der Hälfte des Preises“ vergleichbarer Lösungen bietet. Voxtral geht über die …

Weiterlesen …

Chinesisches Startup fordert OpenAI mit Open-Source-Modell Kimi K2 heraus

Das chinesische KI-Unternehmen Moonshot AI hat mit Kimi K2 ein neues Open-Source-Sprachmodell veröffentlicht, das in direkten Wettbewerb mit Systemen von OpenAI und Anthropic treten soll. Michael Nuñez berichtet in einem Artikel für VentureBeat, dass das Modell besonders leistungsstark bei Programmieraufgaben und der autonomen Erledigung von Aufträgen ist. Laut Angaben des Unternehmens übertrifft Kimi K2 führende …

Weiterlesen …

Schweizer Forscher kündigen neues Open-Source-KI-Modell an

Ein Konsortium aus Schweizer Forschungsinstitutionen wird im Spätsommer 2025 ein neues großes Sprachmodell der Öffentlichkeit zur Verfügung stellen. Laut einer Mitteilung der ETH Zürich der Autoren Florian Meyer und Mélissa Anchisi wurde das Modell von Forschenden der EPFL, der ETH Zürich und des Nationalen Hochleistungsrechenzentrums der Schweiz (CSCS) entwickelt. Es soll eine offene und transparente …

Weiterlesen …

Startup veröffentlicht BrowserOS als datenschutzfreundlichen KI-Browser

Ein von Y Combinator unterstütztes Startup hat BrowserOS veröffentlicht. Dabei handelt es sich um einen Open-Source-Browser, der KI-Agenten zur Automatisierung von Aufgaben integriert. In einem Beitrag auf Hacker News begründete das zweiköpfige Team den Schritt mit dem wachsenden Bedarf an einer vertrauenswürdigen Alternative, da KI-Agenten auf sensible Nutzerdaten zugreifen werden. Laut der Entwickler führt BrowserOS …

Weiterlesen …

OpenAIs neues Open-Weights-Modell steht kurz vor dem Launch

OpenAI steht Berichten zufolge kurz davor, ein neues KI-Sprachmodell als Open-Weights-Version zu veröffentlichen. Ein möglicher Starttermin ist bereits die kommende Woche. Dies berichtet Tom Warren für The Verge und beruft sich dabei auf Quellen, die mit den Plänen von OpenAI vertraut sind. Es wäre das erste Open-Weights-Modell des Unternehmens seit der Veröffentlichung von GPT-2 im …

Weiterlesen …

Hugging Face veröffentlicht kleines Sprachmodell mit vollständiger Bauanleitung

Hugging Face hat mit SmolLM3 ein neues kleines Sprachmodell veröffentlicht. Laut der offiziellen Ankündigung des Unternehmens ist das 3-Milliarden-Parameter-Modell besonders leistungsstark und effizient. Eine Besonderheit ist der duale Modus: Das Modell kann entweder direkt antworten oder seinen Denkprozess transparent aufzeigen. Es verarbeitet zudem lange Texte mit bis zu 128.000 Tokens und unterstützt sechs europäische Sprachen. …

Weiterlesen …