Manus setzt mit „Wide Research“ auf über 100 parallele KI-Agenten

Das KI-Start-up Manus aus Singapur hat die experimentelle Funktion „Wide Research“ gestartet. Sie nutzt über 100 KI-Agenten, die parallel an einer einzigen, umfassenden Aufgabe arbeiten. Laut einem Artikel von Carl Franzen für VentureBeat verfolgt Manus damit einen anderen Weg als die Konkurrenz. Anbieter wie OpenAI oder Google setzen oft auf „Deep Research“, bei der ein …

Weiterlesen …

Chinesisches Startup Z.ai stellt Open-Source-KI vor, die PowerPoints erstellt

Das chinesische KI-Startup Z.ai hat seine neue Modellfamilie GLM-4.5 als leistungsstarke Open-Source-Software veröffentlicht. Laut einem Artikel von Carl Franzen können die Modelle aus einer einzigen Anweisung vollständige PowerPoint-Präsentationen erstellen. Die Familie umfasst das Flaggschiff-Modell GLM-4.5 und eine leichtere Version namens GLM-4.5-Air. Beide sind für komplexe Aufgaben wie logisches Denken und Programmieren ausgelegt. Z.ai gibt an, …

Weiterlesen …

ElevenLabs startet Musikgenerator mit lizenzierten Daten

Das auf KI-Stimmen spezialisierte Unternehmen ElevenLabs hat einen Dienst zur Musikerzeugung namens Eleven Music veröffentlicht. Laut einem Artikel von Belle Lin im Wall Street Journal trainiert das Unternehmen sein KI-Modell mit lizenzierter Musik, um rechtliche Konflikte zu vermeiden. Nutzer können per Texteingabe in wenigen Minuten einen kompletten Song mit Gesang und Instrumenten erstellen lassen. Laut …

Weiterlesen …

Alibabas neues Open-Source-KI-Modell will Text in Bildern meistern

Das Qwen-Team von Alibaba hat mit Qwen-Image einen neuen KI-Bildgenerator veröffentlicht. Nach Angaben der Entwickler ist das Modell darauf spezialisiert, Bilder mit präzisem Text in englischer und chinesischer Sprache zu erzeugen. Dies ist eine bekannte Schwachstelle vieler KI-Systeme. Der Journalist Carl Franzen schreibt für VentureBeat, dass sich damit Inhalte wie Plakate, Präsentationen oder Ladenbeschriftungen mit …

Weiterlesen …

OpenAI veröffentlicht erste Open-Weight-Modelle seit GPT-2

OpenAI hat die Veröffentlichung von zwei neuen Open-Weight-Sprachmodellen angekündigt: gpt-oss-120b und gpt-oss-20b. Dies ist die erste Veröffentlichung von Open-Weight-Modellen des Unternehmens seit über fünf Jahren, seit GPT-2 im Jahr 2019, und markiert einen bedeutenden strategischen Wandel für die Organisation, die sich zuletzt auf proprietäre Systeme wie GPT-4o und ChatGPT konzentriert hat. Die Modelle, ihre Gewichte …

Weiterlesen …

Krea AI veröffentlicht offenes Modell gegen den generischen „KI-Look“

Krea AI hat eine Open-Source-Version seines Bildmodells veröffentlicht. Sie soll Bilder mit einer unverwechselbaren Ästhetik erzeugen und den typischen Look von KI-generierten Inhalten vermeiden. In ihrem Beitrag erläuterten die Autoren Sangwu Lee und Erwann Millon die Philosophie und den Prozess hinter ihrem neuen Modell FLUX.1 Krea. Das Modell wurde in Zusammenarbeit mit Black Forest Labs …

Weiterlesen …

Google erweitert KI-Modus um Videosuche und Dokumentenanalyse

Google stattet seinen KI-Modus in der Suche mit vier wesentlichen neuen Funktionen aus. Dies berichtet Abner Li von 9to5google. Die Neuerungen sollen die Suche interaktiver und kontextbezogener machen. Nutzer können demnächst auf dem Desktop PDFs und Bilder hochladen, um detaillierte Fragen zu deren Inhalt zu stellen. Eine neue Funktion namens „Canvas“ ermöglicht es, in einer …

Weiterlesen …

Photoshop kann Objekte nun automatisch in Fotos integrieren

Adobe führt neue KI-Funktionen für Photoshop ein, darunter das Werkzeug „Harmonize“. Laut einem Artikel von The Verge passt es Farbe, Beleuchtung und Schatten neuer Elemente nahtlos an ein bestehendes Bild an. Das Update enthält zudem ein KI-Werkzeug zum Hochskalieren von Bildern und eine verbesserte Funktion zum Entfernen von Objekten. Adobe gibt an, dass die neuen …

Weiterlesen …

Google veröffentlicht Gemini 2.5 Deep Think

Google hat Gemini 2.5 Deep Think eingeführt, ein neues KI-Modell für komplexe Problemlösungen. Das Modell ist ab sofort für Abonnenten des Google-AI-Ultra-Tarifs verfügbar. Das Unternehmen erklärt, dass das Modell eine Technik namens „Parallel Thinking“ nutzt. Dieser Ansatz ermöglicht es der KI, viele verschiedene Ideen oder Lösungswege gleichzeitig zu entwickeln und abzuwägen, bevor sie eine endgültige …

Weiterlesen …

Proton stellt datenschutzorientierten KI-Chatbot Lumo vor

Proton hat einen neuen KI-Assistenten namens Lumo veröffentlicht, der den Schutz der Privatsphäre in den Mittelpunkt stellt. Der Chatbot kann Dokumente zusammenfassen, E-Mails schreiben und Code generieren. Die Daten speichert er lokal auf dem Gerät des Nutzers. Laut einem Artikel von Emma Roth für The Verge nutzt Proton eine „Zero-Access“-Verschlüsselung. Dabei erhält nur der Nutzer …

Weiterlesen …