Google Deepminds Genie 3 erzeugt interaktive Welten

Google Deepmind hat Genie 3 angekündigt, ein neues KI-„World Model“. Es kann aus Text-Prompts interaktive, dreidimensionale Umgebungen erzeugen. Laut der offiziellen Mitteilung des Unternehmens können Nutzer in diesen dynamischen Welten in Echtzeit navigieren. Das Modell generiert die Umgebungen mit einer Auflösung von 720p und läuft mit 24 Bildern pro Sekunde (fps). Google Deepmind gibt an, …

Weiterlesen …

Anthropic zeigt neues Highend-Modell Claude Opus 4.1

Anthropic hat Claude Opus 4.1 vorgestellt, eine aktualisierte Version seines führenden KI-Modells. Das Unternehmen gibt an, dass das neue Modell seinen Vorgänger bei Aufgaben übertrifft, die Reasoning, Recherche und insbesondere Programmieren erfordern. Die Veröffentlichung erfolgt inmitten von Berichten über intensiven Wettbewerb auf dem KI-Markt und Analysen der Geschäftsstrategie von Anthropic. Leistung und Marktposition Laut der …

Weiterlesen …

Neue KI-Modelle von Deep Cogito sollen eigenes Denken verbessern

Das KI-Startup Deep Cogito hat vier neue Open-Source-Sprachmodelle veröffentlicht. Die Modelle sollen laut dem Unternehmen die Fähigkeit besitzen, ihre eigenen Denkprozesse mit der Zeit selbstständig zu verbessern. Darüber berichtet Carl Franzen in einem Artikel für VentureBeat. Die Modelle der Familie Cogito v2 nutzen ein besonderes Trainingsverfahren. Dabei analysieren sie ihre eigenen Lösungswege. Erfolgreiche Denkmuster werden …

Weiterlesen …

Manus setzt mit „Wide Research“ auf über 100 parallele KI-Agenten

Das KI-Start-up Manus aus Singapur hat die experimentelle Funktion „Wide Research“ gestartet. Sie nutzt über 100 KI-Agenten, die parallel an einer einzigen, umfassenden Aufgabe arbeiten. Laut einem Artikel von Carl Franzen für VentureBeat verfolgt Manus damit einen anderen Weg als die Konkurrenz. Anbieter wie OpenAI oder Google setzen oft auf „Deep Research“, bei der ein …

Weiterlesen …

Chinesisches Startup Z.ai stellt Open-Source-KI vor, die PowerPoints erstellt

Das chinesische KI-Startup Z.ai hat seine neue Modellfamilie GLM-4.5 als leistungsstarke Open-Source-Software veröffentlicht. Laut einem Artikel von Carl Franzen können die Modelle aus einer einzigen Anweisung vollständige PowerPoint-Präsentationen erstellen. Die Familie umfasst das Flaggschiff-Modell GLM-4.5 und eine leichtere Version namens GLM-4.5-Air. Beide sind für komplexe Aufgaben wie logisches Denken und Programmieren ausgelegt. Z.ai gibt an, …

Weiterlesen …

ElevenLabs startet Musikgenerator mit lizenzierten Daten

Das auf KI-Stimmen spezialisierte Unternehmen ElevenLabs hat einen Dienst zur Musikerzeugung namens Eleven Music veröffentlicht. Laut einem Artikel von Belle Lin im Wall Street Journal trainiert das Unternehmen sein KI-Modell mit lizenzierter Musik, um rechtliche Konflikte zu vermeiden. Nutzer können per Texteingabe in wenigen Minuten einen kompletten Song mit Gesang und Instrumenten erstellen lassen. Laut …

Weiterlesen …

Alibabas neues Open-Source-KI-Modell will Text in Bildern meistern

Das Qwen-Team von Alibaba hat mit Qwen-Image einen neuen KI-Bildgenerator veröffentlicht. Nach Angaben der Entwickler ist das Modell darauf spezialisiert, Bilder mit präzisem Text in englischer und chinesischer Sprache zu erzeugen. Dies ist eine bekannte Schwachstelle vieler KI-Systeme. Der Journalist Carl Franzen schreibt für VentureBeat, dass sich damit Inhalte wie Plakate, Präsentationen oder Ladenbeschriftungen mit …

Weiterlesen …

OpenAI veröffentlicht erste Open-Weight-Modelle seit GPT-2

OpenAI hat die Veröffentlichung von zwei neuen Open-Weight-Sprachmodellen angekündigt: gpt-oss-120b und gpt-oss-20b. Dies ist die erste Veröffentlichung von Open-Weight-Modellen des Unternehmens seit über fünf Jahren, seit GPT-2 im Jahr 2019, und markiert einen bedeutenden strategischen Wandel für die Organisation, die sich zuletzt auf proprietäre Systeme wie GPT-4o und ChatGPT konzentriert hat. Die Modelle, ihre Gewichte …

Weiterlesen …

Krea AI veröffentlicht offenes Modell gegen den generischen „KI-Look“

Krea AI hat eine Open-Source-Version seines Bildmodells veröffentlicht. Sie soll Bilder mit einer unverwechselbaren Ästhetik erzeugen und den typischen Look von KI-generierten Inhalten vermeiden. In ihrem Beitrag erläuterten die Autoren Sangwu Lee und Erwann Millon die Philosophie und den Prozess hinter ihrem neuen Modell FLUX.1 Krea. Das Modell wurde in Zusammenarbeit mit Black Forest Labs …

Weiterlesen …

Google erweitert KI-Modus um Videosuche und Dokumentenanalyse

Google stattet seinen KI-Modus in der Suche mit vier wesentlichen neuen Funktionen aus. Dies berichtet Abner Li von 9to5google. Die Neuerungen sollen die Suche interaktiver und kontextbezogener machen. Nutzer können demnächst auf dem Desktop PDFs und Bilder hochladen, um detaillierte Fragen zu deren Inhalt zu stellen. Eine neue Funktion namens „Canvas“ ermöglicht es, in einer …

Weiterlesen …

×