Alibabas neues Open-Source-KI-Modell will Text in Bildern meistern

Das Qwen-Team von Alibaba hat mit Qwen-Image einen neuen KI-Bildgenerator veröffentlicht. Nach Angaben der Entwickler ist das Modell darauf spezialisiert, Bilder mit präzisem Text in englischer und chinesischer Sprache zu erzeugen. Dies ist eine bekannte Schwachstelle vieler KI-Systeme. Der Journalist Carl Franzen schreibt für VentureBeat, dass sich damit Inhalte wie Plakate, Präsentationen oder Ladenbeschriftungen mit …

Weiterlesen …

OpenAI veröffentlicht erste Open-Weight-Modelle seit GPT-2

OpenAI hat die Veröffentlichung von zwei neuen Open-Weight-Sprachmodellen angekündigt: gpt-oss-120b und gpt-oss-20b. Dies ist die erste Veröffentlichung von Open-Weight-Modellen des Unternehmens seit über fünf Jahren, seit GPT-2 im Jahr 2019, und markiert einen bedeutenden strategischen Wandel für die Organisation, die sich zuletzt auf proprietäre Systeme wie GPT-4o und ChatGPT konzentriert hat. Die Modelle, ihre Gewichte …

Weiterlesen …

Krea AI veröffentlicht offenes Modell gegen den generischen „KI-Look“

Krea AI hat eine Open-Source-Version seines Bildmodells veröffentlicht. Sie soll Bilder mit einer unverwechselbaren Ästhetik erzeugen und den typischen Look von KI-generierten Inhalten vermeiden. In ihrem Beitrag erläuterten die Autoren Sangwu Lee und Erwann Millon die Philosophie und den Prozess hinter ihrem neuen Modell FLUX.1 Krea. Das Modell wurde in Zusammenarbeit mit Black Forest Labs …

Weiterlesen …

Google erweitert KI-Modus um Videosuche und Dokumentenanalyse

Google stattet seinen KI-Modus in der Suche mit vier wesentlichen neuen Funktionen aus. Dies berichtet Abner Li von 9to5google. Die Neuerungen sollen die Suche interaktiver und kontextbezogener machen. Nutzer können demnächst auf dem Desktop PDFs und Bilder hochladen, um detaillierte Fragen zu deren Inhalt zu stellen. Eine neue Funktion namens „Canvas“ ermöglicht es, in einer …

Weiterlesen …

Photoshop kann Objekte nun automatisch in Fotos integrieren

Adobe führt neue KI-Funktionen für Photoshop ein, darunter das Werkzeug „Harmonize“. Laut einem Artikel von The Verge passt es Farbe, Beleuchtung und Schatten neuer Elemente nahtlos an ein bestehendes Bild an. Das Update enthält zudem ein KI-Werkzeug zum Hochskalieren von Bildern und eine verbesserte Funktion zum Entfernen von Objekten. Adobe gibt an, dass die neuen …

Weiterlesen …

Google veröffentlicht Gemini 2.5 Deep Think

Google hat Gemini 2.5 Deep Think eingeführt, ein neues KI-Modell für komplexe Problemlösungen. Das Modell ist ab sofort für Abonnenten des Google-AI-Ultra-Tarifs verfügbar. Das Unternehmen erklärt, dass das Modell eine Technik namens „Parallel Thinking“ nutzt. Dieser Ansatz ermöglicht es der KI, viele verschiedene Ideen oder Lösungswege gleichzeitig zu entwickeln und abzuwägen, bevor sie eine endgültige …

Weiterlesen …

Proton stellt datenschutzorientierten KI-Chatbot Lumo vor

Proton hat einen neuen KI-Assistenten namens Lumo veröffentlicht, der den Schutz der Privatsphäre in den Mittelpunkt stellt. Der Chatbot kann Dokumente zusammenfassen, E-Mails schreiben und Code generieren. Die Daten speichert er lokal auf dem Gerät des Nutzers. Laut einem Artikel von Emma Roth für The Verge nutzt Proton eine „Zero-Access“-Verschlüsselung. Dabei erhält nur der Nutzer …

Weiterlesen …

OpenAI plant angeblich GPT-5-Start im August mit neuen Reasoning-Fähigkeiten

Mehreren Berichten zufolge bereitet OpenAI die Einführung seines KI-Modells der nächsten Generation, GPT-5, für Anfang August 2025 vor. Das Unternehmen hat zwar noch kein offizielles Datum bestätigt, doch CEO Sam Altman erklärte öffentlich, dass das neue Modell „bald kommt“ und deutete dessen erweiterte Fähigkeiten an. Eine wesentliche Änderung bei GPT-5 betrifft die Architektur. Das Modell …

Weiterlesen …

YouTube führt neue KI-Werkzeuge für Shorts ein

YouTube hat neue generative KI-Funktionen für seine Kurzvideo-Plattform Shorts angekündigt. Laut dem Unternehmen sollen diese Werkzeuge das Erstellen von Inhalten für Nutzer einfacher und kreativer machen. Die neuen Funktionen sind über einen zentralen Bereich namens „AI playground“ zugänglich. Die Ankündigung hebt zwei wesentliche Neuerungen hervor: Diese Funktionen basieren auf Googles Videogenerierungsmodell Veo 2. Um Transparenz …

Weiterlesen …

AMD bringt KI-Bildgenerator für den lokalen Betrieb auf Laptops heraus

AMD hat in Zusammenarbeit mit Stability AI eine neue Version des Bildgenerators Stable Diffusion 3.0 Medium veröffentlicht. Dies berichtet Anton Shilov in einem Artikel auf Tom’s Hardware. Das Modell ist darauf ausgelegt, lokal auf Laptops mit den neuesten Ryzen-AI-Prozessoren von AMD zu laufen. Es ermöglicht Nutzern, hochauflösende Bilder aus Textbefehlen ohne Internetverbindung zu erstellen. Die …

Weiterlesen …