ChatGPTs neue Bildfunktion: Was macht diese Bild-KI so besonders?

ChatGPTs neuer Bildgenerator ist nicht nur ein Upgrade – er verändert grundlegend, wie KI Bilder erstellt. Das bedeutet: Exaktere Resultate, bessere Handhabung komplexer Szenen und lesbarer, verwendbarer Text im Bild selbst. Das ist ein erheblicher Fortschritt, wenn du im Bereich Design, Content-Erstellung, Marketing oder in einem anderen visuellen Bereich arbeitest. Während andere Bildgeneratoren ebenfalls große Fortschritte …

Weiterlesen …

ChatGPTs neuer Bildgenerator geht viral und überlastet Server

Der Start einer neuen Bildgenerationsfunktion in ChatGPT hat einen viralen Trend von Bildern im Studio-Ghibli-Stil ausgelöst, der die Server von OpenAI überlastet hat. Innerhalb von 24 Stunden nach Veröffentlichung der Funktion wurden soziale Medien mit KI-generierten Bildern überflutet, die den charakteristischen Stil des berühmten japanischen Animationsstudios nachahmen. Die neue Bildgenerationsfunktion, angetrieben vom GPT-4o-Modell von OpenAI, …

Weiterlesen …

Neuer Benchmark zeigt große Lücke zwischen menschlicher und KI-Denkfähigkeit

Die Arc Prize Foundation hat mit ARC-AGI-2 einen neuen Maßstab zur Messung künstlicher allgemeiner Intelligenz (artificial general intelligence, AGI) veröffentlicht, der sich für selbst die fortschrittlichsten KI-Systeme als äußerst schwierig erwiesen hat. Dieser Test der zweiten Generation bewertet gezielt die Denkfähigkeiten zur Testzeit: KI muss sich an neue, nie zuvor gesehene Aufgaben anpassen, anstatt sich …

Weiterlesen …

OpenAI bringt KI-Bildgenerierung auf ein neues Level

OpenAI hat native Bildgenerierungsfunktionen direkt in ChatGPT eingeführt, die vom multimodalen Modell GPT-4o angetrieben werden. Diese neue Funktion, „Images in ChatGPT“ genannt, steht jetzt Nutzern der Plus-, Pro-, Team- und kostenlosen Zugänge zur Verfügung. Optionen für Enterprise, Edu und über die API folgen in Kürze. Im Gegensatz zum bisherigen DALL-E 3-Bildgenerator, der ein separates Diffusionsmodell …

Weiterlesen …

Googles Gemini 2.5 Pro hat Reasoning-Funktionen integriert

Google hat Gemini 2.5 Pro veröffentlicht und beschreibt es als sein bisher „intelligentestes KI-Modell“. Das neue Modell stellt einen bedeutenden Fortschritt in Googles KI-Fähigkeiten dar, mit besonderem Fokus auf Reasoning-Funktionen, die jetzt direkt ins System integriert sind. Laut Googles Ankündigung sind Gemini 2.5-Modelle „denkende Modelle“, die in einem Zwischenschritt überlegen können, bevor sie antworten, was …

Weiterlesen …

Claude erhält Websuche-Funktion und Zugriff auf Echtzeit-Informationen

Anthropic hat offiziell eine Websuche-Funktion für seinen KI-Chatbot Claude eingeführt, über die der Assistenten nun auf Echtzeit-Informationen aus dem Internet zugreifen und diese verarbeiten kann. Die neue Funktion, die eine der am häufigsten gewünschten Features der Nutzer erfüllt, ist derzeit als Vorschau für zahlende Claude-Nutzer in den USA verfügbar. Eine Erweiterung auf kostenlose Nutzer und …

Weiterlesen …

US-Gericht: KI kann keine urheberrechtlich geschützten Werke verfassen

Ein US-Bundesberufungsgericht hat entschieden, dass ausschließlich von künstlicher Intelligenz erstellte Werke keinen Urheberrechtsschutz nach US-Recht erhalten können. Das Berufungsgericht für den District of Columbia Circuit bestätigte damit einstimmig die Entscheidung des US-Copyright Office, den Antrag des Informatikers Stephen Thaler abzulehnen, ein von seinem KI-System „Creativity Machine“ erschaffenes Kunstwerk zu registrieren. Richterin Patricia Millett schrieb in …

Weiterlesen …

Google führt native Bilderzeugung in Gemini 2.0 Flash ein

Google hat einen in Gemini 2.0 Flash integrierten KI-Bildgenerator bekannt gegeben, die jetzt für Entwickler über Google AI Studio und die Gemini API verfügbar sind. Google ist damit das erste große US-Technologieunternehmen, das eine solche multimodale Bilderzeugung direkt in einem Modell für Endverbraucher integriert hat. Im Gegensatz zu früheren Ansätzen, bei denen Sprachmodelle mit separaten …

Weiterlesen …

Statistik zeigt beliebteste KI-Modelle für Text, Bild, Video

Die KI-Plattform Poe hat einen Trendbericht für das Frühjahr 2025 veröffentlicht, der bedeutende Veränderungen in den Nutzerpräferenzen bei KI-Modellen aufzeigt. Bei der Texterstellung dominieren OpenAI und Anthropic mit zusammen rund 85% der Nachrichten, wobei seit der Einführung von Claude 3.5 Sonnet im Juni 2024 beide Anbieter bei Poe-Abonnenten nahezu gleichauf liegen. Im Bereich der Bildgenerierung …

Weiterlesen …

OpenAI veröffentlicht Entwicklertools für KI-Agenten

OpenAI hat eine neue Reihe von Tools veröffentlicht, mit der Entwickler KI-Agenten ähnlich den firmeneigenen Diensten Deep Research und Operator erstellen können. Die neuen Angebote umfassen die Responses API und das Open-Source Agents SDK. Damit lassen sich KI-Anwendungen erstellen, die im Web suchen, Dateien analysieren und sogar Computeroberflächen steuern können. Responses API Die Responses API …

Weiterlesen …