ChatGPTs neue Bildfunktion: Was macht diese Bild-KI so besonders?

ChatGPTs neuer Bildgenerator ist nicht nur ein Upgrade – er verändert grundlegend, wie KI Bilder erstellt. Das bedeutet: Exaktere Resultate, bessere Handhabung komplexer Szenen und lesbarer, verwendbarer Text im Bild selbst. Das ist ein erheblicher Fortschritt, wenn du im Bereich Design, Content-Erstellung, Marketing oder in einem anderen visuellen Bereich arbeitest. Während andere Bildgeneratoren ebenfalls große Fortschritte … Weiterlesen …

OpenAI bringt KI-Bildgenerierung auf ein neues Level

OpenAI hat native Bildgenerierungsfunktionen direkt in ChatGPT eingeführt, die vom multimodalen Modell GPT-4o angetrieben werden. Diese neue Funktion, „Images in ChatGPT“ genannt, steht jetzt Nutzern der Plus-, Pro-, Team- und kostenlosen Zugänge zur Verfügung. Optionen für Enterprise, Edu und über die API folgen in Kürze. Im Gegensatz zum bisherigen DALL-E 3-Bildgenerator, der ein separates Diffusionsmodell … Weiterlesen …

Reve Image 1.0 ist ein vielversprechender neuer KI-Bildgenerator

Reve AI hat Reve Image 1.0 veröffentlicht, ein neues Text-zu-Bild-Modell, das laut des unabhängigen Bewertungsdienstes Artificial Analysis derzeit auf Platz eins im Bereich Bildqualität rangiert. Wie Carl Franzen in VentureBeat berichtet, übertrifft das Modell Konkurrenten wie Midjourney v6.1 und Googles Imagen 3 besonders bei der Einhaltung von Eingabeaufforderungen, Ästhetik und Typografie. Das in Palo Alto … Weiterlesen …

Stable Virtual Camera verwandelt 2D-Bilder in Videos

Stability AI hat Stable Virtual Camera vorgestellt, ein neues KI-Modell zur Umwandlung von 2D-Bildern in Videos. Wie Ana Guillen im offiziellen Post berichtet, ermöglicht die Forschungsvorschau immersive Videos mit realistischer Tiefe und Perspektive ohne komplexe Rekonstruktionsverfahren. Das System kann aus einem einzelnen oder bis zu 32 Bildern Videos generieren und folgt dabei benutzerdefinierten Kamerapfaden oder … Weiterlesen …

Googles Gemini erlaubt Nutzern, Wasserzeichen in Bildern zu entfernen

Nutzer haben entdeckt, dass Googles KI-Modell Gemini 2.0 Flash Wasserzeichen von Bildern entfernen kann, auch von Getty Images und anderen Bildagenturen. Kyle Wiggers berichtet für TechCrunch, dass diese umstrittene Funktion in vielen Social-Media-Post vorgeführt wird. Im Gegensatz zu Konkurrenzmodellen wie Anthropics Claude 3.7 Sonnet und OpenAIs GPT-4o, die solche Anfragen ablehnen, scheint Gemini weniger Einschränkungen … Weiterlesen …

Google führt native Bilderzeugung in Gemini 2.0 Flash ein

Google hat einen in Gemini 2.0 Flash integrierten KI-Bildgenerator bekannt gegeben, die jetzt für Entwickler über Google AI Studio und die Gemini API verfügbar sind. Google ist damit das erste große US-Technologieunternehmen, das eine solche multimodale Bilderzeugung direkt in einem Modell für Endverbraucher integriert hat. Im Gegensatz zu früheren Ansätzen, bei denen Sprachmodelle mit separaten … Weiterlesen …

Statistik zeigt beliebteste KI-Modelle für Text, Bild, Video

Die KI-Plattform Poe hat einen Trendbericht für das Frühjahr 2025 veröffentlicht, der bedeutende Veränderungen in den Nutzerpräferenzen bei KI-Modellen aufzeigt. Bei der Texterstellung dominieren OpenAI und Anthropic mit zusammen rund 85% der Nachrichten, wobei seit der Einführung von Claude 3.5 Sonnet im Juni 2024 beide Anbieter bei Poe-Abonnenten nahezu gleichauf liegen. Im Bereich der Bildgenerierung … Weiterlesen …

Microsoft bringt Copilot-App für Mac mit neuen Funktionen

Microsoft hat eine native Copilot-App für macOS-Nutzer in den USA, Großbritannien und Kanada veröffentlicht. Tom Warren von The Verge berichtet, dass die App Zugang zum webbasierten KI-Assistenten von Microsoft bietet. Nutzer können damit Bilder und Texte generieren oder Bilder hochladen. Die Mac-Version verfügt über einen Dunkelmodus und lässt sich mit Command + Space aktivieren, ähnlich … Weiterlesen …

Alibaba veröffentlicht KI-Modell Wan 2.1 als Open Source

Der chinesische E-Commerce-Konzern Alibaba hat sein KI-Modell Wan 2.1 zur Generierung von Videos und Bildern als Open Source freigegeben. Vier Varianten des Modells sind nun weltweit über die Plattformen ModelScope und HuggingFace für akademische, Forschungs- und kommerzielle Zwecke verfügbar, wie Reuters berichtet. Die leistungsstärksten Versionen können bis zu 14 Milliarden Parameter verarbeiten und damit präzisere … Weiterlesen …

Napkin AI entwickelt Grafiken mit spezialisierten KI-Agenten

Ein neues KI-gestütztes Designwerkzeug namens Napkin AI revolutioniert die Grafikerstellung durch den Einsatz mehrerer spezialisierter KI-Agenten. Wie Matt Marshall für VentureBeat berichtet, kann das Tool innerhalb von fünf Sekunden anpassbare Grafiken aus Texteingaben erstellen. Das System arbeitet mit verschiedenen KI-Agenten, die jeweils spezifische Designaufgaben übernehmen. Der Ansatz unterscheidet sich sowohl von herkömmlicher Designsoftware als auch … Weiterlesen …