Googles Gemini erlaubt Nutzern, Wasserzeichen in Bildern zu entfernen

Nutzer haben entdeckt, dass Googles KI-Modell Gemini 2.0 Flash Wasserzeichen von Bildern entfernen kann, auch von Getty Images und anderen Bildagenturen. Kyle Wiggers berichtet für TechCrunch, dass diese umstrittene Funktion in vielen Social-Media-Post vorgeführt wird. Im Gegensatz zu Konkurrenzmodellen wie Anthropics Claude 3.7 Sonnet und OpenAIs GPT-4o, die solche Anfragen ablehnen, scheint Gemini weniger Einschränkungen … Weiterlesen …

Google führt native Bilderzeugung in Gemini 2.0 Flash ein

Google hat einen in Gemini 2.0 Flash integrierten KI-Bildgenerator bekannt gegeben, die jetzt für Entwickler über Google AI Studio und die Gemini API verfügbar sind. Google ist damit das erste große US-Technologieunternehmen, das eine solche multimodale Bilderzeugung direkt in einem Modell für Endverbraucher integriert hat. Im Gegensatz zu früheren Ansätzen, bei denen Sprachmodelle mit separaten … Weiterlesen …

Statistik zeigt beliebteste KI-Modelle für Text, Bild, Video

Die KI-Plattform Poe hat einen Trendbericht für das Frühjahr 2025 veröffentlicht, der bedeutende Veränderungen in den Nutzerpräferenzen bei KI-Modellen aufzeigt. Bei der Texterstellung dominieren OpenAI und Anthropic mit zusammen rund 85% der Nachrichten, wobei seit der Einführung von Claude 3.5 Sonnet im Juni 2024 beide Anbieter bei Poe-Abonnenten nahezu gleichauf liegen. Im Bereich der Bildgenerierung … Weiterlesen …

Microsoft bringt Copilot-App für Mac mit neuen Funktionen

Microsoft hat eine native Copilot-App für macOS-Nutzer in den USA, Großbritannien und Kanada veröffentlicht. Tom Warren von The Verge berichtet, dass die App Zugang zum webbasierten KI-Assistenten von Microsoft bietet. Nutzer können damit Bilder und Texte generieren oder Bilder hochladen. Die Mac-Version verfügt über einen Dunkelmodus und lässt sich mit Command + Space aktivieren, ähnlich … Weiterlesen …

Alibaba veröffentlicht KI-Modell Wan 2.1 als Open Source

Der chinesische E-Commerce-Konzern Alibaba hat sein KI-Modell Wan 2.1 zur Generierung von Videos und Bildern als Open Source freigegeben. Vier Varianten des Modells sind nun weltweit über die Plattformen ModelScope und HuggingFace für akademische, Forschungs- und kommerzielle Zwecke verfügbar, wie Reuters berichtet. Die leistungsstärksten Versionen können bis zu 14 Milliarden Parameter verarbeiten und damit präzisere … Weiterlesen …

Napkin AI entwickelt Grafiken mit spezialisierten KI-Agenten

Ein neues KI-gestütztes Designwerkzeug namens Napkin AI revolutioniert die Grafikerstellung durch den Einsatz mehrerer spezialisierter KI-Agenten. Wie Matt Marshall für VentureBeat berichtet, kann das Tool innerhalb von fünf Sekunden anpassbare Grafiken aus Texteingaben erstellen. Das System arbeitet mit verschiedenen KI-Agenten, die jeweils spezifische Designaufgaben übernehmen. Der Ansatz unterscheidet sich sowohl von herkömmlicher Designsoftware als auch … Weiterlesen …

How to: Personalisierte KI-Bilder für kleines Geld

Ein Verfahren für personalisierte KI-Bilder macht die Technologie für jedermann zugänglich. Wie Software-Entwickler Cory Zue berichtet, können Nutzer mit nur 3 Dollar und weniger als einer Stunde Zeitaufwand ihr eigenes KI-Bildmodell trainieren. Das System basiert auf dem Flux-Bildmodell in Kombination mit der LoRA-Trainingsmethode und läuft über die Plattform Replicate. Für das Training werden 10-15 verschiedene … Weiterlesen …

Generiere KI-Bilder kostenlos mit Dall-E auf deinem iPhone

Wusstest du, dass Apple die Nachrichten-App des iPhones um KI-gestützte Bildgenerierung mit OpenAIs Dall-E erweitert hat? Die Funktion ist Teil der ChatGPT-Integration in iOS 18.2, wie Tim Hardwick von MacRumors berichtet. Sie steht Nutzern von iPhone 15 Pro und iPhone 16 mit aktivierter Apple Intelligence zur Verfügung. Die Einrichtung erfolgt über die Einstellungen unter „Apple … Weiterlesen …

DeepSeek Janus Pro Bild-KI fordert etablierte Wettbewerber heraus

Das chinesische KI-Unternehmen DeepSeek hat eine neue Familie von KI-Modellen namens Janus-Pro eingeführt, die sowohl Bildanalyse als auch Bilderstellung ermöglichen. Die Modelle, die zwischen 1 Milliarde und 7 Milliarden Parameter umfassen, sind auf der Hugging Face-Plattform unter MIT-Lizenz verfügbar und erlauben eine uneingeschränkte kommerzielle Nutzung. Laut DeepSeek übertrifft das größte Modell der Familie, Janus-Pro-7B, mehrere … Weiterlesen …

Runways neuer KI-Bildgenerator ist auf den Filmlook spezialisiert

Das KI-Technologieunternehmen Runway hat einen neuen Bildgenerator namens Frames eingeführt. Wie Carl Franzen berichtet, richtet sich das Tool speziell an professionelle Kreativschaffende. Das System ist ab sofort über Runway-Abos verfügbar, die bei 95 Dollar pro Monat beginnen. Frames bietet 19 voreingestellte Bildstile und ermöglicht die Erstellung cinematischer Bilder mit präziser Stilkontrolle. Laut CEO Cristóbal Valenzuela … Weiterlesen …