OpenAI o3 und o4-mini bringen neue Fähigkeiten zu Reasoning-KI

OpenAI hat zwei neue KI-Modelle, o3 und o4-mini, veröffentlicht, die erweiterte Reasoning-Fähigkeiten bieten und neue Funktionen wie das „Denken mit Bildern“ einführen. Diese Modelle sind die neueste Entwicklung in der o-Serie des Unternehmens und erscheinen nur wenige Tage nach der Veröffentlichung von GPT-4.1. Die markanteste Eigenschaft der Modelle ist ihre Fähigkeit, Bilder nicht nur zu … Weiterlesen …

Canva stellt Visual Suite 2.0 mit KI und Tabellenfunktionen vor

Canva hat auf seiner Veranstaltung „Canva Create 2025“ sein bisher größtes Produktupdate, Visual Suite 2.0, angekündigt. Die neue Suite führt mehrere KI-gestützte Funktionen ein, die darauf abzielen, die Lücke zwischen Produktivität und Kreativität zu schließen. Ein zentrales Element des Updates ist Canva Sheets, ein neues Tabellenkalkulationstool mit KI-Funktionen wie Magic Insights und Magic Formulas zur … Weiterlesen …

Plattform Krea vereint KI-Werkzeuge für visuelle Kreativschaffende

Krea ist eine Plattform für visuelle Kreativschaffende, die verschiedene generative KI-Modelle in einer Oberfläche integriert. Wie Ingrid Lunden in TechCrunch berichtet, hat das in San Francisco ansässige Startup insgesamt 83 Millionen Dollar eingesammelt, darunter eine kürzliche Series-B-Finanzierung in Höhe von 47 Millionen Dollar unter Führung von Bain Capital Ventures. Die Plattform ermöglicht es Designern, ihre … Weiterlesen …

Midjourney veröffentlicht V7 Alpha mit Sprachsteuerung und Entwurfsmodus

Midjourney hat V7 Alpha veröffentlicht, sein erstes neues KI-Bildgenerierungsmodell seit fast einem Jahr, das Sprachsteuerung und einen schnelleren Entwurfsmodus bietet. Die Veröffentlichung erfolgt eine Woche nach OpenAIs neuem Bildgenerator in ChatGPT, der schnell an Popularität gewann. Laut Midjourney-CEO David Holz nutzt V7 eine „völlig andere Architektur“, die „viel intelligenter mit Textprompts umgeht“ und eine höhere … Weiterlesen …

ChatGPTs neue Bildfunktion: Was macht diese Bild-KI so besonders?

ChatGPTs neuer Bildgenerator ist nicht nur ein Upgrade – er verändert grundlegend, wie KI Bilder erstellt. Das bedeutet: Exaktere Resultate, bessere Handhabung komplexer Szenen und lesbarer, verwendbarer Text im Bild selbst. Das ist ein erheblicher Fortschritt, wenn du im Bereich Design, Content-Erstellung, Marketing oder in einem anderen visuellen Bereich arbeitest. Während andere Bildgeneratoren ebenfalls große Fortschritte … Weiterlesen …

OpenAI bringt KI-Bildgenerierung auf ein neues Level

OpenAI hat native Bildgenerierungsfunktionen direkt in ChatGPT eingeführt, die vom multimodalen Modell GPT-4o angetrieben werden. Diese neue Funktion, „Images in ChatGPT“ genannt, steht jetzt Nutzern der Plus-, Pro-, Team- und kostenlosen Zugänge zur Verfügung. Optionen für Enterprise, Edu und über die API folgen in Kürze. Im Gegensatz zum bisherigen DALL-E 3-Bildgenerator, der ein separates Diffusionsmodell … Weiterlesen …

Reve Image 1.0 ist ein vielversprechender neuer KI-Bildgenerator

Reve AI hat Reve Image 1.0 veröffentlicht, ein neues Text-zu-Bild-Modell, das laut des unabhängigen Bewertungsdienstes Artificial Analysis derzeit auf Platz eins im Bereich Bildqualität rangiert. Wie Carl Franzen in VentureBeat berichtet, übertrifft das Modell Konkurrenten wie Midjourney v6.1 und Googles Imagen 3 besonders bei der Einhaltung von Eingabeaufforderungen, Ästhetik und Typografie. Das in Palo Alto … Weiterlesen …

Stable Virtual Camera verwandelt 2D-Bilder in Videos

Stability AI hat Stable Virtual Camera vorgestellt, ein neues KI-Modell zur Umwandlung von 2D-Bildern in Videos. Wie Ana Guillen im offiziellen Post berichtet, ermöglicht die Forschungsvorschau immersive Videos mit realistischer Tiefe und Perspektive ohne komplexe Rekonstruktionsverfahren. Das System kann aus einem einzelnen oder bis zu 32 Bildern Videos generieren und folgt dabei benutzerdefinierten Kamerapfaden oder … Weiterlesen …

Googles Gemini erlaubt Nutzern, Wasserzeichen in Bildern zu entfernen

Nutzer haben entdeckt, dass Googles KI-Modell Gemini 2.0 Flash Wasserzeichen von Bildern entfernen kann, auch von Getty Images und anderen Bildagenturen. Kyle Wiggers berichtet für TechCrunch, dass diese umstrittene Funktion in vielen Social-Media-Post vorgeführt wird. Im Gegensatz zu Konkurrenzmodellen wie Anthropics Claude 3.7 Sonnet und OpenAIs GPT-4o, die solche Anfragen ablehnen, scheint Gemini weniger Einschränkungen … Weiterlesen …

Google führt native Bilderzeugung in Gemini 2.0 Flash ein

Google hat einen in Gemini 2.0 Flash integrierten KI-Bildgenerator bekannt gegeben, die jetzt für Entwickler über Google AI Studio und die Gemini API verfügbar sind. Google ist damit das erste große US-Technologieunternehmen, das eine solche multimodale Bilderzeugung direkt in einem Modell für Endverbraucher integriert hat. Im Gegensatz zu früheren Ansätzen, bei denen Sprachmodelle mit separaten … Weiterlesen …