Midjourney veröffentlicht V7 Alpha mit Sprachsteuerung und Entwurfsmodus

Midjourney hat V7 Alpha veröffentlicht, sein erstes neues KI-Bildgenerierungsmodell seit fast einem Jahr, das Sprachsteuerung und einen schnelleren Entwurfsmodus bietet. Die Veröffentlichung erfolgt eine Woche nach OpenAIs neuem Bildgenerator in ChatGPT, der schnell an Popularität gewann. Laut Midjourney-CEO David Holz nutzt V7 eine „völlig andere Architektur“, die „viel intelligenter mit Textprompts umgeht“ und eine höhere … Weiterlesen …

OpenAI kündigt Vollversion von o3 an und verschiebt GPT-5

OpenAI hat seine Entscheidung rückgängig gemacht, die Vollversion des o3-Reasoning-Modells nicht zu veröffentlichen. CEO Sam Altman gab auf X (ehemals Twitter) bekannt, dass sowohl o3 als auch der Nachfolger o4-mini in „ein paar Wochen“ erscheinen werden. Kyle Wiggers berichtet für TechCrunch, dass diese Änderung mit dem kommenden GPT-5 zusammenhängt, das Reasoning-Fähigkeiten integrieren wird. Altman erklärte, … Weiterlesen …

Microsoft erweitert Copilot Vision auf Windows und Mobilgeräte

Microsoft führt seine Copilot Vision-Funktion auf Windows und mobilen Plattformen ein und erweitert damit die Fähigkeiten des KI-Assistenten über Webbrowser hinaus. Die bisher auf Edge-Webseiten beschränkte Copilot Vision kann jetzt Echtzeit-Videos von Mobilkameras analysieren und mit Inhalten in Windows-Anwendungen interagieren. Die erweiterten Sehfähigkeiten lassen Copilot praktische Hilfestellungen bieten, etwa Tipps zur Pflanzenpflege oder Wohnungseinrichtung durch … Weiterlesen …

HallOumi überprüft KI-Output auf Halluzinationen

Oumi hat HallOumi veröffentlicht, ein Open-Source-Modell zur Überprüfung von KI-generierten Inhalten auf Halluzinationen. Das von ehemaligen Apple- und Google-Ingenieuren entwickelte Tool analysiert KI-Ausgaben satzweise und liefert Vertrauenswerte, spezifische Quellenangaben und verständliche Erklärungen. Sean Michael Kerner von VentureBeat berichtet, dass HallOumi Quelldokumente mit KI-Antworten vergleicht, um festzustellen, ob Behauptungen durch Beweise gestützt werden. CEO Manos Koukoumidis … Weiterlesen …

Open Deep Search ist eine frei verfügbare Alternative

Ein Forschungsteam aus Mitgliedern von Sentient, der University of Washington, Princeton University und UC Berkeley hat mit Open Deep Search (ODS) ein neues Open-Source-Framework vorgestellt. Es soll eine Alternative zu proprietären KI-Suchlösungen bieten. Das von Salaheddin Alzubi geleitete Team entwickelte zwei Hauptkomponenten: das Open Search Tool und den Open Reasoning Agent. Das Suchwerkzeug verarbeitet Webinhalte … Weiterlesen …

NotebookLM führt Websuche mit „Discover sources“ ein

Google hat NotebookLM um eine neue „Discover sources“-Funktion erweitert, die das Web nach relevanten Inhalten durchsucht. Laut Abner Li können Nutzer jetzt Informationen finden, ohne manuell Dateien und Links hinzufügen zu müssen. Nach einem Klick auf den neuen Button in der Quellenleiste und der Eingabe eines Themas liefert NotebookLM bis zu 10 kuratierte Weblinks mit … Weiterlesen …

Adobe Premiere Pro kann jetzt Videoclips mit KI verlängern

Adobe hat Version 25.2 von Premiere Pro veröffentlicht, die neue KI-gestützte Funktionen enthält, darunter Generative Extend. Diese auf Adobes Firefly-KI-Modell basierende Funktion ermöglicht es Editoren, Videoclips um bis zu zwei Sekunden und Hintergrundaudio um bis zu zehn Sekunden zu verlängern. Laut Jess Weatherbeds Bericht ist das Tool zunächst kostenlos, bevor Firefly-Guthaben erforderlich werden. Das Update … Weiterlesen …

OpenAI kündigt erstes Open-Source-Sprachmodell seit Jahren an

OpenAI plant in den kommenden Monaten sein erstes „offenes“ Sprachmodell seit GPT-2 zu veröffentlichen. Dies geht aus einem Feedback-Formular hervor, das das Unternehmen auf seiner Website veröffentlicht hat. Laut eines Berichts von Kyle Wiggers bittet OpenAI Entwickler, Forscher und Community-Mitglieder um Rückmeldungen zu dem neuen Modell. Das Unternehmen wird Entwickler-Events organisieren, beginnend in San Francisco … Weiterlesen …

Manus AI führt Abomodell für KI-Agenten ein

Manus AI bietet seinen KI-Agenten ab sofort als kostenpflichtigen Dienst an, berichtet Bloomberg News. Das Startup aus Peking hat zwei Preisstufen eingeführt: 39 Dollar und 199 Dollar pro Monat. Die teurere Option entspricht preislich OpenAIs ChatGPT Pro. Der Premium-Zugang lässt bis zu fünf Aufgaben gleichzeitig zu und bietet mehr Rechenleistung. Der KI-Agent, der auf Sprachmodellen … Weiterlesen …

Runway zeigt KI-Videomodell Gen-4

Runway hat sein neuestes KI-Videomodell Gen-4 veröffentlicht, das deutliche Verbesserungen bei der Konsistenz von Charakteren und Szenen bieten soll. Wie Kyle Wiggers berichtet, ist das Modell nun für Einzel- und Unternehmenskunden von Runway verfügbar. Das Unternehmen gibt an, dass Gen-4 kohärente Umgebungen und Charaktere über verschiedene Szenen hinweg beibehalten kann, während es realistische Physik simuliert. … Weiterlesen …