Plattform Krea vereint KI-Werkzeuge für visuelle Kreativschaffende

Krea ist eine Plattform für visuelle Kreativschaffende, die verschiedene generative KI-Modelle in einer Oberfläche integriert. Wie Ingrid Lunden in TechCrunch berichtet, hat das in San Francisco ansässige Startup insgesamt 83 Millionen Dollar eingesammelt, darunter eine kürzliche Series-B-Finanzierung in Höhe von 47 Millionen Dollar unter Führung von Bain Capital Ventures. Die Plattform ermöglicht es Designern, ihre …

Weiterlesen …

Google erweitert AI Mode mit Bilderkennung

Google hat seinen KI-gestützten Suchdienst AI Mode um Bilderkennung erweitert. Nutzer können jetzt Fotos hochladen oder aufnehmen, die das System analysieren kann, um relevante Suchergebnisse zu liefern. Laut Ryan Whitwam von Ars Technica nutzt die Funktion eine angepasste Version des Gemini-Sprachmodells, das mit Google Lens zusammenarbeitet, um Objekte in Bildern zu identifizieren. Diese „Fan-out-Technik“ ermöglicht …

Weiterlesen …

Google macht Gemini 2.5 Pro zu günstigen Preisen allgemein verfügbar

Google hat bekannt gegeben, dass sein Gemini 2.5 Pro-Modell jetzt als öffentliche Vorschau über die Gemini API in Google AI Studio verfügbar ist, wobei die Einführung in Vertex AI in Kürze erwartet wird. Laut Google ist dieses Modell ihr bisher „intelligentestes“ und wurde mit 1,24 $ pro Million Input-Tokens und 10 $ pro Million Output-Tokens …

Weiterlesen …

Metas Llama 4-Modelle stoßen auf gemischte Resonanz

Meta hat seine neueste Generation von Künstliche-Intelligenz-Modellen, Llama 4, mit drei Varianten und verbesserten Fähigkeiten veröffentlicht. Es umfasst zwei sofort verfügbare Angebote – Llama 4 Scout und Llama 4 Maverick – während ein drittes Modell, Llama 4 Behemoth, noch in Entwicklung ist. Laut Meta markieren die Llama 4-Modelle „den Beginn einer neuen Ära“ für ihr …

Weiterlesen …

Midjourney veröffentlicht V7 Alpha mit Sprachsteuerung und Entwurfsmodus

Midjourney hat V7 Alpha veröffentlicht, sein erstes neues KI-Bildgenerierungsmodell seit fast einem Jahr, das Sprachsteuerung und einen schnelleren Entwurfsmodus bietet. Die Veröffentlichung erfolgt eine Woche nach OpenAIs neuem Bildgenerator in ChatGPT, der schnell an Popularität gewann. Laut Midjourney-CEO David Holz nutzt V7 eine „völlig andere Architektur“, die „viel intelligenter mit Textprompts umgeht“ und eine höhere …

Weiterlesen …

OpenAI kündigt Vollversion von o3 an und verschiebt GPT-5

OpenAI hat seine Entscheidung rückgängig gemacht, die Vollversion des o3-Reasoning-Modells nicht zu veröffentlichen. CEO Sam Altman gab auf X (ehemals Twitter) bekannt, dass sowohl o3 als auch der Nachfolger o4-mini in „ein paar Wochen“ erscheinen werden. Kyle Wiggers berichtet für TechCrunch, dass diese Änderung mit dem kommenden GPT-5 zusammenhängt, das Reasoning-Fähigkeiten integrieren wird. Altman erklärte, …

Weiterlesen …

Microsoft erweitert Copilot Vision auf Windows und Mobilgeräte

Microsoft führt seine Copilot Vision-Funktion auf Windows und mobilen Plattformen ein und erweitert damit die Fähigkeiten des KI-Assistenten über Webbrowser hinaus. Die bisher auf Edge-Webseiten beschränkte Copilot Vision kann jetzt Echtzeit-Videos von Mobilkameras analysieren und mit Inhalten in Windows-Anwendungen interagieren. Die erweiterten Sehfähigkeiten lassen Copilot praktische Hilfestellungen bieten, etwa Tipps zur Pflanzenpflege oder Wohnungseinrichtung durch …

Weiterlesen …

HallOumi überprüft KI-Output auf Halluzinationen

Oumi hat HallOumi veröffentlicht, ein Open-Source-Modell zur Überprüfung von KI-generierten Inhalten auf Halluzinationen. Das von ehemaligen Apple- und Google-Ingenieuren entwickelte Tool analysiert KI-Ausgaben satzweise und liefert Vertrauenswerte, spezifische Quellenangaben und verständliche Erklärungen. Sean Michael Kerner von VentureBeat berichtet, dass HallOumi Quelldokumente mit KI-Antworten vergleicht, um festzustellen, ob Behauptungen durch Beweise gestützt werden. CEO Manos Koukoumidis …

Weiterlesen …

Open Deep Search ist eine frei verfügbare Alternative

Ein Forschungsteam aus Mitgliedern von Sentient, der University of Washington, Princeton University und UC Berkeley hat mit Open Deep Search (ODS) ein neues Open-Source-Framework vorgestellt. Es soll eine Alternative zu proprietären KI-Suchlösungen bieten. Das von Salaheddin Alzubi geleitete Team entwickelte zwei Hauptkomponenten: das Open Search Tool und den Open Reasoning Agent. Das Suchwerkzeug verarbeitet Webinhalte …

Weiterlesen …

NotebookLM führt Websuche mit „Discover sources“ ein

Google hat NotebookLM um eine neue „Discover sources“-Funktion erweitert, die das Web nach relevanten Inhalten durchsucht. Laut Abner Li können Nutzer jetzt Informationen finden, ohne manuell Dateien und Links hinzufügen zu müssen. Nach einem Klick auf den neuen Button in der Quellenleiste und der Eingabe eines Themas liefert NotebookLM bis zu 10 kuratierte Weblinks mit …

Weiterlesen …

×