Midjourney entwickelt Methoden für kreativere KI-Texte

Midjourney, bekannt für KI-Bildgenerierung, hat gemeinsam mit der New York University eine Forschungsarbeit veröffentlicht, die sich mit kreativeren Texten von Sprachmodellen befasst. Wie Carl Franzen für VentureBeat berichtet, stellt die Studie zwei neue Techniken vor: Diversified Direct Preference Optimization (DDPO) und Diversified Odds Ratio Preference Optimization (DORPO). Diese Methoden trainieren Sprachmodelle wie Meta’s Llama und …

Weiterlesen …

Google veröffentlicht neue KI-Modelle schneller als Sicherheitsberichte

Google beschleunigt die Veröffentlichung seiner KI-Modelle, ohne entsprechende Sicherheitsberichte zu liefern. Wie Maxwell Zeff von TechCrunch berichtet, fehlen für die neuesten Modelle Gemini 2.5 Pro und Gemini 2.0 Flash Sicherheitsdokumentationen, trotz früherer Transparenzzusagen. Tulsee Doshi, Leiterin des Gemini-Produkts, erklärte, dass Gemini 2.5 Pro als „experimentell“ eingestuft wird und Sicherheitsberichte erst bei allgemeiner Verfügbarkeit geplant sind. …

Weiterlesen …

Anthropic gibt Einblicke in Claudes interne „Denkprozesse“

Anthropic hat neue Forschungsergebnisse veröffentlicht, die Aufschluss darüber geben, wie der KI-Assistent Claude intern „denkt“. Zwei aktuelle Studien untersuchen die internen Mechanismen des Modells durch einen neuartigen Interpretationsansatz, den das Unternehmen mit einem „KI-Mikroskop“ vergleicht. Diese Forschung bringt mehrere überraschende Erkenntnisse über Claudes kognitive Prozesse ans Licht, unter anderem wie es mit verschiedenen Sprachen umgeht, …

Weiterlesen …

Gartner prognostiziert 644 Milliarden Dollar Ausgaben für generative KI in diesem Jahr

Das Analystenunternehmen Gartner sagt voraus, dass die weltweiten Ausgaben für generative KI im Jahr 2025 auf 644 Milliarden Dollar ansteigen werden. Dies entspricht einer Steigerung von 76,4% gegenüber 2024. Wie Sean Michael Kerner für VentureBeat berichtet, wird Hardware etwa 80% dieser Ausgaben ausmachen. Laut der Analyse entfallen 398,3 Milliarden Dollar auf Endgeräte und 180,6 Milliarden …

Weiterlesen …

Studie: OpenAI hat GPT-4o möglicherweise mit kostenpflichtigen O’Reilly-Büchern trainiert

Eine neue Untersuchung des AI Disclosures Project legt nahe, dass OpenAI sein GPT-4o-Modell ohne Lizenzvereinbarung mit kostenpflichtigen Büchern von O’Reilly Media trainiert hat. Die Forscher Tim O’Reilly, Ilan Strauss und Sruly Rosenblat analysierten, wie gut verschiedene OpenAI-Modelle Inhalte aus O’Reilly-Büchern erkennen. Laut der von Kyle Wiggers auf TechCrunch vorgestellten Studie zeigte GPT-4o eine deutlich bessere …

Weiterlesen …

Midjourney veröffentlicht V7 Alpha mit Sprachsteuerung und Entwurfsmodus

Midjourney hat V7 Alpha veröffentlicht, sein erstes neues KI-Bildgenerierungsmodell seit fast einem Jahr, das Sprachsteuerung und einen schnelleren Entwurfsmodus bietet. Die Veröffentlichung erfolgt eine Woche nach OpenAIs neuem Bildgenerator in ChatGPT, der schnell an Popularität gewann. Laut Midjourney-CEO David Holz nutzt V7 eine „völlig andere Architektur“, die „viel intelligenter mit Textprompts umgeht“ und eine höhere …

Weiterlesen …

OpenAI kündigt Vollversion von o3 an und verschiebt GPT-5

OpenAI hat seine Entscheidung rückgängig gemacht, die Vollversion des o3-Reasoning-Modells nicht zu veröffentlichen. CEO Sam Altman gab auf X (ehemals Twitter) bekannt, dass sowohl o3 als auch der Nachfolger o4-mini in „ein paar Wochen“ erscheinen werden. Kyle Wiggers berichtet für TechCrunch, dass diese Änderung mit dem kommenden GPT-5 zusammenhängt, das Reasoning-Fähigkeiten integrieren wird. Altman erklärte, …

Weiterlesen …

Microsoft erweitert Copilot Vision auf Windows und Mobilgeräte

Microsoft führt seine Copilot Vision-Funktion auf Windows und mobilen Plattformen ein und erweitert damit die Fähigkeiten des KI-Assistenten über Webbrowser hinaus. Die bisher auf Edge-Webseiten beschränkte Copilot Vision kann jetzt Echtzeit-Videos von Mobilkameras analysieren und mit Inhalten in Windows-Anwendungen interagieren. Die erweiterten Sehfähigkeiten lassen Copilot praktische Hilfestellungen bieten, etwa Tipps zur Pflanzenpflege oder Wohnungseinrichtung durch …

Weiterlesen …

HallOumi überprüft KI-Output auf Halluzinationen

Oumi hat HallOumi veröffentlicht, ein Open-Source-Modell zur Überprüfung von KI-generierten Inhalten auf Halluzinationen. Das von ehemaligen Apple- und Google-Ingenieuren entwickelte Tool analysiert KI-Ausgaben satzweise und liefert Vertrauenswerte, spezifische Quellenangaben und verständliche Erklärungen. Sean Michael Kerner von VentureBeat berichtet, dass HallOumi Quelldokumente mit KI-Antworten vergleicht, um festzustellen, ob Behauptungen durch Beweise gestützt werden. CEO Manos Koukoumidis …

Weiterlesen …

Open Deep Search ist eine frei verfügbare Alternative

Ein Forschungsteam aus Mitgliedern von Sentient, der University of Washington, Princeton University und UC Berkeley hat mit Open Deep Search (ODS) ein neues Open-Source-Framework vorgestellt. Es soll eine Alternative zu proprietären KI-Suchlösungen bieten. Das von Salaheddin Alzubi geleitete Team entwickelte zwei Hauptkomponenten: das Open Search Tool und den Open Reasoning Agent. Das Suchwerkzeug verarbeitet Webinhalte …

Weiterlesen …