Google erweitert AI Mode mit Bilderkennung

Google hat seinen KI-gestützten Suchdienst AI Mode um Bilderkennung erweitert. Nutzer können jetzt Fotos hochladen oder aufnehmen, die das System analysieren kann, um relevante Suchergebnisse zu liefern. Laut Ryan Whitwam von Ars Technica nutzt die Funktion eine angepasste Version des Gemini-Sprachmodells, das mit Google Lens zusammenarbeitet, um Objekte in Bildern zu identifizieren. Diese „Fan-out-Technik“ ermöglicht …

Weiterlesen …

Google macht Gemini 2.5 Pro zu günstigen Preisen allgemein verfügbar

Google hat bekannt gegeben, dass sein Gemini 2.5 Pro-Modell jetzt als öffentliche Vorschau über die Gemini API in Google AI Studio verfügbar ist, wobei die Einführung in Vertex AI in Kürze erwartet wird. Laut Google ist dieses Modell ihr bisher „intelligentestes“ und wurde mit 1,24 $ pro Million Input-Tokens und 10 $ pro Million Output-Tokens …

Weiterlesen …

Metas Llama 4-Modelle stoßen auf gemischte Resonanz

Meta hat seine neueste Generation von Künstliche-Intelligenz-Modellen, Llama 4, mit drei Varianten und verbesserten Fähigkeiten veröffentlicht. Es umfasst zwei sofort verfügbare Angebote – Llama 4 Scout und Llama 4 Maverick – während ein drittes Modell, Llama 4 Behemoth, noch in Entwicklung ist. Laut Meta markieren die Llama 4-Modelle „den Beginn einer neuen Ära“ für ihr …

Weiterlesen …

Studie: So unterschiedlich denken Öffentlichkeit und Experten über KI

Eine neue Studie des Pew Research Centers zeigt deutliche Unterschiede zwischen den Ansichten der amerikanischen Öffentlichkeit und KI-Experten zu künstlicher Intelligenz. Die von Forscherin Colleen McClain durchgeführte Untersuchung belegt, dass Experten deutlich optimistischer sind: 56% erwarten positive Auswirkungen von KI, während nur 17% der Allgemeinbevölkerung diese Einschätzung teilen. Die 2024 durchgeführten Umfragen zeigen auch, dass …

Weiterlesen …

Midjourney entwickelt Methoden für kreativere KI-Texte

Midjourney, bekannt für KI-Bildgenerierung, hat gemeinsam mit der New York University eine Forschungsarbeit veröffentlicht, die sich mit kreativeren Texten von Sprachmodellen befasst. Wie Carl Franzen für VentureBeat berichtet, stellt die Studie zwei neue Techniken vor: Diversified Direct Preference Optimization (DDPO) und Diversified Odds Ratio Preference Optimization (DORPO). Diese Methoden trainieren Sprachmodelle wie Meta’s Llama und …

Weiterlesen …

Google veröffentlicht neue KI-Modelle schneller als Sicherheitsberichte

Google beschleunigt die Veröffentlichung seiner KI-Modelle, ohne entsprechende Sicherheitsberichte zu liefern. Wie Maxwell Zeff von TechCrunch berichtet, fehlen für die neuesten Modelle Gemini 2.5 Pro und Gemini 2.0 Flash Sicherheitsdokumentationen, trotz früherer Transparenzzusagen. Tulsee Doshi, Leiterin des Gemini-Produkts, erklärte, dass Gemini 2.5 Pro als „experimentell“ eingestuft wird und Sicherheitsberichte erst bei allgemeiner Verfügbarkeit geplant sind. …

Weiterlesen …

Anthropic gibt Einblicke in Claudes interne „Denkprozesse“

Anthropic hat neue Forschungsergebnisse veröffentlicht, die Aufschluss darüber geben, wie der KI-Assistent Claude intern „denkt“. Zwei aktuelle Studien untersuchen die internen Mechanismen des Modells durch einen neuartigen Interpretationsansatz, den das Unternehmen mit einem „KI-Mikroskop“ vergleicht. Diese Forschung bringt mehrere überraschende Erkenntnisse über Claudes kognitive Prozesse ans Licht, unter anderem wie es mit verschiedenen Sprachen umgeht, …

Weiterlesen …

Gartner prognostiziert 644 Milliarden Dollar Ausgaben für generative KI in diesem Jahr

Das Analystenunternehmen Gartner sagt voraus, dass die weltweiten Ausgaben für generative KI im Jahr 2025 auf 644 Milliarden Dollar ansteigen werden. Dies entspricht einer Steigerung von 76,4% gegenüber 2024. Wie Sean Michael Kerner für VentureBeat berichtet, wird Hardware etwa 80% dieser Ausgaben ausmachen. Laut der Analyse entfallen 398,3 Milliarden Dollar auf Endgeräte und 180,6 Milliarden …

Weiterlesen …

Studie: OpenAI hat GPT-4o möglicherweise mit kostenpflichtigen O’Reilly-Büchern trainiert

Eine neue Untersuchung des AI Disclosures Project legt nahe, dass OpenAI sein GPT-4o-Modell ohne Lizenzvereinbarung mit kostenpflichtigen Büchern von O’Reilly Media trainiert hat. Die Forscher Tim O’Reilly, Ilan Strauss und Sruly Rosenblat analysierten, wie gut verschiedene OpenAI-Modelle Inhalte aus O’Reilly-Büchern erkennen. Laut der von Kyle Wiggers auf TechCrunch vorgestellten Studie zeigte GPT-4o eine deutlich bessere …

Weiterlesen …

Midjourney veröffentlicht V7 Alpha mit Sprachsteuerung und Entwurfsmodus

Midjourney hat V7 Alpha veröffentlicht, sein erstes neues KI-Bildgenerierungsmodell seit fast einem Jahr, das Sprachsteuerung und einen schnelleren Entwurfsmodus bietet. Die Veröffentlichung erfolgt eine Woche nach OpenAIs neuem Bildgenerator in ChatGPT, der schnell an Popularität gewann. Laut Midjourney-CEO David Holz nutzt V7 eine „völlig andere Architektur“, die „viel intelligenter mit Textprompts umgeht“ und eine höhere …

Weiterlesen …

×