Führende KI-Forscher uneins über die Definition eines „World Model“

In der KI werben führende Persönlichkeiten und Unternehmen wie Fei-Fei Li von World Labs, Yann LeCun von Meta und Google DeepMind für sogenannte „World Models“. Der Begriff beschreibt jedoch drei grundlegend verschiedene Technologien, was zunehmend für Verwirrung sorgt. Eine Analyse von Entropy Town erklärt, dass jede Gruppe etwas anderes unter einem Weltmodell versteht. Ursprünglich stammt …

Weiterlesen …

Google-Forscher stellen KI-Modell vor, das kontinuierlich lernt

​Forscher bei Google haben mit „Nested Learning“ ein neues KI-Konzept entwickelt. Ben Dickson berichtet für VentureBeat, dass es eine der größten Schwächen aktueller großer Sprachmodelle (LLMs) beheben soll: ihre Unfähigkeit, nach dem Training neues Wissen zu erlernen. Heutige Sprachmodelle sind nach ihrer Trainingsphase weitgehend statisch. Ihr Wissen beschränkt sich auf die ursprünglichen Trainingsdaten und die …

Weiterlesen …

Googles neues KI-Modell kann Apps und Websites nutzen

Google DeepMind hat ein neues, spezialisiertes KI-Modell veröffentlicht, mit dem Software-Agenten grafische Benutzeroberflächen bedienen können. In einem offiziellen Beitrag berichtet Google DeepMind, dass das „Gemini 2.5 Computer Use“-Modell einer KI ermöglicht, Aufgaben auf Webseiten und in mobilen Apps wie ein Mensch durch Klicken, Tippen und Scrollen zu erledigen. Das Modell analysiert eine Nutzeranfrage zusammen mit …

Weiterlesen …

Google Deepminds Genie 3 erzeugt interaktive Welten

Google Deepmind hat Genie 3 angekündigt, ein neues KI-„World Model“. Es kann aus Text-Prompts interaktive, dreidimensionale Umgebungen erzeugen. Laut der offiziellen Mitteilung des Unternehmens können Nutzer in diesen dynamischen Welten in Echtzeit navigieren. Das Modell generiert die Umgebungen mit einer Auflösung von 720p und läuft mit 24 Bildern pro Sekunde (fps). Google Deepmind gibt an, …

Weiterlesen …

Google DeepMind-Forscher prognostizieren „Ära der Erfahrung“

Forscher von Google DeepMind sehen einen bedeutenden Wandel in der Entwicklung künstlicher Intelligenz voraus. David Silver und Richard S. Sutton nennen diese kommende Phase die „Ära der Erfahrung“. Sie beschreiben ihre Vision in einem Vorabdruck eines Buchkapitels für den Verlag MIT Press. Die Wissenschaftler argumentieren, dass aktuelle KI-Systeme, insbesondere große Sprachmodelle, an die Grenzen dessen …

Weiterlesen …

DeepMinds AlphaGeometry2 löst Mathe-Olympiade besser als Goldmedaillengewinner

Google DeepMind hat ein KI-System entwickelt, das bei der Lösung von Geometrieaufgaben der Internationalen Mathematik-Olympiade (IMO) bessere Ergebnisse erzielt als durchschnittliche Goldmedaillengewinner, berichtet TechCrunch. AlphaGeometry2 kombiniert ein Gemini-Sprachmodell mit einer symbolischen Engine zur Analyse geometrischer Diagramme und Entwicklung mathematischer Beweise. Das System löste 42 von 50 IMO-Aufgaben der letzten 25 Jahre und übertraf damit den …

Weiterlesen …

DeepMind FACTS Grounding ist ein neues Bewertungssystem für KI-Genauigkeit

Google DeepMind hat ein neues Bewertungssystem namens FACTS Grounding eingeführt. Wie Taryn Plumb in VentureBeat berichtet, testet das System die Fähigkeit von Sprachmodellen, faktisch korrekte Antworten zu generieren. Das Benchmark-System verwendet 1.719 Beispiele aus verschiedenen Bereichen wie Finanzen, Technologie und Medizin. Die Bewertung erfolgt durch drei verschiedene KI-Modelle: Gemini 1.5 Pro, GPT-4o und Claude 3.5 …

Weiterlesen …

Google zeigt KI-Videogenerator Veo 2

Google DeepMind hat sein neuestes KI-Videogenerierungsmodell Veo 2 als direkten Konkurrenten zu OpenAIs Sora vorgestellt. Das neue Modell ist derzeit über Googles Labs‘ VideoFX-Plattform verfügbar, wobei der Zugang über eine Warteliste und Anmeldung über ein Google-Formular erfolgt. Laut Google kann Veo 2 Videos mit einer Länge von bis zu zwei Minuten in Auflösungen bis zu …

Weiterlesen …

Google DeepMind Genie 2 generiert interaktive 3D-Umgebungen

DeepMind hat Genie 2 vorgestellt, ein künstliches Intelligenz-Modell, das aus einzelnen Bildern und Textbeschreibungen spielbare 3D-Umgebungen erschaffen kann. Es stellt eine Weiterentwicklung gegenüber seinem Vorgänger Genie 1 dar, der auf 2D-Welten beschränkt war. Laut DeepMind kann Genie 2 interaktive Umgebungen generieren, die auf Tastatur- und Mauseingaben reagieren und es Benutzern oder KI-Agenten ermöglichen, Charaktere innerhalb …

Weiterlesen …

Google DeepMind CEO spricht über KI-Entwicklung und Unternehmensausrichtung

Demis Hassabis, CEO von Google DeepMind, steht an der Spitze der führenden KI-Forschungsorganisation des Unternehmens. Nach der Fusion von DeepMind und Google Brain im April 2023 entwickelt das kombinierte Team sowohl das Sprachmodell Gemini für Google-Produkte als auch bahnbrechende Forschungsprojekte wie AlphaFold. Die Organisation verfolgt unter Hassabis‘ Führung das Ziel, künstliche allgemeine Intelligenz (Artificial General …

Weiterlesen …