Microsoft hat mit Fara-7B einen neuen KI-Agenten vorgestellt, der komplexe Aufgaben direkt auf dem Computer des Nutzers ausführen kann. Das Modell ist klein genug, um lokal zu laufen. Dies erhöht die Datensicherheit und den Datenschutz, da sensible Informationen das Gerät nicht verlassen.
Wie Ben Dickson für VentureBeat berichtet, bedient der Agent den Computer, indem er den Bildschirm visuell interpretiert. Er analysiert Bildschirmfotos, um eine virtuelle Maus und Tastatur zu steuern und Aktionen wie Klicken, Tippen oder Scrollen auszuführen. Dieser pixelbasierte Ansatz ermöglicht es Fara-7B, auch durch komplexe Benutzeroberflächen zu navigieren, ohne auf den zugrundeliegenden Code zuzugreifen.
Laut Microsoft Research bietet diese Methode erhebliche Datenschutzvorteile für Unternehmen, die mit sensiblen Daten arbeiten. In Tests zur Web-Navigation übertraf Fara-7B die Erfolgsquote größerer Modelle wie GPT-4o. Der Agent erwies sich zudem als effizienter, da er Aufgaben mit deutlich weniger Schritten erledigte als vergleichbare Systeme.
Um Sicherheitsrisiken zu minimieren, wurde das Modell darauf trainiert, sogenannte „kritische Punkte“ zu erkennen. An solchen Stellen, etwa vor dem Senden einer E-Mail oder einem Finanzkauf, pausiert Fara-7B und bittet den Nutzer um eine ausdrückliche Bestätigung. Microsoft hat das Modell für Experimente unter einer MIT-Lizenz veröffentlicht, weist aber darauf hin, dass es noch nicht für den produktiven Einsatz bereit ist.
