Apple hat auf seiner jährlichen Entwicklerkonferenz WWDC die dritte Generation der Apple Foundation Models (AFM) vorgestellt. Die Familie aus fünf KI-Modellen treibt einen grundlegend überarbeiteten Siri sowie zahlreiche neue intelligente Funktionen in Apples Betriebssystemen an. Für sein leistungsfähigstes Modell arbeitete Apple mit Google und Nvidia zusammen, wie unter anderem CNBC und MacRumors berichten.
Die neue Modellfamilie besteht aus zwei On-Device-Modellen und drei serverbasierten Modellen. Alle serverbasierten Modelle laufen auf Apples Private Cloud Compute. Das Unternehmen zufolge wird dabei keine Nutzerdaten gespeichert oder weitergegeben, auch nicht an Apple selbst.
Fünf Modelle in zwei Stufen
- AFM 3 Core ist die aktualisierte Version von Apples On-Device-Modell mit 3 Milliarden Parametern.
- AFM 3 Core Advanced ist ein neues On-Device-Modell mit 20 Milliarden Parametern und einer sparsamen Architektur, die je nach Aufgabe nur 1 bis 4 Milliarden Parameter aktiviert. Es ist nativ multimodal und ermöglicht Funktionen wie ausdrucksstarke Stimmen und genauere Diktierfunktionen, ohne die Cloud zu nutzen.
- AFM 3 Cloud ist das Standard-Servermodell, optimiert für Geschwindigkeit und Effizienz.
- ADM 3 Cloud (Image) übernimmt die Bildgenerierung und -bearbeitung und treibt Funktionen wie Image Playground und das räumliche Neugestalten von Fotos an.
- AFM 3 Cloud Pro ist das leistungsfähigste Modell der Familie und für komplexes Schlussfolgern sowie mehrstufige Aufgaben ausgelegt.
Bei AFM 3 Cloud Pro kommen die Partnerschaften mit Google und Nvidia direkt zum Tragen. Apple hat seine Private Cloud Compute Infrastruktur auf Nvidia-GPUs ausgedehnt, die in Googles Cloud betrieben werden. Apples Software-VP Sebastien Marineau-Mes erklärte, dass eine neue Nvidia-Technologie namens „Confidential Compute“ es ermöglicht, die Chips so zu konfigurieren, dass sie den Inhalt der Apple-Server nicht lesen können.
Apples KI-Verantwortlicher Amar Subramanya sagte, AFM 3 Cloud Pro sei qualitativ mit Googles Gemini-Frontier-Modellen vergleichbar. Gleichzeitig betonten Apple-Vertreter, was Googles Beitrag konkret bedeutet und was nicht. Craig Federighi, Apples SVP für Software Engineering, stellte klar: „The amount of the Google Assistant we use is none.“ Apple verwendet weder die Gemini-Modelle, die Google seinen eigenen Kunden bereitstellt, noch Googles clientseitigen Code oder Google Search als Wissensbasis.
Subramanya beschrieb, dass die vier für Apple Silicon entwickelten Modelle „mit proprietären Daten und Reinforcement Learning trainiert und mithilfe von Ergebnissen der Gemini-Frontier-Modelle verfeinert“ wurden. Googles Beitrag war also eine Art Wissenstransfer durch Destillation, keine direkte Einbindung von Google-Produkten.
Apple stellte außerdem einen sogenannten System Orchestrator vor. Dabei handelt es sich um eine Software, die jede Anfrage je nach Komplexität und benötigtem persönlichem Kontext an das passende Modell weiterleitet. Federighi bezeichnete ihn als „key to the privacy architecture of our entire system.“ Für Fragen zu aktuellen Ereignissen greift das System auf Apples eigenen World Knowledge Service zurück, der laut Unternehmen seit mehreren Jahren im Aufbau ist.
Apple veröffentlichte interne Bewertungsergebnisse. In menschlichen Präferenztests wurde AFM 3 Cloud bei 64,7 Prozent der Anfragen gegenüber dem Vorjahresmodell bevorzugt, das nur auf 8,7 Prozent kam. Das On-Device-Modell AFM 3 Core wurde in 45,6 Prozent der Fälle dem Vorgänger vorgezogen, der auf 23,3 Prozent kam. Bei der neuen Funktion für ausdrucksstarke Stimmen erzielte AFM 3 Core Advanced auf einer 5-Punkte-Skala zur Audioqualität einen Wert von 4,15, gegenüber 3,87 für das bisherige System.
Apple betont, keine privaten Nutzerdaten oder Interaktionen für das Training seiner Modelle zu verwenden. Die gesamte Private Cloud Compute Infrastruktur, einschließlich der Nvidia-Kapazitäten in Googles Cloud, soll unabhängig von externen Forschern überprüfbar sein.
Einen vollständigen technischen Bericht mit weiteren Benchmarks kündigt Apple für den Sommer an.
Quellen
- Introducing the Third Generation of Apple’s Foundation Models – Apple Machine Learning Research
- Apple partnering with Google and Nvidia for most advanced AI model – CNBC
- Apple’s New AI Models Contain ‚None‘ of Google’s Gemini Assistant – MacRumors
Bleib auf dem Laufenden
KI für Contentprofis: die neuesten Tools, Tipps und Trends. Alle 14 Tage in deine Inbox:
