Meta entwickelt neue Byte-basierte KI-Architektur

Meta und die University of Washington haben eine neue KI-Architektur namens Byte latent transformer (BLT) entwickelt. Wie Ben Dickson für VentureBeat berichtet, arbeitet BLT direkt mit Bytes statt mit vordefinierten Tokens. Das System besteht aus drei Transformer-Blöcken: zwei kleinen Encoder/Decoder-Modellen und einem zentralen Latent Global Transformer. Tests zeigen, dass BLT die Leistung etablierter Modelle wie Llama 3 erreicht, dabei aber bis zu 50% weniger Rechenleistung benötigt. Die Architektur erweist sich als besonders effektiv bei der Verarbeitung ungewöhnlicher Muster, Rechtschreibfehler und weniger verbreiteter Sprachen. Die Forscher betonen, dass BLT ein verbessertes Verständnis auf Zeichenebene und bessere Ergebnisse bei der maschinellen Übersetzung von ressourcenarmen Sprachen zeigt.

Bleib up-to-date:

Hinweis: Der Autorname SCR steht für Inhalte, die mit KI-Hilfe erzeugt wurden. Jeder Beitrag wird vor der Veröffentlichung kontrolliert und bearbeitet. Redaktionelle Verantwortung: Jan Tissler. Lies mehr darüber, wie diese Website entsteht und welche Prompts zum Einsatz kommen.

Mehr zum Thema:

Bleib up-to-date: