Diese Sprachmodelle sind zehnmal schneller als die Konkurrenz
Inception Labs hat mit Mercury eine neue Familie von Sprachmodellen vorgestellt, die auf Diffusionstechnologie basieren und Texte bis zu zehnmal schneller generieren können als herkömmliche LLMs. Die Mercury-Modelle erreichen laut Unternehmensangaben mehr als 1.000 Token pro Sekunde auf NVIDIA H100 Grafikprozessoren – eine Geschwindigkeit, die bisher nur mit Spezialchips möglich war. Das erste öffentlich verfügbare …