LoRA (Low-Rank Adaptation)

LoRA (Low-Rank Adaptation) ist eine effiziente Methode, um große KI-Modelle an spezielle Aufgaben anzupassen, ohne dabei das gesamte Modell neu trainieren zu müssen. Man kann sich LoRA wie einen kleinen, spezialisierten Zusatz vorstellen, der auf das ursprüngliche KI-Modell aufgesetzt wird. Dieser Ansatz ist vergleichbar mit einem Experten, der sich zusätzliches Spezialwissen aneignet, ohne sein Grundwissen … Weiterlesen …

Reasoning

Reasoning (engl. für „Schlussfolgerung“ oder „logisches Denken“) beschreibt in der künstlichen Intelligenz die Fähigkeit eines Systems, logische Schlüsse zu ziehen, Zusammenhänge zu erkennen und auf Basis vorhandener Informationen neue Erkenntnisse abzuleiten. Bei KI-Systemen wie ChatGPT bedeutet Reasoning, dass sie nicht nur auswendig gelernte Antworten wiedergeben, sondern durch Verknüpfung verschiedener Informationen zu eigenständigen Schlussfolgerungen gelangen können.  … Weiterlesen …

Overfitting

Overfitting (zu Deutsch: Überanpassung) bezeichnet ein häufiges Problem beim Training von KI, bei dem das Modell die Trainingsdaten zu genau „auswendig lernt“, anstatt allgemeingültige Muster zu erkennen. Man kann sich das wie einen Schüler vorstellen, der für eine Mathematikprüfung nur die Beispielaufgaben aus dem Lehrbuch auswendig lernt, statt die zugrundeliegenden Regeln zu verstehen. Wenn in … Weiterlesen …

Few-Shot Learning

Few-Shot Learning bezeichnet eine Methode in der künstlichen Intelligenz, bei der ein KI-Modell neue Aufgaben mit nur wenigen Beispielen lernen kann. Im Gegensatz zum klassischen maschinellen Lernen, das oft tausende von Trainingsdaten benötigt, kommt Few-Shot Learning mit einer Handvoll Beispielen aus – manchmal reichen sogar nur zwei oder drei. Man kann sich das wie einen … Weiterlesen …

Transformer

Transformer sind eine bahnbrechende Architektur für künstliche neuronale Netze, die 2017 von Google entwickelt wurde und heute die Grundlage für moderne KI-Sprachmodelle wie ChatGPT, Claude oder Googles Gemini bildet. Der Name „Transformer“ bezieht sich auf die Fähigkeit dieser Systeme, Eingabedaten (zum Beispiel Texte) in eine andere Form zu transformieren. Das Besondere an Transformern ist ihre … Weiterlesen …

LLM Router

LLM Router (Large Language Model Router) ist ein System, das eingehende Anfragen automatisch an das jeweils am besten geeignete Sprachmodell weiterleitet. Ähnlich wie ein Verkehrsleitsystem entscheidet der Router, welches der verfügbaren KI-Modelle eine bestimmte Aufgabe am effizientesten lösen kann. Diese Auswahl erfolgt basierend auf verschiedenen Kriterien wie der Art der Anfrage, der erforderlichen Expertise, den … Weiterlesen …

Foundation Model

Foundation Model (deutsch: Grundlagenmodell oder Basismodell) bezeichnet ein großes KI-Modell, das mit riesigen Datenmengen trainiert wurde und als Grundlage für verschiedene spezialisierte Anwendungen dient. Man kann es sich wie ein Fundament vorstellen, auf dem weitere KI-Anwendungen aufbauen. Diese Modelle werden zunächst mit einem breiten Spektrum an Daten trainiert – von Texten über Bilder bis hin … Weiterlesen …

Large Language Model

Ein Large Language Model, oft als LLM abgekürzt, ist ein hochentwickeltes künstliches neuronales Netzwerk, das darauf spezialisiert ist, menschliche Sprache zu verstehen, zu generieren und zu verarbeiten. Diese Modelle werden als „large“ (groß) bezeichnet, weil sie auf enormen Mengen an Textdaten trainiert werden und Milliarden von Parametern enthalten können. LLMs sind in der Lage, eine … Weiterlesen …

Mixture of Experts

Mixture of Experts (MoE) ist ein Konzept in der künstlichen Intelligenz, das sich am besten als ein Team von Spezialisten verstehen lässt. Bei diesem Ansatz wird eine komplexe Aufgabe auf mehrere kleinere, spezialisierte Modelle – die sogenannten „Experten“ – aufgeteilt, anstatt ein einziges großes Modell für alles zu verwenden. Ein zentraler „Gatekeeper“ oder „Router“ entscheidet … Weiterlesen …

Chain of Thought

Chain of Thought (Gedankenkette) ist ein Konzept in der künstlichen Intelligenz, das die Fähigkeit von KI-Systemen beschreibt, komplexe Probleme schrittweise zu lösen, ähnlich wie es Menschen tun. Diese Methode ermöglicht es KI-Modellen, ihre Denkprozesse in einer für Menschen nachvollziehbaren Weise darzulegen. Anstatt nur eine endgültige Antwort zu liefern, zeigt die KI dabei die einzelnen Gedankenschritte … Weiterlesen …