🤖 „LLM" – was bedeutet das eigentlich?

Wenn du dich mit KI beschäftigst, stolperst du ständig über diese drei Buchstaben: LLM. ChatGPT ist ein LLM. Claude ist ein LLM. Gemini ist ein LLM. Aber was genau steckt dahinter – und warum ist es wichtig, das zu verstehen?

Die Abkürzung

LLM steht für Large Language Model – auf Deutsch: großes Sprachmodell. „Groß" ist dabei keine Übertreibung. Die leistungsfähigsten LLMs von heute wurden mit Hunderten Milliarden von Parametern trainiert – das sind die internen Stellschrauben, an denen das Modell dreht, um Sprache zu verstehen und zu erzeugen.

Was ein LLM eigentlich macht

Im Kern tut ein LLM etwas verblüffend Einfaches: Es sagt das nächste Wort vorher. Immer und immer wieder, Wort für Wort, bis ein ganzer Text entsteht.

Klingt simpel? Ist es im Prinzip auch. Aber wenn du dieses simple Prinzip auf eine riesige Datenmenge loslässt – im Grunde große Teile des Internets, Bücher, wissenschaftliche Arbeiten, Wikipedia, Foren, Code –, dann passiert etwas Erstaunliches: Das Modell lernt nicht nur Grammatik und Satzbau, sondern auch Zusammenhänge, Logik, Fachwissen, Humor, Stil und sogar so etwas wie Argumentation.

Nicht weil jemand ihm das alles einzeln beigebracht hätte. Sondern weil es aus den Mustern in den Daten Strukturen erkennt, die unglaublich leistungsfähig sind.

Wie das Training funktioniert – stark vereinfacht

Stell dir vor, du liest dein ganzes Leben lang Bücher – Millionen davon. Irgendwann kannst du einen angefangenen Satz so gut weiterführen, dass er klingt, als käme er aus dem jeweiligen Buch. Du hast nie eine Regel gelernt, aber du hast ein Gespür dafür entwickelt, was als Nächstes kommen sollte.

Genau das macht ein LLM, nur in einer Größenordnung, die sich kein Mensch vorstellen kann. Das Training läuft in zwei Phasen:

1. Pre-Training: Das Modell liest riesige Textmengen und lernt dabei, Muster in Sprache zu erkennen. Was folgt typischerweise auf welches Wort? In welchem Kontext? Das dauert Wochen bis Monate und verschlingt Millionen an Rechenkosten.

2. Fine-Tuning: Danach wird das Modell gezielt verfeinert – zum Beispiel, um hilfreich zu antworten statt einfach nur Text weiterzuspinnen, um Anweisungen zu befolgen oder um problematische Inhalte zu vermeiden. Hier kommen oft menschliche Trainer ins Spiel, die dem Modell Feedback geben.

Was ein LLM kann – und was nicht

✅ Stark bei: Texte schreiben, zusammenfassen, übersetzen, erklären, Code erzeugen, Ideen entwickeln, Muster erkennen, Brainstorming, komplexe Fragen beantworten, unterschiedliche Perspektiven einnehmen.

⚠️ Grenzen: Ein LLM „weiß" nichts im menschlichen Sinne. Es hat kein Gedächtnis zwischen Gesprächen (außer man baut eines ein), es kann nicht im Internet nachschauen (außer man gibt ihm ein Werkzeug dafür), und es kann sich irren – manchmal sehr überzeugend. Das nennt man Halluzination: Das Modell erzeugt etwas, das plausibel klingt, aber faktisch falsch ist.

Nicht jedes LLM ist gleich

Auch wenn das Grundprinzip ähnlich ist – die Unterschiede zwischen LLMs sind enorm:

Größe: Mehr Parameter bedeutet tendenziell mehr Fähigkeiten, aber auch mehr Rechenaufwand.
Trainingsdaten: Welche Texte hat das Modell gesehen? Wie aktuell sind sie?
Fine-Tuning: Wie wurde das Modell nach dem Training verfeinert? Das macht oft den entscheidenden Unterschied in der Praxistauglichkeit.
Architektur: Seit 2017 basieren fast alle großen LLMs auf der sogenannten Transformer-Architektur – einem Durchbruch von Google-Forschern, der es Modellen ermöglicht, lange Zusammenhänge in Texten zu verstehen.

Deshalb fühlen sich Claude, ChatGPT und Gemini im Gespräch so unterschiedlich an, obwohl sie alle LLMs sind. Es ist wie bei Autos: Alles hat vier Räder und einen Motor – aber ein Porsche fährt sich halt anders als ein VW Bus. Und je nach Strecke willst du mal das eine, mal das andere. 😉

Warum das für dich relevant ist

Wer versteht, was ein LLM ist, arbeitet besser damit. Ein paar Dinge, die sich direkt aus dem Verständnis ergeben:

LLMs reagieren auf Sprache. Je klarer und präziser dein Prompt, desto besser das Ergebnis. Deshalb funktioniert die KLAR-Methode so gut.
LLMs haben einen Wissensstand. Sie kennen nur das, was bis zu einem bestimmten Datum in ihren Trainingsdaten enthalten war – plus das, was sie per Websuche nachschlagen können.
LLMs sind keine Suchmaschinen. Sie erzeugen Text, statt Treffer aufzulisten. Das ist mächtiger, aber auch fehleranfälliger.
Verschiedene LLMs für verschiedene Aufgaben. Es gibt nicht „das beste" LLM – es gibt das passende für deinen Anwendungsfall.

Welches LLM nutzt du am meisten – und wofür? 👇

3 comments