Agentische und generative KI werden die beiden bestimmenden Paradigmen dieses Jahrzehnts sein. Im Zuge der raschen Verbreitung von KI zeichnen sich in der Architektur zwei unterschiedliche Muster ab – agentenbasierte und generative KI.
Nach diesem Durchgang können Sie die folgenden Fragen beantworten:
- Was ist agentenbasierte KI?
- Was ist generative KI?
- Warum sind sie beide wichtig?
- Wann sollte ich sie jeweils einsetzen?
Ein kurzer Überblick über diese Technologien
Sowohl die agentenbasierte als auch die generative KI haben oft dieselben Grundlagen – Gewichte, Pre-Training, Feinabstimmung und LLMs. Die Hauptunterschiede ergeben sich aus ihrer Verwendung. Ich nehme hier eine Anleihe bei der Musik, um den Unterschied zu erklären.
- Agenten-KI: Musik, die von einer anderen Person geschrieben wurde, exakt nachspielen – bis ins kleinste Detail.
- Generative KI: Sie führt vielleicht immer noch eine Performance aus, aber sie ist improvisiert. Die generative KI ist derjenige, der die Musik schreibt – denken Sie an Beethoven oder einen Jazzmusiker.
Agentische KI erledigt eine komplexe Aufgabe. Die generative KI bringt etwas völlig Neues ins Leben.
Was sie teilen
- Gewichte: Die Gewichte geben an, was das Modell tatsächlich gelernt hat. Sie definieren die interne Mustererkennung und Entscheidungsfindung.
- Vor-Training: Hier lernt ein Modell aus umfangreichen Datensätzen und passt seine internen Gewichte entsprechend an.
- Feinabstimmung: Nachdem ein Modell trainiert wurde, wird es für bestimmte Aufgaben und Bereiche fein abgestimmt. Seine Gewichte werden fein abgestimmt, damit es sich wie vorgesehen verhält.
- Modell: Nach dem Trainingsprozess wird das Modell verwendet, um seinen Zweck zu erfüllen. Sowohl bei der agentenbasierten als auch bei der generativen KI wird das Endergebnis in der Regel (nicht immer) von einem LLM unterstützt.
Wo sie sich unterscheiden
- Endziel: Agentische KIs werden entwickelt, um eine Aufgabe zu erfüllen. Generative KIs werden entwickelt, um Inhalte zu erstellen.
- Interaktion: Agentische KI verwendet minimale Eingabeaufforderungen, sie folgt einem Prozess – ein festgelegter Plan bestimmt ihre Aktionen. Generative KI ist fast vollständig auf Eingabeaufforderungen angewiesen – das Modell erhält eine Eingabeaufforderung und generiert Inhalte, nachdem es die Aufforderung interpretiert hat.
- Eigenständigkeit: Agentische KI erhalten oft ein hohes Maß an Autonomie, während generative KI mit einem Menschen in der Schleife läuft. Wenn Sie LinkedIn mit ChatGPT scrapen, verwenden Sie agenturische KI. Wenn Sie ChatGPT bitten, ein Bild zu erstellen, verwenden Sie generative KI.
- Ausgabe: Agentische KI geben eine Zustandsänderung aus – “Auftragsstatus: abgeschlossen”. Generative KI gibt in der Regel Text, Bilder oder Videos aus.
- Bewertung: Agentische KI wird an ihrem Erfolg bei der Erfüllung einer Aufgabe gemessen. Generative KI wird an der Qualität, Relevanz und Originalität ihrer Ergebnisse gemessen.
Agentische KI
Bei der agentenbasierten KI geht es um die Erfüllung einer Aufgabe. Dies sollte nicht mit KI-Agenten verwechselt werden. Agenten sind eine reale, praktische Anwendung von Agentic AI. Wenn Sie Software mit Agentic AI entwickeln, hat Ihre Anwendung wahrscheinlich eine oder mehrere der folgenden Anforderungen.
- Entscheidungsfindung
- Problemlösung
- Autonomie
- Interaktion
- Abschluss der Aufgabe
Unter der Haube
- Planung: Jeder KI-Agent braucht mindestens einen losen Plan. Das kann etwas so Einfaches sein wie eine Aufforderung wie: “Du bist ein hilfreicher Scraping-Assistent, bitte extrahiere diese Produkte und gib sie in JSON aus”.
- Tooling und Funktionsaufrufe: Der Agent ist kein Einzelkämpfer. Je nach Komplexität können Sie ihm Zugriff auf einen Taschenrechner oder sogar auf eine vollständige Playwright-Instanz geben. Sie geben dem Agenten Zugriff und er entscheidet, wie und wann er die Tools verwendet.
- Zustandsmanagement: Der Agent sollte sich sowohl des kurz- als auch des langfristigen Kontexts bewusst sein. Für den kurzfristigen Kontext kann der Chat-Kontext ausreichen, aber das ist nicht ratsam. Eine einfache CRUD-Anwendung (Erstellen, Lesen, Aktualisieren, Löschen) reicht völlig aus. Eine dauerhafte Speicherung ermöglicht es dem Agenten, seine Arbeit ordnungsgemäß zu verfolgen.
- Rückkopplungsschleife: Der Agent sollte in einer Schleife laufen, bis seine Aufgabe abgeschlossen ist oder bis er unter bestimmten Bedingungen gestoppt wird, z. B. wenn er vom Benutzer unterbrochen wird.
- Bewertung und Beendigung: Der Agent sollte wissen, wann er seinen Auftrag abgeschlossen hat. Wenn die Arbeitsschritte ausgeführt wurden, das Ergebnis aber inakzeptabel ist, muss der Agent den Prozess erneut versuchen. Wenn der Auftrag erfolgreich war, sollte der Agent die Kontrollschleife verlassen.
Anwendungsfälle
- Kundenbetreuung: Fast jede Website betreibt einen Chatbot am Helpdesk. In diesen Fällen kann ein Modell das Problem und die Stimmung des Nutzers protokollieren und dann mithilfe von Funktionsaufrufen ein Ticket erstellen oder das Problem als gelöst markieren.
- Gesundheitswesen: Die Gesundheitsbranche setzt bereits seit den 1990er Jahren Agentic AI ein – lange bevor das Paradigma überhaupt benannt wurde. Agenten erhalten Dinge wie Röntgenbilder, Ultraschallbilder und die Krankengeschichte, um die Diagnose zu beschleunigen.
- Arbeitsabläufe: Stellen Sie sich vor, Ihr Agent hat sowohl Zugriff auf einen Browser als auch auf ein Dateisystem. Er kann einen Crawl durchführen und dann die extrahierten Daten direkt in Ihr Speichermedium eingeben, sei es eine SQL-Datenbank oder eine einfache JSON-Datei.
- Autonome Roboter: Der vielleicht am weitesten verbreitete Einsatz von agentenbasierter KI erfolgt in Form von autonomen Robotern und intelligenten Häusern. Das selbstfahrende Auto von Tesla ist agentenbasierte KI. Das Gleiche gilt für intelligente Haushaltsgeräte und Roombas.
Generative KI
Wie ich bereits erwähnt habe, funktioniert die generative KI eher wie ein Komponist oder ein Jazzmusiker. Sie stützt sich immer noch stark auf das Vortraining (vielleicht sogar noch mehr), aber sie nutzt dieses Vortraining, um neue strukturierte oder unstrukturierte Daten zu erstellen – den Unterschied zwischen strukturierten und unstrukturierten Daten können Sie hier lernen. Generative KI befriedigt die unten aufgeführten Bedürfnisse.
- Erstellung einzigartiger Ausgaben
- Datenanalyse
- Anpassungsfähigkeit
- Personalisierung
Unter der Haube
- Vorgeprüftes Grundmodell: Das Herzstück der generativen KI-Modelle ist ein riesiges neuronales Netz. ChatGPT, Grok, Claude – alle diese Modelle nutzen die Transformer-Architektur. Training ermöglicht Rückschlüsse und Rückschlüsse ermöglichen es uns, neue Daten zu erstellen.
- Promptes Interface: Diese Modelle sind oft für die direkte Interaktion mit einem Menschen konzipiert. Wenn Sie einem Modell sagen: “Erstellen Sie ein Meme” oder “Fassen Sie diesen Text zusammen”, wird die Eingabeaufforderung direkt verwendet, um die Ausgabe zu erzeugen.
- Vektor-Kodierung: Ihr Prompt wird in einen numerischen Vektor kodiert. Dieser Vektor wird dann anhand der internen Einbettungen des Modells interpretiert. Mehr über diese Vektoren und Einbettungen erfahren Sie hier.
- Retrieval-Augmented Generation: RAG gilt immer noch als optional, wird aber immer häufiger eingesetzt. Wenn ein Modell etwas nicht weiß, führt es eine Suche (Retrieval) nach den relevanten Daten durch. Anschließend verwendet es Zero-Shot-Learning, um seine Ausgabe (Generierung) zu verbessern (augmentieren).
- Ausgabemedium: Das Modell verwendet dann dieselbe Vektorkodierung, um die Ausgabe in Tokens (Text) oder sogar Bilder oder Videos umzuwandeln. Je nach Aufforderung können Sie sogar nach JSON- oder CSV-Daten fragen.
Anwendungsfälle
- Konversationstools: Im Gegensatz zu Helpdesk-Chatbots sind generative Chatbots so konzipiert, dass sie ein Gespräch führen und eine einzigartige Ausgabe erzeugen – sie simulieren ein tiefergehendes Gespräch als “Sind Sie sicher, dass es eingesteckt ist?”. Grok, ChatGPT, Claude und die meisten anderen LLM-zentrierten Webapps sind konversationelle Tools.
- Erstellung von Inhalten: Qualitativ hochwertige Inhalte sind oft in Sekundenschnelle verfügbar, wenn die richtigen Anweisungen gegeben werden. Egal, ob Sie Konzeptgrafiken, Beiträge für soziale Medien oder lange Texte erstellen möchten, generative Modelle können diese Art von Aufgaben übernehmen.
- Datenanalyse und -generierung: Laden Sie eine Datensatzdatei zur Analyse in ein Modell hoch. Je nach Modell können Sie einen detaillierten Bericht erhalten oder sogar einen neuen synthetischen Datensatz erstellen, der die Muster des Originals widerspiegelt.
- Personalisierte Assistenten: Generative KIs sind in hohem Maße anpassbar – sie sind darauf ausgelegt, einzigartig zu sein. Wenn Sie einen Assistenten mit einem bestimmten Tonfall wünschen, geben Sie ihm ein paar Beispiele und schon haben Sie eine individuelle Persönlichkeit.
Schlüsselvergleich zwischen agentenbasierter und generativer KI
Kriterien | Agentische KI | Generative KI |
---|---|---|
Primärer Zweck | ✔️ Ausführung und Abschluss von Aufgaben | ✔️ Erstellung und Synthese von Inhalten |
Zielorientiert | ✔️ Ja – arbeitet mit definierten Zielen | ❌ Nicht von Natur aus zielorientiert |
Prompt-Abhängigkeit | ❌ Minimal – läuft oft selbstständig | ✔️ Hoch – Aufforderung ist erforderlich, um die Ausgabe zu starten |
Ausgangstyp | ✔️ Statusänderung, abgeschlossene Aktionen | ✔️ Text, Bilder, Code, strukturierte Daten |
Tool-Nutzung / API-Zugang | ✔️ Häufig genutzte Tools und Funktionen | ❌ Selten (es sei denn, es handelt sich um eine Agentenschleife) |
Speicheranforderungen | ✔️ Benötigt Kurz- und Langzeitgedächtnis | Optional (nur bei RAG oder benutzerdefinierten Builds) |
Kontrollfluss | ✔️ Rückkopplungsschleife mit Wiederholungslogik | ❌ Einmalige Erzeugung (standardmäßig keine Schleife) |
Autonomie | ✔️ Hohe Autonomie möglich | ❌ Typisch ist der Mensch in der Schleife |
Bewertungsmethode | ✔️ Binärer Erfolg/Misserfolg | ✔️ Subjektive Qualität (Originalität, Ton, etc.) |
Beispiele aus der Praxis | ✔️ Web-Scraping-Bots, selbstfahrende Autos | ✔️ ChatGPT, DALL-E, GitHub Copilot |
Schlussfolgerung
Agenten-KI und generative KI sind nicht dazu gedacht, miteinander zu konkurrieren. Es handelt sich um zwei unterschiedliche Nischen mit Werkzeugen, die sich stark überschneiden. Agentische KI handelt nach einem Plan, während generative KI eine Eingabeaufforderung nach der anderen improvisiert.
Tools wie das Model Context Protocol von Bright Data ermöglichen es Ihrem Agenten oder LLM, echte Webdaten in Echtzeit nutzbar zu machen. Dies ist unglaublich leistungsstark – Ihre KI kann auf jede öffentliche Website im Internet zugreifen. Bei der agentenbasierten KI verbessert dies die Entscheidungsfindung und bei der generativen KI den Output.
Agentische und generative KI werden die Zukunft dominieren. Bauherren und Analysten, die beides zu nutzen verstehen, werden erfolgreich sein.
Keine Kreditkarte erforderlich