Barrierefreiheitsmenü Zum Inhalt springen
day1

MCP Launch Week Day 1

4 min lesen

MCP-Startwoche Tag 1

Heute starten wir die Web MCP Launch Week. Wir veröffentlichen Tool Groups – eine neue Funktion in unserem MCP-Server, die den größten Engpass in agentenbasierten Workflows löst: Kontextverschmutzung.

Sie können Ihren MCP-Server jetzt so einstellen, dass nur die Tools geladen werden, die Sie benötigen (z. B. ?groups=social oder ?groups=ecommerce), wodurch der Token-Verbrauch drastisch reduziert und die Genauigkeit der Agenten erhöht wird.

Das Problem: Die „All-Tools”-Falle

In den Anfängen von MCP (und mit „Anfängen” meinen wir vor 3 Monaten) war das Standardmuster einfach: Jede Funktion, die Ihre API bietet, wurde als Tool bereitgestellt.

Für Bright Data ist das ein Problem. Unser Netzwerk bietet Datensätze für Amazon, LinkedIn, TikTok, Google Maps, Zillow, Finanzdaten und Browser-Automatisierung. Wenn wir jeden einzelnen Datensatz und Scraper auf den Server laden würden, würden wir über 200 verschiedene Tools bereitstellen.

Wenn ein MCP-Client (wie Claude Desktop oder Cursor) eine Verbindung zu einem Server herstellt, werden alle diese Tool-Definitionen – Namen, Beschreibungen und JSON-Schemas – in die System-Eingabeaufforderung übertragen.

Dies führt zu zwei kritischen Problemen:

  1. Kontextverschmutzung: Das LLM wird durch 45 Tools abgelenkt, die es nicht benötigt. Es könnte einen Parameter aus einem Instagram-Tool halluzinieren, während es versucht, Amazon zu scrapen.
  2. Token-Ineffizienz: Sie bezahlen für Tausende von Eingabetoken, nur um die Tools zu definieren, noch bevor der Benutzer überhaupt „Hallo” eingibt.

Die Lösung: Scoped Tool Groups

Wir haben unseren MCP-Server umgestaltet, um modulare Tool-Gruppen zu unterstützen. Anstelle eines monolithischen Servers können Sie den Server nun als eine kombinierbare Reihe von Funktionen betrachten.

Wir haben unsere Datensätze in logische Domänen organisiert:

  • ECOMMERCE: Amazon, Walmart, eBay, Google Shopping
  • SOCIAL_MEDIA: TikTok, Instagram, Facebook, Reddit, X (Twitter)
  • BUSINESS: LinkedIn, Crunchbase, Google Maps, Zillow
  • RESEARCH: GitHub-Repositorys, Reuters-Nachrichten, akademische Quellen
  • FINANZEN: Aktiendaten, Markttrends, Finanznachrichten
  • APP-STORES: iOS App Store, Google Play
  • BROWSER: Die vollständige Scraping-Browser-Automatisierungssuite
  • ADVANCED_SCRAPING: Batch-Operationen und Hochdurchsatz-Dienstprogramme

So funktioniert es

Im Hintergrund haben wir eine Filterlogik implementiert, die die Initialisierungsanfrage abfängt. Wenn Sie Ihren Client konfigurieren, fügen Sie einfach die benötigten Gruppen an die URL an.

Für einen E-Commerce-Agenten:

https://mcp.brightdata.com/mcp?token=<IHR-API-Token>&groups=ecommerce
# ODER über Umgebungsvariablen für STDIO
GROUPS=ecommerce

Für einen Social-Media-Analysten-Agenten:

https://mcp.brightdata.com/mcp?token=<IHR-API-Token>&groups=social

Jeder erhält standardmäßig die Basis-Tools (search_engine und scrape_as_markdown). Der Server erstellt dann dynamisch die Tool-Liste:

// Vereinfachte Logik aus unserer server.js
function build_allowed_tools(groups = [], tools = []) {
    const allowed = new Set(base_tools);
    for (let groupId of groups) {
        const group = GROUPS[groupId];
        if (group) {
             // Nur für diese Gruppe spezifische Tools hinzufügen
            group.tools.forEach(t => allowed.add(t));
        }
    }
    return allowed;
}

Die Zukunft der „Codeausführung” vs. die Gegenwart der „Tools”

Warum ist das gerade jetzt so wichtig?

In der Branche findet derzeit ein massiver Wandel statt. Aktuelle Veröffentlichungen und Demos von Anthropic und Cloudflare zeigen eine Entwicklung hin zu „Codeausführung” und „Computernutzung”. Die Vision ist, dass das Modell anstelle von get_amazon_review(asin: „123”) einfach ein Python-Skript schreibt oder einen Bash-Befehl ausführt, um die Daten selbst abzurufen.

Wir glauben fest an diese Zukunft. So kann das Modell kreativ sein, anstatt durch starre API-Schemata eingeschränkt zu sein.

Allerdings sind wir noch nicht so weit.

Die meisten aktuellen MCP-Clients sind nach wie vor streng toolzentriert. Sie sind darauf angewiesen, dass der Server jede Aktion, die das Modell ausführen kann, explizit definiert. Wenn Sie 100 Datensätze in das Kontextfenster einfügen, verschlechtert sich die Leistung des Modells.

Tool-Gruppen sind die Brücke. Sie bieten Ihnen die Leistungsfähigkeit der umfangreichen Dateninfrastruktur von Bright Data, ohne die aktuelle Generation von KI-Agenten zu überfordern. So bleibt Ihr Kontextfenster übersichtlich und die Schlussfolgerungen Ihres Agenten präzise.

Auswirkungen auf die Leistung

Durch die Verwendung von Tool-Gruppen haben wir erhebliche Verbesserungen bei der Zuverlässigkeit der Agenten festgestellt.

Vergleich des Token-Verbrauchs

Nachfolgend finden Sie einen Vergleich, der die drastische Reduzierung des Token-Verbrauchs bei Verwendung bestimmter Tool-Gruppen im Vergleich zum Laden aller Tools zeigt (Prod-Modus mit 62 Tools bei 7.358 Tokens):

Wichtige Erkenntnisse:

  • 78,5 % bis 94,6 % Token-Reduzierung über alle Tool-Gruppen hinweg im Vergleich zum Laden aller 62 Tools
  • Die Gruppen „Finanzen” und „Reisen” weisen mit einer Reduzierung um 94,6 % (nur 401 Token gegenüber 7.358) die beste Optimierung auf
  • Die Social-Media-Gruppe hat aufgrund komplexerer Tool-Schemas mit 2.823 Tokens den höchsten Tokenverbrauch, spart aber dennoch 61,6 % ein
  • Höhere Erfolgsquote bei der Parameterauswahl (das Modell verwechselt linkedin_url weniger häufig mit facebook_url)
  • Geringere Latenz beim ersten Handshake

Probieren Sie es aus

Der Web-MCP-Server ist Open Source und ab sofort verfügbar.

  • Erste Schritte: Lesen Sie die Dokumentation, um Ihren ersten Agenten einzurichten.
  • Kostenlose Nutzung: Melden Sie sich an , um 5.000 kostenlose Anfragen pro Monat für unsere Basis-Tools (search_engine und scrape_as_markdown) zu erhalten.

Viel Spaß beim Erstellen.

Bereit anzufangen?
Erkunde den Web MCP-Server und beginne, leistungsstarke KI-Agenten zu erstellen.
Dokumentation lesen Repo ansehen