Crawler-Index
Eine große Auswahl an Crawlern, die von Websites blockiert werden.
71,6 %
Websites haben mindestens einen teilweisen Disallow-Befehl.
71,6 %
Websites haben mindestens einen teilweisen Disallow-Befehl.
| Prozentualer Anteil der Websites, die User-Agents explizit blockieren | Prozentualer Anteil der Websites, die explizit und mit dem Befehl * blockieren | Unternehmen | Zweck | User Agent |
|---|---|---|---|---|
| 2,5 % | 62,5 % | Open AI | GPT | GPTBot |
| 2,1 % | 62,5 % | Common Crawl Foundation | Öffentliches Webarchiv | CCBot |
| 1,6 % | 62,5 % | Bard/Gemini/PaLM/Bison | Google-Extended | |
| 0,6 % | 62,2 % | OpenAI | Chat GPT | chatgpt-user |
| 1,8 % | 63,7 % | Amazon | Alexa | amazonbot |
| 0,5 % | 61,9 % | Meta AI | LIaMA | FacebookBot |
| 0,5 % | 64,9 % | Brandwatch | Magpie Crawler | magpie-crawler |
| 1,8 % | 64,9 % | ByteDance | ByteDance LLM N/A | Bytespider |
| 0,5 % | 61,8 % | Anthropic | Claude | Anthropic-AI |
| 1,6 % | 63,5 % | Anthropic | Claude | claudebot |
| 0,3 % | 62,5 % | Anthropic | Claude | claude-web |
| 0,4 % | 62,5 % | Perplexity | Chatbot | perplexitybot |
| 0,3 % | 62,0 % | Cohere | Cohere-Befehl | Cohere-AI |
| 1,3 % | 62,8 % | Apple | Grundlegende Modelle von Apple | Applebot-Extended |
| 0,3 % | 64,7 % | Apple | Siri | Applebot |
| 0,3 % | 64,7 % | Diffbot | Trainingsdaten | diffbot |
| 1,4 % | 63,6 % | Meta | Alle Meta-KI | meta-externalagent |
| 0,2 % | 64,6 % | OpenAI | SearchGPT | oai-searchbot |
| 0,2 % | 64,7 % | Timpi | Wilson KI | timpibot |
| 0,1 % | 64,7 % | webz.io | webzio-extended | webzio-extended |
| 0,1 % | 64,1 % | Bard/Gemini/PaLM/Bison | googleother | |
| 0,01 % | 65,0 % | Perplexity | perplexity-KI | perplexity-ai |
| 0,1 % | 64,7 % | Meta | Alle Meta-KI | meta-externalfetcher |
| Prozentualer Anteil der Websites, die User-Agents explizit blockieren | Prozentualer Anteil der Websites, die explizit und mit dem Befehl * blockieren | Unternehmen | Zweck | User Agent |
|---|---|---|---|---|
| 20,5 % | 83,5 % | Open AI | Chat GPT | gptbot |
| 17,1 % | 84,1 % | Common Crawl Foundation | Öffentliches Webarchiv | ccbot |
| 13,5 % | 84,8 % | Bard/Gemini/PaLM/Bison | google-extended | |
| 11,7 % | 83,4 % | Open AI | Chat GPT | chatgpt-user |
| 12,2 % | 83,6 % | Anthropic | Claude | anthropic-ai |
| 14,1 % | 83,4 % | Anthropic | Claude | claudebot |
| 10,2 % | 83,8 % | Anthropic | Claude | claude-web |
| 8,9 % | 83,6 % | Meta | LIaMA | facebookbot |
| 12,4 % | 84,2 % | ByteDance | ByteDance LLM N/A | bytespider |
| 11,8 % | 83,4 % | Perplexity | Chatbot | perplexitybot |
| 10,3 % | 84,2 % | Cohere | Cohere-Befehl | cohere-ai |
| 8,9 % | 84,4 % | Apple.com | Grundlegende Modelle von Apple | applebot-extended |
| 4,9 % | 86,1 % | Brand Watch | Magpie Crawler | magpie-crawler |
| 7,3 % | 83,7 % | Amazon | Alexa | amazonbot |
| 3,3 % | 85,1 % | Apple | Siri | applebot |
| 1,8 % | 85,5 % | Bard/Gemini/PaLM/Bison | googleother | |
| 2,9 % | 85,6 % | Webz | webzio-extended | webzio-extended |
| 4,2 % | 85,5 % | Timpi | Wilson KI | timpibot |
| 1,4 % | 86,4 % | Perplexity | perplexity-KI | perplexity-ai |
| 4,8 % | 85,9 % | Meta | Alle Meta-KI | meta-externalfetcher |
| 7,0 % | 83,6 % | Open AI | GPT suchen | OAI-searchbot |
| 4,8 % | 85,9 % | Meta | Alle Meta-KI | meta-externalagent |
Bright Data sammelt die weltweit gefragtesten öffentlichen Webdaten von Milliarden der beliebtesten Websites. Mit unserem Compliance-Produkt Bright Shield erfassen wir in der Datei robot.txt der von uns gesammelten Websites Befehle zum Zulassen und Verbieten von User-Agents. Unsere aktuelle Stichprobengröße umfasst 9.832.187 Websites, und wir haben etwa 33.000 eindeutige User-Agents erfasst.
Unser Forschungsteam hat den Prozentsatz der Zeit ermittelt, in der jeder relevante User Agent innerhalb unserer Stichprobe explizit blockiert wird, sowie jeden User Agent, der mit dem Befehl (*) blockiert wird. Wir verfolgen auch den Gesamtprozentsatz der Websites, die alle Crawler verbieten. Jeder User Agent wird nach bestem Wissen und Gewissen nach Unternehmen, Verwendung und einem Link identifiziert, der zusätzliche Informationen enthält, z. B. wie man ihn blockieren kann.
Kommentare zu User-Agents? Senden Sie Ihre Kommentareper E-Mail an [email protected]
Zuletzt aktualisiert am 2. Dezember 2025