Scrapy proxy integation

Scrapy Proxy Integration

This guide may be outdated. For an up-to-date guide please see our documentation.

What is Scrapy?

Scrapy is a Python framework for web crawling and scraping, which allows users to extract structured data from websites. It is open-source, fast, and extensible. Scrapy can be used for various purposes, such as data mining, monitoring, and automated testing.

Scrapy integration with Bright Data proxies

Open your preferred IDE and start a new scrapy project, type in the command line :

      scrapy startproject <project_name>
    

This will create a new folder with the project name, within the folder open a python file.

  • Go to your Bright Data Control Panel and clicking the ‘Proxies & Scraping Infra’ icon
  • Create a new proxy zone by clicking ‘Add’, choosing a network type, configuring the proxy, and clicking save
  • Under your proxy-zone’s ‘Access parameters’ tab, you will find your ‘USERNAME’ and ‘PASSWORD’ values.
  • In your scrapy spider code file, within the request’s meta parameter set the ‘proxy’ value to be the following, using the ‘USERNAME’ and ‘PASSWORD’ values from before: “http://USERNAME:[email protected]:33335
  • For Example:
      import scrapy

class BrightdatascrapyexampleSpider(scrapy.Spider):
name = "BrightDataScrapyExample"

def start_requests(self):
request = scrapy.Request(url="http://example.com",callback=self.parse)
request.meta['proxy'] = "http://USERNAME:[email protected]:33335"
yield request

def parse(self, response):
print(response.body)

Then run the following command in your command line :

      scrapy runspider <Pythonfilename.py>
    

How To Use Bright Data Proxy Manger With Scrapy

  • Create a proxy zone same as in the direct integration above
  • Install the Proxy Manager
  • Click ‘add new port’ and configure it for your use case
  • In your Scrapy spider code file, within the request’s meta parameter set the ‘proxy’ value to be the following: “http://IP:PORTNUMBER”
  • The local host IP is 127.0.0.1 – this is the value you need to use if the proxy manager is installed on your machine. If the proxy manager is installed on an external server, input that server’s IP address
  • The port created in the Proxy Manager is 24XXX, for example, 24000 – the default first port number
  • For example:
      import scrapy

class BrightdatascrapyexampleSpider(scrapy.Spider):
name = "BrightDataScrapyExample"

def start_requests(self):
request = scrapy.Request(url="http://example.com",callback=self.parse)
request.meta['proxy'] = "http://127.0.0.1:24000"
yield request

def parse(self, response):
print(response.body)

⚠️Important note: If you are using Bright Data’s Residential Proxies, Web Unlocker or SERP API, you need to install an SSL certificate to enable end-to-end secure connections to your target website(s). This is a simple process, see https://docs.brightdata.com/general/account/ssl-certificate#installation-of-the-ssl-certificate for instructions.

Get proxies for Scrapy

proxy badges

Angetrieben von einem preisgekrönten Residential-Proxy-Netzwerk

Über 400M+ monthly residential IPs, erstklassige Technologie und die Fähigkeit jedes Land, jede Stadt, jeden Anbieter und jede ASN zu erreichen, machen unsere Premium-Proxy-Dienste zur ersten Wahl für Entwickler

Proxy Network Pricing

50% RABATT
pay as you go plan icon
PAY AS YOU GO
$8 $4.00 / GB
Keine Verpflichtung
Gratis testen
Benutze diesen Gutscheincode: RESIGB50

Proxies ohne monatliche Bindung
50% RABATT
2nd plan icon
141 GB enthalten
$7 $3.50 / GB
$499 Monatliche Abrechnung
Gratis testen
Benutze diesen Gutscheincode: RESIGB50

Perfekt für kleine Unternehmen mit mäßiger Nutzung
50% RABATT
3rd plan icon
332 GB enthalten
$6 $3.00 / GB
$999 Monatliche Abrechnung
Gratis testen
Benutze diesen Gutscheincode: RESIGB50

Für große Teams mit umfangreichen betrieblichen Anforderungen konzipiert
50% RABATT
4th plan icon
798 GB enthalten
$5 $2.50 / GB
$1999 Monatliche Abrechnung
Gratis testen
Benutze diesen Gutscheincode: RESIGB50

Für Unternehmen mit umfangreichen Betriebsabläufen optimiert
Sie benötigen mehr als 1 TB?
Kontaktieren Sie uns
  • Unbegrenztes Volumen
  • Unbegrenzte Sitzplätze
  • Premium - SLA
  • 99,99 % Netzwerkverfügbarkeit
  • Kostenloser Proxy-Manager
  • Vollständige Datenabdeckung
  • Custom price per GB
  • Maßgeschneiderte Lösungen
pay as you go plan icon
PAY AS YOU GO
$8 / GB
Keine Verpflichtung
Gratis testen
Proxies ohne monatliche Bindung
2nd plan icon
71 GB enthalten
$7 / GB
$499 Monatliche Abrechnung
Gratis testen
Perfekt für kleine Unternehmen mit mäßiger Nutzung
3rd plan icon
166 GB enthalten
$6 / GB
$999 Monatliche Abrechnung
Gratis testen
Für große Teams mit umfangreichen betrieblichen Anforderungen konzipiert
4th plan icon
399 GB enthalten
$5 / GB
$1999 Monatliche Abrechnung
Gratis testen
Für Unternehmen mit umfangreichen Betriebsabläufen optimiert
Sie benötigen mehr als 1 TB?
Kontaktieren Sie uns
  • Unbegrenztes Volumen
  • Unbegrenzte Sitzplätze
  • Premium - SLA
  • 99,99 % Netzwerkverfügbarkeit
  • Kostenloser Proxy-Manager
  • Vollständige Datenabdeckung
  • Custom price per GB
  • Maßgeschneiderte Lösungen
pay as you go plan icon
PAY AS YOU GO
$0.6 / GB
Keine Verpflichtung
Gratis testen
Proxies ohne monatliche Bindung
2nd plan icon
1 TB enthalten
$0.51 / GB
$499 Monatliche Abrechnung
Gratis testen
Perfekt für kleine Unternehmen mit mäßiger Nutzung
3rd plan icon
2 TB enthalten
$0.45 / GB
$999 Monatliche Abrechnung
Gratis testen
Für große Teams mit umfangreichen betrieblichen Anforderungen konzipiert
4th plan icon
5 TB enthalten
$0.42 / GB
$1999 Monatliche Abrechnung
Gratis testen
Für Unternehmen mit umfangreichen Betriebsabläufen optimiert
Sie benötigen mehr als 1 TB?
Kontaktieren Sie uns
  • Unbegrenztes Volumen
  • Unbegrenzte Sitzplätze
  • Premium - SLA
  • 99,99 % Netzwerkverfügbarkeit
  • Kostenloser Proxy-Manager
  • Vollständige Datenabdeckung
  • Custom price per GB
  • Maßgeschneiderte Lösungen
Wir akzeptieren diese Zahlungsmethoden:

Das beste Kundenerlebnis in der Branche!

Sie fragen, wir entwickeln

Neue Funktionsveröffentlichungen jeden Tag

24/7 globale Unterstützung

Um Fragen zu beantworten, wenn Sie sie benötigen

Vollständige Transparenz

Echtzeit-Netzwerkleistungs-Dashboard

Gewidmete Kontomanager

Um Ihre Leistung zu optimieren

Maßgeschneiderte Lösungen

Um Ihre Datensammelziele zu erreichen

Der führende Anbieter von Proxies und Datenerfassung

Täglich werden 650TB an öffentlichen Daten gesammelt
Neue Funktionen werden täglich veröffentlicht
Skalierung auf Unternehmensniveau
4.6/5 höchste Trustpilot-Bewertung in der Branche

Ready to get Scrapy proxies?