Wie Web Scraping in Microsoft Excel funktioniert – eine detaillierte Anleitung

Im Folgenden finden Sie eine schnelle und einfache Schritt-für-Schritt-Anleitung, wie Sie eine webbasierte Datenabfrage direkt von Ihrem Microsoft Excel-Arbeitsblatt aus durchführen.
4 min read
How Web Scraping in Microsoft Excel Works - A Detailed Guide

In diesem Beitrag geht es um Folgendes:

Erfassen von „Tabellendaten“ mit dem Webabfragetool von Excel

 

Die Datenerfassung mit Excel beispielsweise ist viel einfacher als das Scraping mit Python. Die Methode, auf die wir uns konzentrieren werden, eignet sich gut, wenn Sie auf Webdaten abzielen, die in Zeilen und Spalten organisiert sind (d. h. in Tabellen).  

Im Folgenden finden Sie eine Schritt-für-Schritt-Anleitung, die Ihnen dabei hilft, Daten aus einer Zielwebsite zu erfassen und sie direkt in eine Excel-Arbeitsmappe zu importieren, sodass Sie mit dem Sortieren, Filtern und Analysieren beginnen können:

Schritt 1: Öffnen Sie eine neue Arbeitsmappe

 

Die Datenpunkte müssen in einen leeren Arbeitsbereich importiert werden. Öffnen Sie also entweder eine völlig neue Arbeitsmappe in Excel oder fügen Sie an der unteren Leiste Ihrer vorhandenen Datei unter der Registerkarte „Sheets“ (Tabelle) ein neues Arbeitsblatt hinzu.

Quelle: exceldome  

Schritt 2: Führen Sie eine Webdatenabfrage aus  

Sie können eine neue Webabfrage starten, indem Sie oben in Ihrem Microsoft Excel-Arbeitsblatt auf die Registerkarte „Daten“ gehen, links auf die Schaltfläche „Daten abrufen“ klicken, dann auf „Aus anderen Quellen“ und schließlich auf „Aus dem Web“:

Quelle: Microsoft  

Schritt 3: Fügen Sie Ihre Ziel-URL hinzu

 

Ein neues Dialogfeld für die Webabfrage wird geöffnet. Fügen Sie nun die Ziel-URL, die Ihre Zieldaten enthält, die Sie erfassen möchten, in eine Tabelle ein. Klicken Sie nun auf „Importieren“. Wichtiger Hinweis: Excel erkennt automatisch alle Tabellen, die in Ihrer Ziel-URL vorkommen. Es wird ein kleiner gelber Pfeil neben den verschiedenen Tabellen auf der Website / im Dialogfeld angezeigt. Klicken Sie auf den Pfeil neben der Tabelle, aus der Sie Daten erfassen möchten. Der Pfeil wird dann zu einem grünen Häkchen. Erst wenn Sie dies für alle Tabellen, die Sie interessieren, getan haben, klicken Sie auf „Importieren“.  

Quelle: Dummies  

Schritt 4: Entscheiden Sie, wohin die Daten importiert werden sollen

 

Excel zeigt nun das nächste Dialogfeld an: „Daten importieren“. Wählen Sie nun entweder Ihr neu geöffnetes und gespeichertes Arbeitsblatt unter der Option „Vorhandenes Arbeitsblatt“ aus oder öffnen Sie ein vollständig „Neues Arbeitsblatt“ und klicken Sie dann auf „OK“.

Quelle: Dummies  

Schritt 5: Warten Sie, bis Excel Ihre Zieldaten importiert hat

 

Je nach Zielwebsite und der Anzahl der zu erfassenden und zu importierenden Datenpunkte kann dieser Vorgang einige Sekunden oder einige Minuten dauern.

Quelle: Dummies  

Webdatenanalyse mit Excel

 

Jetzt können Sie mit Ihren Daten arbeiten, um nützliche Erkenntnisse daraus zu gewinnen. Zum Beispiel können Sie Ihre Zieldaten mit den Excel-eigenen Modellen „Pivot“ und „Regression“ analysieren. Pivot ermöglicht Ihnen die Durchführung von Datenanalysen, die Erstellung von Datenmodellen sowie die Erstellung von Querverweisen auf Datensätze und die Ableitung nützlicher Erkenntnisse aus den gesammelten Informationen. Außerdem können Sie Datensätze und Erkenntnisse in Torten-/Balkendiagrammen darstellen, die sie dabei unterstützen, Datentrends Ihren Mitarbeiter*innen verständlich zu machen.  

Quelle: Essentialplugins

Sehen Sie sich diese ausführliche Hubspot-Anleitung zur Analyse von Datensätzen mit der Pivot-Funktion an. Eine Regressionsanalyse kann Ihnen helfen, die Beziehungen zwischen verschiedenen In- und Outputs zu verstehen. Zum Beispiel die Korrelation zwischen den Kosten eines Artikels und den Werbeausgaben mit den Konversionsraten. Das unterstützt sie dabei, strategische Entscheidungen zu treffen, z. B. welche Werbekanäle am gewinnbringendsten sind (d. h. es lohnt sich, Mittel für das Marketing darauf auszurichten).  

Quelle: excel-easy  

Automatisierte Datenerfassungstools, die Daten in Excel ausgeben

 

Während anonyme Proxys und Proxy-IP-Standorte die über den ganzen Globus verteilt sind, durchaus ihren Nutzen haben, wenn es darum geht, Daten zu erfassen, bietet die vollständige Automatisierung der Datenerfassung Ihrem Unternehmen große Vorteile.  

Web Scraper IDE ist zum Beispiel ein führendes Tool für die Automatisierung des Daten-Scraping. Fachleute, die Zugang zu Informationen benötigen, können einfach ihre Ziel-Website auswählen (egal, wie die Informationen organisiert sind) und erhalten die Datenausgabe im Format ihrer Wahl, auch in:  

  • JSON
  • CSV
  • HTML
  • Microsoft Excel

Für diejenigen unter Ihnen, die die oben erwähnten leistungsstarken Datenanalysewerkzeuge von Excel nutzen möchten, ist es sehr praktisch, dass die Daten mit einem Mausklick direkt in eine Excel-Tabelle ausgegeben werden können. Dies kann für eine Website oder 1000 Websites eingerichtet werden. Web Scraper IDE skaliert den Betrieb je nach dem Bedarf Ihres Unternehmens nach oben oder unten. Das Tool kann auch so programmiert werden, dass es so häufig oder so selten wie nötig Datenpunkte erfasst (stündlich? täglich? wöchentlich? monatlich? jährlich?).

Sind Sie bereit, sich Ihre Zieldaten direkt in die Microsoft Excel-Arbeitsmappe Ihres Teams ausgeben zu lassen?