In der letzten Woche des Trainings geht es noch einmal zur Sache. Ziel ist es jeden Tag ein Dashboard zu entwerfen und gegebenenfalls Daten zu präparieren. Heute an Tag 1 war die Aufgabe mindestens 20 Jahre Daten der Fußball Bundesliga zu webscrapen und in Tableau zu visualisieren. Zudem sollte vor der Nutzung in Tableau ein Sketch des Dashboards entwickelt werden und ein Blog geschrieben werden (dieser hier). Da ich nicht wusste wie lange ich für die Datenpräpartion brauchen werde, habe ich erst im Anschluss des Webscrapings einen Zeitplan entworfen. Im Folgenden beschreibe ich mein Vorgehen innerhalb der einzelnen Phasen.
Webscraping Vorgehen 9:30-12
- Finde ein Muster in der URL, welches du später nutzen kannst mit dem Download Tool in Alteryx.
- Es gibt 18 Vereine in der Bundesliga. Daher wiederholen sich bestimmte Muster immer wieder. Finde den Codeblog für einen Verein und benutze in RegEx die Option tokenize.
- Jetzt gilt es mit RegEx die einzelnen Variablen aus dem HTML Code rauszufischen. Benutze die RegEx Option parse.
- Für Tableau wird die URL der Websites und der HTML Text nicht mehr gebraucht und kann daher entfernt werden mit dem Select Tool.
- Benutze ein Output Tool, um deine Daten ins Hyper Format zu bringen.
Alteryx Workflow

Entwicklung Sketch 12:00-12:30
- Welche "KPIs" sind interessant? Was möchten Sportfans wissen?
- Welche Visualisierungen geben weitere Aufschlüsse und erzählen mehr zur Bundesligageschichte?
- Entwurf der Skizze in Excalidraw.
Rudimentäre Skizze

Tableau 13:30-16:00
- Erstellung weiterer berechneter Felder, die für die "KPIs" und Visualierung benötigt werden.
- Erstellung von KPIs und Visualierungen.
- Dashboard entwicklen und auf Tableau Public veröffentlichen.
Dashboard:

Da die Präsentation der Resultate um 16:30 ist, blieben noch 30 Minuten Zeit diesen Blog zu schreiben. Ziel des Blogs war es die Gedankenprozesse darzustellen. Nach kleinen Startschwierigkeiten hat das Projekt dennoch schnell Fahrt aufgenommen und die Analyse hat sehr viel Spaß gemacht. Wahrscheinlich werde ich mir die Daten für einen längeren Zeitraum erneut angucken. Die ganze Geschichte der Bundesliga ist bei Weitem noch nicht erzählt. Bis dahin.
Cheers, Tobias