COVID-19 Fallzahlen in Data Studio Reports nutzen
Aktualisiert: 6. Apr. 2022
COVID-19 beschäftigt uns derzeit alle. Auf unzähligen Webseiten werden weltweit die neuesten Entwicklungen berichtet. Rund um die Uhr sind ForscherInnen und WissenschaftlerInnen auf der Suche nach einem Impfstoff. Zudem haben mehrere Initiativen angefangen, Daten über dessen Entwicklung bereitzustellen. Die beliebte Data-Science-Plattform Kaggle hat nicht nur Wettbewerbe gestartet, bei denen man mit Hilfe maschinellen Lernens wichtige Facetten des Virus systematisiert, sondern sammelt auch Datensätze zum Virus.
Zudem stellt Google die Daten der Johns Hopkins University als “Public Dataset“ über BigQuery zur Verfügung. Dadurch wird es möglich, SQL-Abfragen auf den Datasets durchzuführen sowie diese mit anderen Google Services, wie etwa Google Data Studio, zu verbinden. Um das Angebot nutzen zu können, benötigt man ein Projekt in der Google Cloud Platform, das über gültige Zahlungsdaten verfügt – wobei Datenabrufe in diesem Dataset und jegliche Abfragen darauf bis zum 15. September kostenlos sind.
Die Daten des Datasets werden täglich aktualisiert und lassen sich sehr gut nutzen, um sie mit eigenen Daten oder Reports zu verbinden. In diesem ersten Artikel führen wir euch durch die Einbindung eines Datensatzes in Data Studio.
An der Stelle möchten wir darauf hinweisen, dass sowohl dieser Artikel als auch die Diagramme, die in hier gezeigt werden, lediglich als eine Einführung in Google Data Studio dienen sollen. Wir möchten hiermit keine Aussagen über das Virus und seine Entwicklung treffen. Für den aktuellsten Stand empfehlen wir als erste Quelle den täglichen Lagebericht des Robert Koch Instituts. Dort existiert ebenfalls ein Beispiel eines interaktiven Dashboards.
Verfügt man über ein Google-Konto, ist man direkt eingeloggt, wenn man Data Studio besucht. Das Einbinden einer Datenquelle läuft dann mit wenigen Klicks. Zunächst wählen wir “Create”, dadurch werden wir auf das Menü geführt, in dem wir zwischen einem Report, einer Data Source, oder dem Explorer wählen können.

„Data source“ anklicken
Aufgrund der Auswahl von „Data Source“ werden einem nun mehrere Konnektoren präsentiert. Hier wählen wir BigQuery.

Den BigQuery Konnektor auswählen
Hat man noch nie Google Cloud benutzt, muss man ein Projekt erstellen, unseres haben wir “pp-examples” genannt.

Anschließend hat man die Möglichkeit, Datasets und Tabellen auszuwählen. Wir werden mit der Tabelle summary in dem Dataset covid19_jhu_csse_eu arbeiten.

Die summary Tabelle auswählen

Per „Connect“ mit der Tabelle verbinden
Befindet man sich außerhalb Europas, z.B. in den USA, so steht ein anderes Dataset zur Verfügung (covid19_jhu_csse), das auf amerikanischen Servern gehostet wird. Jedes Dataset mit dem Präfix covid19 und jede darin enthaltene Tabelle stellt unterschiedliche Informationen über das Virus und seine Entwicklung bereit. Weitere Datasets lassen sich über den Marketplace erkunden.

Liste mit allen Dimensionen und Metriken
Nun können wir einen Bericht erstellen und klicken dazu im Menü nicht auf wie vorher auf Data Source, sondern auf „Report“.

„Report“ anklicken
Ein Report kann nicht ohne Daten existieren, deshalb wird man direkt aufgefordert, einen Datensatz zu selektieren. Aus der Liste „My data sources“ wählen wir nun den die vorher angebundenen Daten. Dem Report wird anschließend automatisch eine einfache Tabelle mit den Spalten province_state und Record Count eingefügt.

Unter „My data sources“ den Datensatz „summary“ auswählen
Wie man nun verschiedene Grafiken erstellt, um den Datensatz auszuwerten, zeigen wir im nächsten Blog-Post.