GCP BI Engine Nutzung mit Data Studio
Aktualisiert: 6. Apr. 2022
Google Cloud BI Engine für BigQuery ist aktuell noch in Beta und soll wiederholte Anfragen hin zu BigQuery stark beschleunigen.
Um BI Engine zu nutzen muss man dies für ein Projekt aktivieren. Man kann aktuell für verschiedene Regionen bis zu 10 GB freischalten. Diese 10 GB werden dann für alle Verbindungen, die von Data Studio ausgehen, genutzt.
Eine gute Anleitung findet sich direkt unter Google Cloud BI Engine Docs.
Wenn Sie viele Datasets und große Tabellen in Ihren Projekten haben werden Sie nicht unbedingt für jede Abfrage eine Beschleunigung erkennen. Man bemerkt zwar schnell in Data Studio, dass die Google Cloud BI Engine große Auswirkungen hat, konnte aber bis vor kurzem nur raten, ob es damit zu tun hat.
BI Engine in Data Studio
Das ist jetzt anders. Wenn Sie in Data Studio einen Report editieren und z.B. eine Tabelle angelegt haben werden Sie oben rechts ein Symbol erkennen können, das entweder als grauer Blitz oder durchgestrichener Blitz dargestellt wird. Der Blitz zeigt, ob die Daten hinter der Tabelle beschleunigt werden.

keine Beschleunigung der Daten
Sie können das auch im Sub Menü eines Charts nachsehen, indem Sie auf die 3 Punkte klicken und dort Diagnose Query Performance auswählen.

DropDown Menü in Data Studio
Der Klick liefert jetzt zwei Ergebnisse als Overlay. Entweder die Daten im Chart / Tabelle werden beschleunigt oder sie werden nicht beschleunigt.

Tabelle wird beschleunigt
Sollte es Probleme geben oder wenn die Tabelle eine View ist oder aber eine Custom Query im Connector gewählt wurde, dann findet aktuell keine Zwischenspeicherung der Daten statt.

Tabelle wird nicht beschleunigt
Die BI Engine gleicht einem großen Cache. Ähnlich wie es in der EXASolution Datenbank der Fall ist werden die Daten der verschiedenen Abfragen in BI Engine abgelegt, damit diese sofort verfügbar sind. Die Abfragen, die häufig gemacht werden bleiben im Cache.
Wenn der Cache zu voll wird werden die wenig genutzten Tabellendaten wieder entfernt. Die Daten erfahren nicht immer eine Beschleunigung, speziell bei vielen großen Tabellen. Diese treten leicht in Konkurrenz zueinander bei der Ausnutzung des Caches. Hier kann es sich sonst empfehlen die Daten in Projekte aufzuteilen. Vermutlich wird aber nach dem Verlassen der Betaphase das 10GB noch erhöht.
Die Beta Phase ist kostenlos. Ein Test lohnt sich, denn die Daten laden deutlich schneller als zuvor.