První krůčky s Google BigQuery
Na Marketing Festivalu 2024 jsem navštívila workshop vedený Vaškem Jelenem, který se věnoval základům v Google BigQuery. Upřímně? Šla jsem tam hlavně proto, že to byl jediný technicky zaměřený workshop, který se to dopoledne konal. Ale odešla jsem s úplně novým pohledem na práci s daty z GA4.
Co je Google BigQuery a proč se vyplatí ji používat s GA4
BigQuery je cloudová databáze od Googlu, která je stavěná na zpracování obřích objemů dat. Pokud jste někdy zkoušeli tahat měsíce návštěvnosti e-shopu do Excelu a čekali, kdy začne počítač hulákat o pomoc, BigQuery je přesně ten nástroj, který vám zachrání nervy i hardware. Proč?
- Je to plnohodnotná databáze, žádný "větší sheets"
- Pracujete v ní s SQL (dialekt GoogleSQL)
- Platíte za dotazy resp. za zpracovaná data, ne paušál (a první jsou zdarma, yay)
- Dobrá integrace s GA4 (a GAds, Search konzolí a spol) -> Google si rád hraje sám se sebou
Výhodou je také to, že na BigQuery (BQ) můžete napojit i další služby, třeba GAds, Meta, vaše CRM a importovat data v různých formátech. A z pohledu někoho, kdo se v datech rád hrabe a zkoumá je, není nic krásnějšího než mít data v hezky na jednom místě.
Proč GA4 a BigQuery dávají dohromady smysl?
GA4 jsou fajn, ale mají dost omezení – samotná data GA4 nejsou špatná, ale pořádně chutnat začnou až v BigQuery. Tam se totiž dají filtrovat, řadit a analyzovat bez všech těch klikacích omezení v GA rozhraní. A navíc, co je možná to nejpodstatnější – GA4 rozhraní data defaultně po dosažení určitého počtu eventů sampluje. Pokud máte web, na kterém se toho děje dost (aka průměrný eshop), spoustu toho nevidíte. V BigQuery se tohle samplování neděje - máte raw data. A jen z nich zjistíte, jak váš web opravdu funguje.
Jak začít s BigQuery: první SQL dotazy
Pokud jste v SQL nováčci jako jsem tenkrát byla já, nebojte se. Začít můžete s jednoduchými dotazy a postupně se učit složitější věci. V případě BigQuery platíte za zpracovaná data, takže se nemusíte bát, že vás zrujnuje. Co je na začátek nejlepší - Google nabízí kredit zdarma a před spuštěním každého dotazu uvidíte, kolik dat bude dotaz zpracovávat.
Ve správě účtu se navíc dají nastavit limity, které vám pomohou kontrolovat náklady a zabrání nečekaným výdajům.
Jak propojit GA4 s BigQuery
A jak začít? Nejdřív si musíte BigQuery s GA4 propojit. Jak na to? Podívat se můžete např. na:
Důležité upozornění: Data se nedoplňují zpětně. Export začne až od chvíle propojení, což je další důvod nastavit vše co nejdřív.
Jak pracovat s GA4 daty v BigQuery (tabulka events)
Pár dní uběhlo, data máte a chcete se na ně konečně podívat. Jak na to?
- Projděte si, jaké je vůbec schéma a struktura GA4 events tabulky - co řádek, to event (zobrazení stránky, click, scroll...).
- Začněte s jednoduchými SELECT dotazy – vyberte si pár sloupců a zkuste je zobrazit.
- Naučte se, jak funguje práce s datumem v GA4 tabulce eventů
Jak takový jednoduchý dotaz může vypadat? Třeba vás zajímá celkový počet zobrazení stránky v lednu 2025:
SELECT
COUNT(event_name) AS pocet_pageviews
FROM
`projekt.dataset.events_*`
WHERE
_TABLE_SUFFIX BETWEEN '20250101' AND '20250131'
AND event_name = 'page_view'
;
Nebo vás zajímá, kolik uživatelů přišlo celkem na stránky? A z jakého zdroje?
-- přeformátování datumu z názvu tabulky
SELECT
FORMAT_DATE('%Y-%m-%d', PARSE_DATE('%Y%m%d', _TABLE_SUFFIX)) AS den,
COUNT(DISTINCT(user_pseudo_id)) AS pocet_users, -- unikátní uživatelé
-- vytahání utm parametrů
traffic_source.source AS zdroj,
traffic_source.medium AS medium,
traffic_source.name AS kampan
FROM
`projekt.dataset.events_*`
WHERE
_TABLE_SUFFIX BETWEEN '20250101' AND '20250131'
GROUP BY
den,
zdroj,
medium,
kampan
ORDER BY
den
;
Jestli si nejste jistí, jak na to, nebojte se podívat na oficiální dokumentaci Google BigQuery nebo SQL tutoriály na W3Schools. Existuje také spousta online kurzů a videí, které vás provedou základy SQL. A v době AI není nic snazšího, než si nějakého chatbota napromptovat tak, aby vám s konkrétními dotazy pomohl, nebo je zoptimalizoval.
Kolik BigQuery stojí a jak hlídat náklady?
BigQuery je velmi dostupná služba, pokud víte, jak s ní pracovat. Abyste se vyhnuli překvapením, držte se pár jednoduchých pravidel:
- Před spuštěním dotazu vždy sledujte odhadovanou velikost zpracovaných dat.
- Používejte _TABLE_SUFFIX a filtrujte jen potřebná období.
- Nedělejte
SELECT *, pokud nepotřebujete všechno. A to fakt nepotřebujete. - Pracujte s CTE, a zvažte vytvoření tzv. T0.
Co to je T0? Předpřipravená tabulka těch "sloupečků", které vás nejčastěji zajímají. Proč je to dobrá věc? Nemusíte pořád dotazovat na base events tabulku a do budoucna vám ušetří čas i peníze.
A věřte mi, jakmile se do BigQuery jednou vrhnete, budete se nořit hlouběji a hlouběji, chtít víc a dotazy budou větší, komplexnější a nedejbože až si nad nimi postavíte první dashboard v Lookerstudiu (o tom příště).
A kolik že to teda vlastně stojí? Pro běžný e-shop stojí používání BigQuery často jen pár korun měsíčně. Vyšší částky přichází až u velmi velkých datasetů nebo pravidelných komplexních dotazů.
Závěr: BigQuery není strašák
Workshop mi ukázal, že BigQuery není nástroj jen pro „datové hardcore analytiky“. Je to místo, kde konečně získáte data bez omezení, raw informace ze zákulisí vašeho webu a možnost tvořit si vlastní metriky bez kompromisů.
Pokud s GA4 teprve začínáte nebo vám v klasickém rozhraní něco chybí, BigQuery doporučuji vyzkoušet. Stačí pár základních SQL dotazů a začnete chápat, jak jsou vaše data skutečně poskládaná – a to je neuvěřitelně osvobozující.
Takže pokud jste to dočetli až sem, můj tip zní: Prostě začněte. Propojte GA4 s BigQuery, začněte s jednoduchými SQL dotazy. Na začátku to nestojí nic. Vaše budoucí já vám poděkuje.
A hlavně: není to magie. A je to návykové.
Kdyby vás kolem BigQuery zajímalo něco dalšího, dejte vědět. Třeba z toho vznikne další článek.