Webová analytika: metody a překážky, které byste měli znát
Weboví analytici čelí v posledních letech jedné výzvě za druhou. Ať už jde o „cookie lištu”, blokátory javascriptů nebo o blížící se konec oblíbených Google Universal Analytics. Pro výběr vhodných analytických nástrojů či správnou interpretaci dat je tak nutné ponořit se hlouběji do různých metod měření a znát jejich výhody a nevýhody. Víte jak funguje (nejen) fingerprint, pixel nebo server-side měření?
Pro e-shopy, firemní weby i blogy je webová analytika základním odrazovým můstkem pro rozhodování v oblasti marketingu či obchodu. S její pomocí lze třeba odhadnout hlavní prodejní sezóny a cykly, nasměrovat budget a marketingové kapacity do těch správných kanálů nebo pochopit chování zákazníků na webu.
Abychom však dokázali vytěžit použitelnou informaci, musíme nejprve implementovat vhodné měření, sesbírat dostatečná data a správně je interpretovat. Proto se vyplatí znát různé metody měření a počítat s překážkami, které jsou s nimi spojené. Seznamte se s výhodami a nevýhodami nejčastějších přístupů k webové analytice.
VPS pro vaše weby
Pořiďte si kvalitní VPS s SSD disky a plnou virtualizací pro hladký běh vašich webových stránek. Parametry, operační systém i doplňkové služby si zvolíte podle vlastních potřeb.
Sběr dat: javascript a pixel
Naprostým základem webové analytiky je dostat data o chování uživatelů do analytických nástrojů. Existuje hned několik přístupů, které mají své klady a zápory. Mezi ty nejrozšířenější patří javascript a pixel.
Velkou výhodou javascriptu je snadné nasazení a rozsáhlé možnosti. Velmi snadno se implementuje přes Google Tag Manager, který pro své i cizí služby nabízí zjednodušené šablony. Vložit však jde i měřící kódy dalších stran (přes vlastní HTML značku).
Ve chvíli, kdy jsou splněny podmínky, například načtení stránky, spustí se javascript, který odešle analytickému nástroji potřebné informace. Sledovat tak lze kliknutí na tlačítko, odeslání formuláře nebo třeba stažení souboru.
Naopak nevýhodou, již pociťují weboví analytici stále ve větší míře, je vliv blokátorů javascriptů (např. Ad Blocker nebo Ghostery). Výsledkem jsou pak chybějící data, což zkresluje analytické výstupy.
Dalším způsobem, jak sledovat chování uživatelů na webu, je použití pixelu. Zde je na místě říct, že se často jako „pixel” označuje i javascriptová značka. V kontextu následujících odstavců je však pixelem myšlen skutečný pixel. Tedy obrázek o velikosti 1×1 pixel umístěný na webové stránky, který při svém načtení odesílá informace analytickému nástroji.
Výhodou pixelu oproti javascriptu je odolnost vůči blokátorům skriptů. Nevýhodou je náročnější implementace a omezenější možnosti odesílání informací. Nasazení často vyžaduje i programovací schopnosti.
Vhodnou variantou měření může být i kombinace javascriptu a pixelu. V případě, kdy se javascript nespustí, odešlou se alespoň nějaké informace díky pixelu. Ten lze sice také zakázat, ale zatím se to děje ve významně menší míře než v případě javascriptu.
Cookies, local storage IP a fingerprint
Uživatel je obvykle středobodem, kolem kterého se točí celá webová analytika. Navazují se na něj návštěvy a akce, což dává obrázek o tom, jak se potenciální zákazníci na webu chovají. Jak ale analytické nástroje konkrétního uživatele identifikují?
Cookies
Nejznámější možností je prostřednictvím cookies. Cookies jsou malé textové soubory o maximální velikosti 4 KB, které se ukládají z webového serveru do prohlížeče (zařízení) uživatele. Při příští návštěvě stejné stránky se pak informace z cookies načtou a identifikují daného uživatele. Díky tomu lze usnadnit používání webu a uživatel se například nemusí opakovaně přihlašovat nebo mu v košíku zůstane naklikané zboží.
Do cookies může webový server uložit jakoukoliv informaci a právě toho se využívá pro analytické a marketingové účely. Analytické nástroje pak mohou uživatele identifikovat a zjistit, že určité zobrazení stránky je pokračováním jeho návštěvy nebo že se na web vrací opakovaně.
S pomocí cookies jde cílit reklamy na konkrétní skupinu lidí, což je velká výhoda. E-shop s elektronikou tak může zobrazovat nabídku svých televizí segmentu uživatelů, kteří třeba za posledních 30 dní navštívili článek na blogu o tom, jak správně vybrat televizi. Šance, že takový zákazník díky bannerové reklamě nakoupí, je mnohem vyšší, než kdyby se zobrazovala necíleně.
Z pohledu analytiky jsou však cookies čím dál problematičtější a nelze se na ně spolehnout. Každý uživatel si může svobodně zvolit, že soubory cookie ve svém prohlížeči prostě zakáže. V takovém případě ho nelze na základě nich identifikovat. Cookies si může taky v libovolnou chvíli smazat a navíc se soubory cookie po určitém čase mažou automaticky.
Jako třešnička na dortu přibyla v Česku od začátku roku 2022 povinnost informovat uživatele o ukládání dat a vyžadovat jejich souhlas. Novelizovaný zákon, který tuto povinnost stanovuje, se však netýká pouze cookies.
Všechny tyto nekonzistence cookies mají za následek neúplná či zkreslená data, která je nutné brát s rezervou a v kontextu. Pokud třeba prodáváte auta, asi těžko uvěříte informaci, že 90 % lidí si vůz koupilo hned při první návštěvě. Rozhodovací proces je zde obvykle mnohem delší. V analytickém nástroji se však tato informace objeví, protože je zkreslená právě vlivem mazání cookies.
Zákon o (nejen) cookie liště
Od začátku roku 2022 platí v Česku novela zákona o elektronických komunikacích, která zavedla zásadní změnu ohledně zpracování údajů pro analytické a marketingové účely. Zatímco předtím platila povinnost pouze informovat a dát uživateli možnost odmítnout sběr jeho údajů, od ledna 2022 je nutné, aby návštěvník webu udělil prokazatelný souhlas. Dokud ho neudělí, je možné ukládat údaje výhradně jen pro technické účely.
Souhlas uděluje návštěvník nejčastěji skrz tzv. „cookie lištu”. Nenechte se ale zmást tímto zaběhlým označením. V klíčovém ustanovení (§ 89, odstavec 3 novelizovaného zákona č.127/2005 Sb) se nemluví jen o cookies, ale obecně o ukládaných údajích, jež pomáhají identifikovat koncová zařízení. Jedná se tak vlastně o všechny metody, které přiřadí akce a události k danému uživateli.
Důraz je navíc kladen i na to, aby bylo možné vybrat, který typ cookies uživatel povoluje, a aby byl jeho souhlas co nejvíce svobodný (nezmanipulovaný). Je proto otázkou, nakolik je možné cookie lištu uzpůsobit tak, aby přiměla uživatele kliknout na souhlas, například barevným zvýrazněním. Přesnější hranice, jak má „cookie lišta” vypadat, pravděpodobně časem vyplyne z praxe Úřadu pro ochranu osobních údajů (ÚOOÚ).
Local storage a IP
Local storage funguje velice podobně jako cookies, akorát s tím rozdílem, že do zařízení uživatele je možné uložit až 5 MB dat a především, že se data po ukončení relace či po určitém časovém období automaticky (v základním nastavení) nemažou.
Nevýhodou využití local storage je menší ochrana osobních údajů uživatele než u cookies (kvůli absenci automatického mazání souborů), což může být problém zejména u přihlašovacích či citlivých údajů. Podobně jako u cookies lze ukládání dat do local storage zakázat či blokovat, není to však tolik rozšířené jako v případě cookies.
Oproti cookies a local storage je identifikace pomocí IP adresy trochu z jiného soudku. Není totiž vázaná na konkrétní zařízení (prohlížeč), ale na připojení k síti. To znamená, že pokud 2 uživatelé, například ze stejné domácnosti nebo firmy, navštíví vaše stránky, budou se podle IP adresy tvářit jako jeden uživatel.
Dalším problémem je, že IP adresu si lze změnit připojením přes VPN. Pokud se jedno zařízení připojuje z různých míst, tak pouhá IP adresa neidentifikuje, že se jedná jedná o stejného uživatele. I tak může ale dobře sloužit alespoň k orientační identifikaci.
Shromažďování IP adres s sebou nese zvláštní zákonná rizika. Kromě nutnosti souhlasu v rámci „cookie lišty” může být i v rozporu s GDPR. Této problematice se blíže věnuje článek na Lupa.cz, z kterého vyplývá, že IP adresa by sama o sobě neměla být osobním údajem. Pokud se ale skladuje s dalšími informacemi, jako je například jméno či e-mailová adresa (typicky z webových formulářů), tak se již o osobní údaj jedná.
Fingerprint
Další pokročilou možností, jak identifikovat uživatele, je tzv. fingerprint. Tato metoda využívá celého souboru údajů, které by samostatně nestačily. Pokud se ale zkombinují, lze získat relativně jedinečný profil uživatele.
Mezi tyto údaje patří: prohlížeč, operační systém a jeho verze, nainstalovaná rozšíření v prohlížeči, jazyk prohlížeče, typ a značka zařízení, prefix IP adresy (skladování pouze prefixů IP adres by mělo být z pohledu GDPR v pořádku), velikost obrazovky, časové pásmo a další.
Postup identifikace uživatele vypadá zhruba takto: Dejme tomu, že konkrétní prohlížeč používá milion lidí, z toho ale jen 10 tisíc je ve stejném časovém pásmu, z toho má danou velikost obrazovky už jen 100 lidí, totožná nainstalovaná rozšíření už budou mít třeba jen 3 lidi, a ti mají odlišný prefix IP adresy. Tímto způsobem lze získat jedinečný fingerprint uživatele.
I zde však platí, že je ze zákona nutné návštěvníky dostatečně informovat a počítat s tím, že ne vždy se vlivem různých blokátorů a nastavení prohlížeče podaří sesbírat celý mix údajů. Fingerprint tak často funguje spíše na pravděpodobnostní bázi.
Client-side vs. server-side měření
Většina analytických nástrojů používá tzv. client-side měření, kde se data sbírají z prohlížeče uživatele a následně se odesílají do analytických nástrojů. Zmíněné překážky s cookies, ochranou osobních údajů či blokátory skriptů však nutí větší weby přecházet na tzv. server-side měření.
Jako všechny metody, má i server-side své klady a zápory. Mezi klady rozhodně patří větší kontrola nad nasbíranými daty. Na serveru, kde se vše ukládá, je možné data očistit a až poté je odeslat analytickým nástrojům. Díky tomu lze zaručit svým návštěvníkům, že třetím stranám nebude předáno nic navíc.
Dalším pozitivem je větší spolehlivost. Při server-side měření se vyhneme nekonzistenci dat kvůli blokátorům javascriptů. Výhodou je i rychlejší načítání stránek, kdy se namísto odesílání dat několika třetím stranám, pošlou data jen na jeden server, který je dále zpracovává a odesílá.
Druhou stranou mince je podstatně složitější implementace, jež vyžaduje pokročilejší znalosti. Nevýhodou jsou i vyšší náklady. Když pomineme lidskou práci na nasazení, je nutné mít pronajatý server, kde se data budou ukládat. Problémem může být i omezenější množství metainformací o uživatelích, které lze oproti client-side měření získat.
Sběr dat na straně serveru se tak vyplatí zejména těm, kdo chtějí mít co nejpřesnější data o chování uživatelů na stránce (nikoliv o jejich demografických údajích a dalších metadatech) nebo institucím, které potřebují kontrolovat, jaká data se odesílají třetím stranám (např. banky či aplikace veřejné správy).
Jaký přístup k analytice zvolit?
Ať už zvolíte jakýkoliv přístup, musíte si toho být hlavně vědomi a znát možná „Z”, která ovlivňují vaše „X” a „Y”, to je základní poučka metodologie. Pokud spoléháte na cookies a javascript, nepropadejte panice, když vám kontinuálně padá návštěvnost, ačkoliv nevidíte problém v žádné ze svých marketingových aktivit. V takovém případě je tím „Z” zřejmě počet lidí zakazující skripty a návštěvníci, kteří blokují cookie lištu nebo zkrátka neudělili souhlas.
Menším projektům nemusí i tato stále větší nekonzistence dat vadit. Důležité je pro ně zejména sledování trendů ve srovnatelných měsících. Pokud tedy v lednu 2022 vešel v platnost zákon o cookie liště, asi těžko lze data porovnávat s prosincem či lednem 2021. Srovnání s únorem 2022 už ale bude relevantní.
Pokud si významnější nekonzistenci dat nemůžete dovolit a potřebujete je mít k dispozici v co nejpřesnější formě, sáhněte po server-side měření a dalších pokročilých možnostech. Bude to sice stát náklady navíc, ale kromě přesnosti získáte i kontrolu nad tím, jaká data se odesílají třetím stranám a bude tak chránit osobní údaje svých uživatelů.