Dvěma nejrozšířenějšími metodami pro získávání údajů
o návštěvnosti internetových prezentací je log soubor webového
serveru a měřící tečka (neboli sběr dat pomocí aktivního obsahu,
Javascript Page Tags). Účelem tohoto příspěvku není nic jiného, než
shrnout výhody a nevýhody obou metod.
Je nasnadě, že pokud jsou v současné podobě používány obě
metody (a nejen ony, ale řekněme, že tyto dvě jsou nejrozšířenější),
nebude jedna znatelně lepší než druhá. Obě mají své výhody a nevýhody,
každá má svoje specifika, která mohou v určitých případech zcela
znemožnit jejich použití. I proto mnoho moderních nástrojů používá
kombinaci obou metod, čímž se snaží dosáhnout co nejkompletnějších a
nejpřesnějších výsledků.
Měření pomocí log souboru
Výhody
- Zaznamenává i přístupy od uživatelů, kteří nemají zapnuty
javascript či cookies
- Zaznamenává přístupy robotů, které mohou být využity ke sledování
toho, jak je prezentace indexována vyhledávači (důležité pro SEO
optimalizaci webu)
- Umožňuje sledovat stahování různých typů souborů (ne pouze www
stránky) – log soubor obsahuje všechny požadavky, které byly na
webový server zaslány
- Pokud máme k dispozici příslušné log soubory, je možné
provádět analýzu i zpětně
- Data (log soubory) jsou obvykle analyzovány programem na lokální stanici
a nejsou tak ukládána ani zasílána třetí straně, která by je mohla
potenciálně zneužít nebo nedopatřením ztratit.
- Log soubory mohou být analyzovány více nezávislými nástroji –
odpadá závislost na jednom dodavateli softwaru.
- Umožňuje sledovat stavové kódy serveru pro identifikaci chyb na webu či
na serveru
- Umožňuje sledovat objem přenesených dat – log soubor může
obsahovat položku bytes sent, díky které je možné sledovat provozní
zátěž serveru (má význam pouze pro plánování výkonu serveru nebo jeho
konektivity)
Nevýhody
- Používání cache velmi ovlivňuje přesnost statistik (pokud je stránka
načtena z cache prohlížeče nebo proxy serveru, není tento přístup
zaznamenán v log souboru)
- Proxy servery a dynamické IP adres ztěžují identifikaci unikátního
návštěvníka (v případě proxy serveru se pod jednou IP adresou může
skrývat více uživatelů a v případě dynamické IP může být jednomu
návštěvníkovi přiděleno více IP adres)
- Velmi málo informací o nastavení klientského počítače (což
ovšem nemusí být velká nevýhoda, protože většinou nás zajímá spíše
chování návštěvníka na stránce
Měření pomocí aktivního obsahu
Výhody
- Statistiky nejsou zkreslené používáním cache (měřící tečka je
díky unikátnímu URL načtena vždy)
- Více návštěv z jedné IP adresy může být rozeznáno jako jeden
unikátní návštěvník díky identifikaci pomocí cookies (stejný
mechanismus je nicméně použitelný i pro log soubor).
- Poskytuje více informací o nastavení počítače
návštěvníka
- Je možné do jisté míry sledovat také pohyb návštěvníka
v rámci jedné stránky
Nevýhody
- Nutnost vložit do každé stránky měřící kód – to může jednak
zpomalit načítání stránky, ale také může vést k chybám –
pokud na jednu ze stránek zapomeneme přidat měřící kód, bude toto
opomenutí zkreslovat statistiky (zvláště potom analýzu obvyklých cest
návštěvníka internetovou prezentací)
- Nelze měřit historická data – data o návštěvnosti se
začnou shromažďovat až v okamžiku umístění měřícího kódu do
stránky.
- Nezaznamenává přístupy robotů (ti neumí interpretovat
Javascript.).
- Data jsou často uložena na cizím serveru a není možné je jednoduše
konvertovat do jiného analytického nástroje.
Zdroje
- HARRISON,M.: Collecting
Web Data: A Look at Web Analytics Methodology
Související články