- BBM, browser-based
measurement (misurazione basata sul browser)
- Questo tipo di misurazione avviene sempre sulla base di dati
registrati in file di log,
ma la generazione dei log non è più
determinata dall’attività del server web
bensì dal caricamento nel browser dell’utente di un
apposito frammento di codice, denominato page
tag. Si tratta in genere di alcune righe contenenti un
javascript, il cui compito è di inviare una
richiesta HTTP al server addetto alla registrazione del
traffico-web, per informarlo che è stata generata una
page impression (1).
Questo metodo di rilevazione offre alcuni indubbi
vantaggi:
- Consente ad esempio di superare il problema – tipico
delle misurazioni
site-centric - di definire dei filtri omogenei per
separare i tipi di file associabili ad una page view (HTML, ASP,
ecc.) dai tipi di file non associabili (JPG, GIF, PNG,
ecc.). Con il sistema dei page tag, infatti, solo i file
che contengono l’apposito frammento di codice javascript
sono in grado di generare una page impression. I
responsabili tecnici del sito potranno così di volta in
volta valutare se e dove inserire il codice in questione
(2).
- Consente di eliminare l’incertezza legata alla
non quantificabile interfenza di strumenti di caching interposti tra il
server web ed i visitatori del sito. Infatti anche le pagine
recuperate da cache locali, se dotate
dell’opportuno page tag, invieranno al server
deputato della registrazione dei log le chiamate
necessarie a generare una page impression.
Per contro, la misurazione basata sul browser presenta anche
degli svantaggi:
- In primo luogo, va tenuto presente che le statistiche di
traffico generate con questo sistema riguardano solo ed
esclusivamente le pagine in cui è stato inserito, e
nel modo corretto, l’apposito page tag. Ciò
significa che, laddove vi sia una realtà aziendale molto
complessa - con molti siti da monitorare, moltissime pagine
pubblicate e numerose persone addette al processo produttivo
–, sarà molto difficile (per non dire impossibile)
avere la certezza che la totalità delle pagine da
sottoporre ad analisi statistica sia stata effettivamente
modificata con l’inserimento dell’opportuno codice
javascript. Si rischia cioè, con l’andar del tempo,
di trovarsi di fronte ad un nuovo tipo di incertezza: di
non sapere, cioè, se le rilevazioni del traffico
browser-based di cui si è in possesso coprano la
totalità degli accessi effettuati ai propri siti e siano
perciò davvero attendibili (3).
- La presenza – per quanto minima e tendenzialmente non
avvertibile – di un ritardo nel caricamento della
pagina, dovuto alle chiamate HTTP aggiuntive presenti nel codice
del page tag, indirizzate – nel caso che il
servizio sia fornito da terzi – ad un server differente da
quello che ospita il sito.
Esistono molti società che offrono servizi di rilevazione
statistica basati sul browser, sia gratuiti sia a pagamento.
Spesso la formula prevede un’offerta base gratuita ed una,
più completa, a pagamento. Tra i fornitori di statistiche
di tipo BBM citiamo FreeStats,
Sitetracker,
SuperStats di MyComputer.com,
ShinyStat, Site Stats. Una
menzione particolare merita RedSheriff, con sedi in
oltre 30 nazioni, che sta assumendo un ruolo di primo piano a
livello internazionale nella fornitura di servizi professionali
BBM.
- Site-centric measurement (misurazione
centrata sul sito)
- La fonte principale per questo tipo di rilevazione sono i file di log che registrano
l’attività del server web. Il limite maggiore di
tale metodo è da ricercarsi nella scarsa
corrispondenza tra le registrazioni dei log e
l’effettiva attività dei visitatori del sito. Vi
sono infatti molti fattori che generano incertezza. Tra
questi:
- la difficoltà di definire univocamente quali
tipi di file sono da considerare “pagine” e quali no;
- il caching delle
pagine effettuato da proxy
server, motori di ricerca, browser utente, ecc. Non vi
è modo di sapere il rapporto esatto tra le page
view registrate nei log e le pagine fornite dai
vari sistemi di caching interposti tra server web ed
utente finale;
- l’assegnazione di IP
dinamici agli utenti da parte di server DHCP: non è possibile sapere
né se visite successive eseguite da uno stesso IP
provengano da una stessa persona né se visite successive,
eseguite da IP differenti, provengano da persone diverse o da un
medesimo utente a cui sia stato assegnato dinamicamente un nuovo
IP.
Tra i vantaggi offerti dalle misurazioni site-centric
c’è la possibilità di sottoporre i propri
log file all’analisi di una società terza,
avente funzioni di ente certificatore dei dati di
traffico registrati (4). La
certificazione riguarda essenzialmente due punti:
- l’autenticità delle registrazioni
dell’attività del web server;
- l’accuratezza delle statistiche da esse
derivate.
L’utilità commerciale di simili certificazioni
è notevole, in quanto, conferendo un valore
“quasi” oggettivo alle statistiche di traffico di un
sito, aumenta di conseguenza la forza di contrattazione nella
vendita di spazi pubblicitari: la certificazione infatti accresce
la fiducia dell’acquirente nella
possibilità di ottenere un numero di ad impression realmente commisurato
al numero di page view dichiarato.
- User-centric measurement (misurazione
centrata sull’utente)
- Questo tipo di misurazione è completamente differente
dalle altre due. Non si tratta, infatti, di un’elaborazione
statistica effettuata a partire dai dati registrati nei file di
log; si tratta piuttosto di una vera e propria
indagine di mercato, basata su elementi tipici del
settore:
- un campione di popolazione significativo del tipo di
utenza che si vuole misurare;
- uno strumento per la rilevazione del comportamento
degli individui che compongono il campione, applicato ai loro
computer ed in grado di monitorare attimo per attimo qualsiasi
tentativo, riuscito o non riuscito, di navigazione su
Internet;
- strumenti statistici studiati per effettuare
proiezioni più o meno attendibili, che estendono
alla totalità della popolazione i dati ricavati
dall’analisi del campione.
La validità delle proiezioni di traffico ricavate per
mezzo di indagini di mercato è strettamente dipendente
dalla significatività del campione selezionato
– che è evidentemente una variabile difficilmente
quantificabile – e dalla raffinatezza ed
affidabilità degli strumenti statistici
adoperati.
Esistono diverse società che effettuano ricerche di questo
tipo. Tra esse citiamo Nielsen//NetRatings,
Jupiter
MMXI, NetValue.
(1) Si parla
in questo caso di page impression e non di page view per analogia con
il meccanismo di registrazione di un ad impression: la presenza
cioè nella pagina HTML di un frammento di codice
specificamente destinato a generare la registrazione di un
accesso in un file di
log.
(2) I filtri
applicabili ai file di log di un web server di solito
includono o escludono dalla registrazione un’intera
categoria di file, anche se è comunque possibile
personalizzare i filtri, in modo tale da creare per ogni
categoria le opportune eccezioni. In ogni caso, agire tramite
filtri sulle registrazioni dei log, allo scopo di tener conto
quotidianamente della mutevole struttura delle pagine e dei
contenuti di un sito, richiede sicuramente più
attenzione e lavoro che non decidere, caso per caso, di
includere oppure no in una nuova pagina il codice javascript che
determina la registrazione di una page
impression.
(3) Si
potrebbe pensare di fugare i dubbi incrociando i dati di traffico
browser-based con i dati ricavati dai normali file di
log. Va tenuto presente, però, che tale
comparazione è estremamente difficile e tutto sommato
poco attendibile: infatti i dati relativi
all’attività del web server sono influenzati in una
misura non quantificabile da una serie di fattori di incertezza
(proxy, caching, IP dinamici), che si
riverberano inevitabilmente sulla possibilità di
confrontare in modo utile i dati statistici provenienti dalle due
fonti.
(4) Per la
Gran Bretagna e l’Irlanda questa funzione è svolta
da ABC Electronic. Le sue
certificazioni avvengono sulla base di una serie di standard
definiti da un consorzio volontario di aziende, lo IFABC
(International Federation of Audit Bureaux of
Circulations). Le definizioni dei dati standard soggetti a
rilevazione sono consultabili in Rete alla pagina http://www.ifabc.org/web/index.html.