[Salta il menu][L'elefantino con la matita, logo del sito]

Diodati.org | Accessibilità e traduzioni dal W3C      Leggi Omega Centauri!

06 Metodi per la rilevazione dei dati di traffico


BBM, browser-based measurement (misurazione basata sul browser)
Questo tipo di misurazione avviene sempre sulla base di dati registrati in file di log, ma la generazione dei log non è più determinata dall’attività del server web bensì dal caricamento nel browser dell’utente di un apposito frammento di codice, denominato page tag. Si tratta in genere di alcune righe contenenti un javascript, il cui compito è di inviare una richiesta HTTP al server addetto alla registrazione del traffico-web, per informarlo che è stata generata una page impression (1).
Questo metodo di rilevazione offre alcuni indubbi vantaggi:

  • Consente ad esempio di superare il problema – tipico delle misurazioni site-centric - di definire dei filtri omogenei per separare i tipi di file associabili ad una page view (HTML, ASP, ecc.) dai tipi di file non associabili (JPG, GIF, PNG, ecc.). Con il sistema dei page tag, infatti, solo i file che contengono l’apposito frammento di codice javascript sono in grado di generare una page impression. I responsabili tecnici del sito potranno così di volta in volta valutare se e dove inserire il codice in questione (2).
  • Consente di eliminare l’incertezza legata alla non quantificabile interfenza di strumenti di caching interposti tra il server web ed i visitatori del sito. Infatti anche le pagine recuperate da cache locali, se dotate dell’opportuno page tag, invieranno al server deputato della registrazione dei log le chiamate necessarie a generare una page impression.

Per contro, la misurazione basata sul browser presenta anche degli svantaggi:

  • In primo luogo, va tenuto presente che le statistiche di traffico generate con questo sistema riguardano solo ed esclusivamente le pagine in cui è stato inserito, e nel modo corretto, l’apposito page tag. Ciò significa che, laddove vi sia una realtà aziendale molto complessa - con molti siti da monitorare, moltissime pagine pubblicate e numerose persone addette al processo produttivo –, sarà molto difficile (per non dire impossibile) avere la certezza che la totalità delle pagine da sottoporre ad analisi statistica sia stata effettivamente modificata con l’inserimento dell’opportuno codice javascript. Si rischia cioè, con l’andar del tempo, di trovarsi di fronte ad un nuovo tipo di incertezza: di non sapere, cioè, se le rilevazioni del traffico browser-based di cui si è in possesso coprano la totalità degli accessi effettuati ai propri siti e siano perciò davvero attendibili (3).
  • La presenza – per quanto minima e tendenzialmente non avvertibile – di un ritardo nel caricamento della pagina, dovuto alle chiamate HTTP aggiuntive presenti nel codice del page tag, indirizzate – nel caso che il servizio sia fornito da terzi – ad un server differente da quello che ospita il sito.

Esistono molti società che offrono servizi di rilevazione statistica basati sul browser, sia gratuiti sia a pagamento. Spesso la formula prevede un’offerta base gratuita ed una, più completa, a pagamento. Tra i fornitori di statistiche di tipo BBM citiamo FreeStats, Sitetracker, SuperStats di MyComputer.com, ShinyStat, Site Stats. Una menzione particolare merita RedSheriff, con sedi in oltre 30 nazioni, che sta assumendo un ruolo di primo piano a livello internazionale nella fornitura di servizi professionali BBM.
 
Site-centric measurement (misurazione centrata sul sito)
La fonte principale per questo tipo di rilevazione sono i file di log che registrano l’attività del server web. Il limite maggiore di tale metodo è da ricercarsi nella scarsa corrispondenza tra le registrazioni dei log e l’effettiva attività dei visitatori del sito. Vi sono infatti molti fattori che generano incertezza. Tra questi:

  • la difficoltà di definire univocamente quali tipi di file sono da considerare “pagine” e quali no;
  • il caching delle pagine effettuato da proxy server, motori di ricerca, browser utente, ecc. Non vi è modo di sapere il rapporto esatto tra le page view registrate nei log e le pagine fornite dai vari sistemi di caching interposti tra server web ed utente finale;
  • l’assegnazione di IP dinamici agli utenti da parte di server DHCP: non è possibile sapere né se visite successive eseguite da uno stesso IP provengano da una stessa persona né se visite successive, eseguite da IP differenti, provengano da persone diverse o da un medesimo utente a cui sia stato assegnato dinamicamente un nuovo IP.

Tra i vantaggi offerti dalle misurazioni site-centric c’è la possibilità di sottoporre i propri log file all’analisi di una società terza, avente funzioni di ente certificatore dei dati di traffico registrati (4). La certificazione riguarda essenzialmente due punti:

  • l’autenticità delle registrazioni dell’attività del web server;
  • l’accuratezza delle statistiche da esse derivate.

L’utilità commerciale di simili certificazioni è notevole, in quanto, conferendo un valore “quasi” oggettivo alle statistiche di traffico di un sito, aumenta di conseguenza la forza di contrattazione nella vendita di spazi pubblicitari: la certificazione infatti accresce la fiducia dell’acquirente nella possibilità di ottenere un numero di ad impression realmente commisurato al numero di page view dichiarato.
 
User-centric measurement (misurazione centrata sull’utente)
Questo tipo di misurazione è completamente differente dalle altre due. Non si tratta, infatti, di un’elaborazione statistica effettuata a partire dai dati registrati nei file di log; si tratta piuttosto di una vera e propria indagine di mercato, basata su elementi tipici del settore:

  • un campione di popolazione significativo del tipo di utenza che si vuole misurare;
  • uno strumento per la rilevazione del comportamento degli individui che compongono il campione, applicato ai loro computer ed in grado di monitorare attimo per attimo qualsiasi tentativo, riuscito o non riuscito, di navigazione su Internet;
  • strumenti statistici studiati per effettuare proiezioni più o meno attendibili, che estendono alla totalità della popolazione i dati ricavati dall’analisi del campione.

La validità delle proiezioni di traffico ricavate per mezzo di indagini di mercato è strettamente dipendente dalla significatività del campione selezionato – che è evidentemente una variabile difficilmente quantificabile – e dalla raffinatezza ed affidabilità degli strumenti statistici adoperati.
Esistono diverse società che effettuano ricerche di questo tipo. Tra esse citiamo Nielsen//NetRatings, Jupiter MMXI, NetValue.

(1) Si parla in questo caso di page impression e non di page view per analogia con il meccanismo di registrazione di un ad impression: la presenza cioè nella pagina HTML di un frammento di codice specificamente destinato a generare la registrazione di un accesso in un file di log.

(2) I filtri applicabili ai file di log di un web server di solito includono o escludono dalla registrazione un’intera categoria di file, anche se è comunque possibile personalizzare i filtri, in modo tale da creare per ogni categoria le opportune eccezioni. In ogni caso, agire tramite filtri sulle registrazioni dei log, allo scopo di tener conto quotidianamente della mutevole struttura delle pagine e dei contenuti di un sito, richiede sicuramente più attenzione e lavoro che non decidere, caso per caso, di includere oppure no in una nuova pagina il codice javascript che determina la registrazione di una page impression.

(3) Si potrebbe pensare di fugare i dubbi incrociando i dati di traffico browser-based con i dati ricavati dai normali file di log. Va tenuto presente, però, che tale comparazione è estremamente difficile e tutto sommato poco attendibile: infatti i dati relativi all’attività del web server sono influenzati in una misura non quantificabile da una serie di fattori di incertezza (proxy, caching, IP dinamici), che si riverberano inevitabilmente sulla possibilità di confrontare in modo utile i dati statistici provenienti dalle due fonti.

(4) Per la Gran Bretagna e l’Irlanda questa funzione è svolta da ABC Electronic. Le sue certificazioni avvengono sulla base di una serie di standard definiti da un consorzio volontario di aziende, lo IFABC (International Federation of Audit Bureaux of Circulations). Le definizioni dei dati standard soggetti a rilevazione sono consultabili in Rete alla pagina http://www.ifabc.org/web/index.html.

*Leggi: Conclusioni
*Vai a: Diodati.org > Guide, articoli, scritti > Capire le statistiche di accesso ai siti Internet
*Scrivi: info@diodati.org
*Ultima modifica: 15/7/2004 ore 15:36