05 Profilazione degli utenti e concetti
collegati
- Clickstream analysis
- È l’analisi della serie registrata di clic
del mouse, ovvero di scelte di navigazione effettuate dagli
utenti di un sito. Costituisce uno degli elementi fondamentali
del processo di profilazione degli
utenti.
- Data mart
- È un database contenente dati raccolti in vista di un
uso specifico. Può essere un sottoinsieme di un
data warehouse, ma, rispetto al
carattere generico di quest’ultimo, l’accento - in un
data mart - è posto sulla capacità di
venire incontro alle esigenze di particolari gruppi di utenti in
termini di dati raccolti, presentazione delle informazioni,
semplicità d’uso.
- Data mining
- È l’esame complessivo dei dati raccolti
sull’attività dei propri utenti/clienti, tendente a
trovare nei loro comportamenti correlazioni
significative da un punto di vista commerciale. Costituisce
pertanto una parte del complesso procedimento di profilazione degli utenti. I risultati a
cui può giungere l’attività di data
mining sono molteplici:
- associazioni – due eventi si
verificano spesso insieme (ad esempio chi compra delle scarpe
tende ad acquistare anche dei calzini);
- sequenze – due eventi successivi
sembrano legati da una relazione di causa-effetto (chi compra un
mouse su Internet, tempo dopo acquista anche un tappetino);
- classificazioni – il riconoscimento di
un ordine in una serie di eventi, con la conseguente
riorganizzazione dei dati in proprio possesso;
- raggruppamenti – la ricerca e la
presentazione di gruppi di fatti non precedentemente noti;
- previsioni – lo studio della probabile
evoluzione futura della propria attività in base alle
risultanze dei dati raccolti.
- Data warehouse
- Si definisce così la base dati centrale di
un’azienda o di un suo settore di attività. È
il serbatoio in cui confluiscono, spesso da numerose e differenti
fonti, tutti i dati grezzi suscettibili di future
elaborazioni. La massa di dati in esso contenuta rimane poco
significativa, ai fini ad esempio della pianificazione
commerciale dell’attività, finché questo
insieme “bruto” di dati non viene filtrato ed
analizzato da apposite applicazioni, per mezzo di una
specifica attività di data
mining.
- OLAP, online analytical
processing
- Si tratta di applicazioni che, agendo su una base dati
preesistente, consentono agli analisti di estrarre e
correlare i dati in modo da generare una grande
varietà di punti di vista e di associazioni.
L’attività di data
mining, descritta al punto precedente di questo
glossario, è resa possibile appunto da applicazioni di
tipo OLAP, le quali conservano i propri dati in database
multidimensionali, così detti per distinguerli
dai più comuni database relazionali. Mentre
questi ultimi possono essere descritti come strutture
bidimensionali, cioè piatte, nelle quali
l’organizzazione delle informazioni sta nello schema di
righe e colonne delle tabelle che li compongono, i database
multidimensionali vanno associati piuttosto all’immagine di
un solido, tipicamente un cubo, che simboleggia il fatto
che ogni tipo di informazione presente in simili database
può divenire il perno, ovvero la dimensione di
riferimento, per una serie di associazioni con altri dati.
- Profiling
(profilazione)
- È l’attività per mezzo della quale una
serie complessa di dati relativi ad utenti/clienti viene
elaborata da specifici programmi – come ad esempio
l’Observation Management Server del notissimo
Vignette – per generare alla fine la
segmentazione della propria utenza in gruppi
omogenei di comportamento. I dati che possono essere presi
in considerazione per la profilazione sono molteplici. Tra questi
citiamo:
- la serie delle scelte di navigazione effettuate sul
sito in esame dagli utenti unici identificati;
- la dichiarazione esplicita di preferenze e interessi
ottenuta tramite procedure di registrazione o sondaggi;
- la raccolta di dati demografici;
- la risposta degli utenti identificati a promozioni o
a contenuti particolari.
I sistemi di profilazione più avanzati mettono a
disposizione del settore commerciale di un’azienda la
possibilità di segmentare in gruppi la propria utenza sia
manualmente, scegliendo i parametri da prendere in
considerazione, sia automaticamente, in base alle
capacità native del software utilizzato. In entrambi i
casi, il valore aggiunto è dato dalle molteplici
correlazioni che è possibile istituire tra i dati
raccolti, al fine di ricavarne informazioni commercialmente
utili. Ecco a titolo esemplificativo alcune di queste
correlazioni:
- Content affinities (affinità di
contenuto) – gli insiemi di contenuti che tendono ad
essere visti insieme dagli utenti del sito esaminato;
- Content effectiveness (efficacia dei
contenuti) – per i siti di commercio in Rete, i
contenuti che tendono ad essere visti in sessioni-utente che si
concludono con un acquisto;
- Product affinities (affinità di
prodotto) – sempre per i siti di commercio in Rete,
l’elenco dei prodotti che sono più spesso acquistati
insieme.
- Profiling esplicito
- Si ottiene per mezzo di un’apposita procedura di
registrazione, che implica l’invio tramite un modulo
di dati personali da parte dell’utente. I dati
inviati, archiviati in un' apposita base dati, forniranno una
serie di parametri utili a segmentare in gruppi omogenei
la totalità degli utenti registrati.
- Profiling implicito
- È il tracciamento del comportamento di utenti
anonimi nel corso delle loro visite ad un sito. Il
tracciamento può avvenire sia tramite IP sia tramite cookie. L’insieme delle
scelte di navigazione effettuate alimenta una base dati, da cui
appositi programmi possono estrarre
associazioni e correlazioni, in grado di segmentare la
totalità degli utenti tracciati in gruppi
omogenei.