Big Data, Big Profits?

I dati e l’analisi dei dati sono ampiamente riconosciuti come una delle nuove frontiere del business. In particolare, Big Data è il termine che sta catalizzando la discussione sull’evoluzione strategica di molti settori industriali e dei servizi e addirittura del settore governativo ormai da molti mesi, intendendo con questo termine non solo un grande ammontare di dati, ma anche dati non strutturati, derivanti da sensori, social media, immagini e video. La discussione intorno ai Big Data è, di conseguenza, molto articolata e comprende diversi aspetti, dal valore economico alla rilevanza settoriale, dal social listening alla tecnologia, dai dubbi sulla privacy alle questioni etiche sulla trasparenza dei processi di raccolta dei dati.

Proviamo a capire cosa sono, quanto (e se) sono realmente diversi dalla buona e cara business analytics e quali prospettive realmente ci aprono.

La promessa dei Big Data è di poter integrare informazioni da fonti differenti, in modo coerente con le situazioni che li hanno generati, per produrre intuizione / comprensione di comportamenti futuri, contestualizzati. Per realizzare tale promessa, a mio parere non è sufficiente aumentare la dimensione e la qualità dei dati memorizzati, è necessario affinare sensibilmente i modelli di analisi e di correlazione già utilizzati nei processi di business analytics. In altri termini, il valore dei Big Data non sta nei dati in sé ma nelle capacità analitiche di chi li usa, tenendo ben in mente alcune grandi verità delle analisi di tipo statistico:

  • La correlazione evidenzia un percorso, ma non una direzione di causalità.
  • Tutti i modelli sono, per loro natura, approssimativi e l’intuizione gioca ancora un ruolo fondamentale nell’identificazione di quelli utili ad una determinata indagine.
  • L’80% delle informazioni utili è in forma non strutturata (testo, immagini, video, …), la cui analisi continua ad essere prettamente qualitativa.

Secondo i maggiori analisti, ci sono 4 modi principali (ed altrettanti interlocutori aziendali) in cui la tecnologia dei Big Data può creare valore:

  1. Utilizzata sui dati generati dalle operation, può evidenziare la variabilità dei processi interni all’azienda e potenzialmente generare migliori performance.
  2. Utilizzata per correlare i dati economici aziendali con dati di sistema, può migliorare il processo decisionale.
  3. Utilizzata sui dati generati dalla clientela, può consentire una segmentazione molto raffinata e una personalizzazione di prodotti e servizi.
  4. Infine può essere utilizzata per lo sviluppo di prodotti e servizi di nuova generazione. Si pensi ad esempio ad alcuni produttori di elettrodomestici che stanno utilizzando i dati inviati da sensori inseriti nei prodotti per proporre manutenzione preventiva quando si alza la probabilità di un guasto.

Le valutazioni dei benefici economici derivanti dall’uso dei Big Data si concentrano tuttavia sul terzo punto e sulle attività del CMO (Chief Marketing Officer). Secondo una recente indagine di McKinsey & Co. dal titolo “Big Data, Big Profits[1], le aziende leader nell’utilizzo commerciale dei Big Data nei settori dei Servizi Finanziari, della Grande Distribuzione Organizzata e della Consumer Electronics, hanno profitti mediamente più alti del 6% rispetto ai concorrenti del settore che non li utilizzano. Inoltre, tali aziende sono riuscite a migliorare i propri processi di promozione commerciale, eliminando le campagne generalizzate e moltiplicando le campagne focalizzate su specifici target di clientela. E’ interessante notare come tutti e tre questi settori abbiano un contatto diretto con il cliente/consumatore e possano accedere a dati di prima mano sulle preferenze di acquisto.

Cosa accade invece quando una azienda decide di utilizzare altre fonti informative, quali i social media, per alimentare la propria business analytics?

L’utilizzo dei social media come fonte per i Big Data ha cominciato recentemente ad essere oggetto di studio a livello accademico e, tornando al tema della significatività statistica delle analisi sui Big Data, ho trovato particolarmente interessante un working paper[2] dell’Università di Princeton che analizza i potenziali punti deboli, metodologici e concettuali, di questa pratica. Ve ne elenco alcuni:

  • Facebook sarebbe la piattaforma più interessante da analizzare, tuttavia le opzioni di privacy spesso non consentono di accedere ai post degli utenti e si rischia di avere una visione inadeguata del comportamento dell’utente.
  • Twitter non ha questo problema, ha una struttura di privacy molto semplice (tutto pubblico o tutto privato), dei cicli di vita delle conversazioni molto brevi e una compattezza dei dati prodotti (140 caratteri) ed è emerso nel tempo come quello che in biologia si chiama “organismo modello”. Questi organismi hanno cicli di vita molto brevi e un elevato livello di standardizzazione nei modelli di crescita, cosa che rende semplice e veloce la comparazione dei risultati di un esperimento. Tuttavia, come in biologia gli organismi modello, nella loro semplicità, non rappresentano tutta la propria specie, così il comportamento dei consumatori rilevato su Twitter non necessariamente rappresenta il comportamento generalizzato. Ad esempio, Twitter è utilizzato prevalentemente da dispositivi mobili, quindi fuori casa, spesso in occasione di eventi o in presenza di minore banda dati disponibile. Inoltre, il meccanismo dei re-tweet è soggetto a norme di comportamento e influenza degli utenti, che non necessariamente si replicano su altre piattaforme o al di fuori della rete. Infine, Twitter è utilizzato da circa il 10% della popolazione[3], che non risulta essere un campione significativo.
  • Qualunque siano le piattaforme scelte come fonte dei dati, non c’è chiarezza sulla rappresentatività del campione. Ad esempio, su Facebook è possibile esprimere una preferenza (like), tuttavia non abbiamo modo di stabilire se chi non ha schiacciato il bottone like sia contrario o indifferente. E non siamo in grado di valutare la percentuale di popolazione che non ha avuto accesso all’informazione e non ha potuto esprimere un parere, per poter valutare la rappresentatività del campione.

L’autore prosegue con diversi argomenti, che sarebbe troppo tecnico trattare e che potete eventualmente approfondire alla fonte. Un paio delle sue conclusioni mi sembrano tuttavia condivisibili, al fine di comprendere questa tecnologia e le sue implicazioni:

  1. Come qualunque sistema di business analytics, l’analisi dei Big Data deve essere diretta a rispondere concretamente ad una domanda di business e non essere solo data-driven.
  2. È necessaria una migliore comprensione dei limiti dell’analisi dei Big Data, al fine di comprenderne meglio i risultati.

[1] Big Data, Big Profits. McKinsey & Co. http://visual.ly/big-data-big-profits

[2] Big Data: Pitfalls, Methods and Concepts for an Emergent Field. Zeynep Tufekci. Princeton University – Center for Information Technology Policy. http://ssrn.com/abstract=2229952

[3] Dato US

Annunci

Dimmi la tua ...

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...