Big Data: la data-driven organization?

Questo articolo fa parte di una serie di mie riflessioni sull’innovazione technology-driven, cominciata qui.

I dati e l’analisi dei dati sono ampiamente riconosciuti come una delle nuove frontiere del business. In particolare, Big Data è il termine che sta catalizzando la discussione sull’evoluzione strategica di molti settori industriali e dei servizi e addirittura del settore governativo ormai da molti mesi, intendendo con questo termine non solo un grande ammontare di dati, ma anche dati non strutturati, derivanti da sensori, social media, immagini e video. La discussione intorno ai Big Data è, di conseguenza, molto articolata e comprende diversi aspetti, dal valore economico alla rilevanza settoriale, dal social listening alla tecnologia, dai dubbi sulla privacy alle questioni etiche sulla trasparenza dei processi di raccolta dei dati.

Proviamo a capire cosa sono, quanto (e se) sono realmente diversi dalla buona e cara business analytics e quali prospettive realmente ci aprono.

I numeri relativi ai dati generati e gestiti nel nuovo ecosistema digitale interconnesso sono impressionanti.

Google, Yahoo!, Microsoft e tutte le aziende che gestiscono motori di ricerca hanno basi dati che si misurano nell’ordine degli exabytes (1 exabyte equivale a 2 alla 60^ , o 10 miliardi di copie dell’Economist). Le compagnie che gestiscono i social media hanno centinaia di milioni di utenti ed il solo Facebook produce 30 miliardi di contenuti condivisi al mese.

Ma vediamo qualche trend: secondo una ricerca pubblicata da McKinsey nel 2011, mentre la biblioteca del Congresso Americano gestisce circa 250 terabyte di dati, nello stesso periodo, in 15 dei 17 settori economici rilevanti in US, ogni singola azienda ne gestiva mediamente altrettanti, se non di più.

Da una ricerca di Martin Hilbert e Priscilla Lopez, pubblicata nello stesso periodo sulla rivista Science, possiamo vedere che il tasso di crescita delle informazioni è stato esponenziale a partire dal 2000 e, nel giro di venti anni, abbiamo assistito al completo capovolgimento del mix fra informazioni di tipo analogico (che ormai sono solo intorno al 6%) e informazioni digitali.

Biga data 1

La capacità elaborativa mostra tassi di crescita analoghi, a partire dal 2000, ma quello che è più impressionante è la composizione, fortemente sbilanciata a favore di dispositivi di produttività personale, a partire dai PC, usati anche in ambito aziendale, che coprono i 2 terzi, mentre un altro 30% è rappresentato da console digitali e dispositivi mobili.

Biga data 2

Un altro fenomeno interessante, in termini di volumi di dati generati, è la cosiddetta «Internet delle cose», cioè i dati generati dai sensori inglobati in molti dispositivi elettromeccanici di uso quotidiano, che nell’arco di 5 anni potrebbe quintuplicare il numero di nodi. I dati che vedete sono espressi in milioni e ci sono aspetti molto rilevanti anche per la nostra salute ed il nostro benessere.

Biga data 3

In sintesi, dati potenzialmente utilizzabili per indirizzare decisioni vengono creati in ogni momento ad una frequenza prima inimmaginabile e che raddoppia ogni 18 mesi, come risultato di un più ampio accesso ai dati della clientela da fonti pubbliche o interne e dalle nuove informazioni che si possono raccogliere dalla web community e dagli strumenti di mobilità

Questo trend tecnologico, comunemente noto come «big data», consente di andare oltre quella che tradizionalmente si chiamava business intelligence, poiché può consentire di supportare:

  • sperimentazioni di business su nuovi prodotti,
  • nuove customer experience,
  • nuovi processi produttivi,

potenzialmente indirizzando trasformazioni radicali nel modo di fare business. Le tecniche di analisi di questi dati promettono infatti di trasformare il modo in cui reagiamo alle crisi, il marketing, l’entertainment, la sicurezza digitale, ponendo tuttavia una serie di sfide che vanno molto a di là di quella puramente tecnologica del costo e dell’efficienza dei dischi e dei sistemi di input/output. Queste sfide sono:

  • Gestire fonti di dati distribuite
  • Tracciare la provenienza dei dati dalla loro generazione al loro utilizzo finale
  • Validare i dati
  • Gestirne l’eterogeneità ed i problemi di campionamento
  • Lavorare con diversi formati e strutture dei dati
  • Garantirne l’integrità e la sicurezza
  • Sviluppare modelli per la loro efficace rappresentazione
  • Arrivare, a tendere, a gestire l’analisi e il decision making real-time

Il problema principale che dovrete affrontare, se avviate un progetto sui big data, sarà comunque la necessità di trasformare i dati in conoscenza, attraverso opportune tecniche inferenziali.

Prosegue qui

disclaimer

Dimmi la tua ...

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo di WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione /  Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione /  Modifica )

Connessione a %s...