Big Data – Quali tecnologie?

Questo articolo fa parte di una serie di mie riflessioni sull’innovazione technology-driven, cominciata qui.

Le tecnologie che impattano un progetto sui Big Data sono molteplici. Qui vedremo le principali, soprattutto per diventare familiari con la terminologia, per approfondimenti leggete qui e qui.

  • Relational Database, base dati composta da tabelle di dati strutturati in righe e colonne, messe in relazione fra loro ed interrogate tramite il linguaggio strutturato Structured Query Language (SQL).
  • Non-Relational Database (NoSQL), base dati contenente dati non strutturati. Ne esistono diversi tipi ed hanno caratteristiche profondamente diverse dai dati strutturati. Per comprendere meglio la differenza occorre ricordare che le basi dati relazionali garantiscono la proprietà ACID (Atomicità delle transazioni, Consistenza nel valore dei dati prima e dopo la transazione, Isolamento degli eventi transazionali, Durata –in italiano rende meglio persistenza- dei risultati). Le basi dati NoSQL sono invece caratterizzate da proprietà BASE (Basically available: possono tollerare guasti in alcune parti del sistema; Soft state: un oggetto può avere più valori contemporaneamente; Eventually consistent, tipicamente la consistenza viene raggiunta con il tempo)

Qui vedete alcune forme concettuali di basi dati non relazionali. Una sintesi interessante la trovate nell’articolo Tackling Big Data di Michael Cooper and Peter Mell, al seguente indirizzo.

Biga data 11

  • Ci sono poi gli ETL (Estract, Transform & Load), insieme di strumenti software per estrarre dati da fonti esterne, trasformarli per renderli fruibili e caricarli nella base dati di destinazione
  • I Data Warehouse, base dati specializzata e ottimizzata per il reporting, utilizzata per contenere grandi volumi di dati strutturati e tempificati
  • I Data Mart, sottoinsieme di dati organizzati per l’utilizzo tramite strumenti di business intelligence
  • Business Intelligence (BI), strumento software specializzato nell’analisi e presentazione dei dati e nella reportistica
  • Mashup, strumento applicativo che combina dinamicamente dati e funzioni di altre applicazioni per creare nuovi servizi. Molte delle tecniche di rappresentazione che abbiamo visto si possono realizzare con tecnologie mash-up

 Prosegue qui

disclaimer

Dimmi la tua ...