Cosa sono i Big Data? 

Paolo Marinoni 19 Luglio 2022

8 minuti

I nostri dati vengono continuamente raccolti online e rappresentano un asset molto importante per le aziende che li sanno sfruttare al meglio. Ma cosa si intende esattamente per Big Data e quali sono le loro potenzialità?   

Passiamo gran parte della nostra vita online. In rete comunichiamo, cerchiamo informazioni, acquistiamo prodotti e utilizziamo servizi. Ogni nostro log-in e qualsiasi movimento fatto sul web è in qualche modo tracciato e i dati che descrivono la nostra attività sono preziosi per quelle società in grado di rielaborarli e utilizzarli al meglio.  

Tutti questi dati costituiscono grandi moli di informazioni eterogenee, molto più copiose ed elaborate di quelle presenti in passato. La difficoltà sta dunque nel saper navigare quest’abbondanza di informazioni e di dar loro una forma, così che queste possano essere rielaborate e sfruttate al meglio.  



La definizione e le 5V dei big data 

Con Big Data ci si riferisce a grandi moli di dati eterogenei per formato e provenienza che possono essere analizzate in tempo reale.  

Sono dunque tre le caratteristiche principali dei Big Data

  • Volume: sono in continuo aumento 
  • Varietà: sono di varia natura 
  • Velocità: sono prodotti di continuo e possono essere analizzati in tempo reale  

Queste caratteristiche erano state definite nel 2001 da Doug Laney, ex vicepresidente di Meta Group, “le tre V” dei Big Data, oggi arricchite da altre due variabili:  

  • Veridicità: i dati devono essere affidabili  
  • Variabilità: il loro significato varia a seconda del contesto in cui vengono interpretati  

Perché i Big Data sono così importanti?  

In un mondo dominato dai dati, l’analisi di questi rappresenta uno strumento importante, che avvantaggia molto le aziende (e non solo).  

In particolare, i Big Data possono essere analizzati con lo scopo di descrivere la realtà (descriptive analytics) al fine di comprenderla al meglio e di tenerla sotto controllo. Oppure possono essere usati per prevedere ciò che potrebbe accadere in futuro (predictive analytics) per farsi un’idea di quali conseguenze potrebbe generare una determinata decisione presente. L’analisi può anche portare alla proposta di soluzioni strategiche (prescriptive analytics) formulate sulla base dei dati raccolti ed elaborati. Dati che possono anche permettere a un sistema avanzato di agire di conseguenza in autonomia (automated analytics).  

Al giorno d’oggi, queste metodologie di analisi – le cosiddette advanced analytics – rappresentano quindi uno strumento fondamentale nella gestione di un business. Sul mercato, infatti, sono presenti numerosi competitor e la comprensione delle logiche commerciali è cruciale per poter agire velocemente e in modo accurato ed efficace.  

Esempi applicativi 

Diversi sono gli ambiti in cui i big data possono tornare utili. Nel marketing, per esempio, questi possono contribuire alla rilevazione del sentiment dei clienti, così come all’individuazione dei target e alla personalizzazione della relazione con lo specifico consumatore. E questo può essere fatto anche attraverso un connubio tra dati digitali e comportamenti offline dei clienti o potenziali tali. Si pensi al marketing basato sull’area geografica di appartenenza (location-based). Questo permette di attivare azioni pubblicitarie in tempo reale sulla base dei dati raccolti dai sensori di geolocalizzazione presenti nei dispositivi mobili.  

I dati vengono anche analizzati per ridurre i costi nei processi di produzione, tenendo sotto controllo, attraverso il monitoraggio dei dati provenienti da specifici sensori, lo stato di ‘salute’ dei macchinari all’interno di una fabbrica (manutenzione predittiva). Oppure valutando la qualità dei pezzi prodotti attraverso sistemi di computer vision, che permettono di superare la limitatezza dei controlli a campione.  

Molti altri sono gli usi che si possono fare dei Big Data. Dalla prevenzione delle frodi nel mondo bancario e assicurativo ad applicazioni all’interno della Pubblica amministrazione per l’ottimizzazione dei flussi turistici. E ancora, per una maggiore efficienza nell’ambito sanitario o per monitorare lo stato di povertà dei cittadini e prevenire eventuali situazioni critiche.  

Un esempio di quest’ultima applicazione è evidente in India, come descritto da Amita Bhide, professoressa e ricercatrice della School of Habitat Studies del Tata Institute of Social Sciences di Mumbai.  

Chiara, dunque, è la necessità di utilizzare sistemi di intelligenza artificiale – come anche assistenti virtuali o robot intelligenti – per l’analisi e il confronto di dati numerosi e molto complessi, difficilmente gestibili e comprensibili dagli esseri umani.  

Il mercato Analytics in Italia e nel mondo 

L’anno scorso, il mercato Analytics nel nostro Paese ha raggiunto un valore pari a 2 miliardi di euro, in crescita del 13% rispetto al 2020, quando la pandemia aveva rallentato gli investimenti nel settore. La componente software ha segnato una crescita del 17% e gli investimenti in data management & analytics sono aumentati di oltre il 10% (soprattutto nel settore delle assicurazioni, in quello manifatturiero e nel campo telco & media).  

Secondo le stime di Statista, inoltre, il mercato globale dei Big Data – che nel 2011 si attestava a soli 7.6 miliardi di dollari – crescerà e raggiungerà quota 103 miliardi entro il 2027.  

Statistic: Big data market size revenue forecast worldwide from 2011 to 2027 (in billion U.S. dollars) | Statista
Find more statistics at  Statista

Il campo dei Big Data attira quindi forte interesse a livello internazionale. Nel nostro Paese, però, l’emergenza sanitaria ha intensificato il gap già presente tra le grandi e le piccole e medie imprese italiane.  

Il futuro e i problemi legati alla privacy 

Il futuro – come riportato sopra – porterà sicuramente a maggiori investimenti nel settore dell’analisi dei dati, ma, a una maggiore capillarità di questi strumenti, corrispondono dubbi in termini di tutela dei dati personali.  

I dati utilizzati dagli analytics – quelli rilasciati volontariamente (provided), quelli raccolti automaticamente tramite cookie (observed), quelli prodotti direttamente da altri dati (derived) e quelli dedotti probabilisticamente (inferred) – devono infatti essere trattati alla luce delle disposizioni del Gdpr.  

Inoltre, vari Garanti della Privacy internazionali hanno ‘stilato’, nel loro operato, una serie di linee guida e raccomandazioni dirette alle aziende. In particolare, sottolineano l’importanza della trasparenza, del consenso, dell’anonimato in rete (quando possibile) e della possibilità per il titolare dei dati di accedere, correggere o modificare le informazioni che lo riguardano


Articoli simili

Oggigiorno, le aziende puntano alla riduzione dei tempi e dei costi necessari per lo sviluppo di modelli di intelligenza artificiale. Ciò è possibile grazie ai…
25 Ottobre 2022

Il concetto di Internet of Things si riferisce ai dispositivi connessi e alla loro comunicazione in rete. Un campo dalle grandi potenzialità.
28 Luglio 2022

Il metaverso è un mondo virtuale in cui tutti possiamo interagire socialmente. Le grandi potenzialità corrispondono però a notevoli rischi.
30 Giugno 2022

Lo sviluppo di un algoritmo di machine learning è un processo lungo e articolato, caratterizzato da una sequenza di tentativi e valutazioni.
8 Giugno 2022

L'AI debole e forte sono prospettive differenti. Sarà mai possibile per le macchine raggiungere un grado di intelligenza pari a quello umano?
24 Maggio 2022

In Evidenza


Microsoft 365 Copilot, un’AI generativa per la produttività

Microsoft ha lanciato 365 Copilot, un servizio di intelligenza artificiale…

OpenAI rilascia GPT-4, più potente e multimodale

GPT-4 è arrivato. Un modello multimodale e con 100 trilioni…

Il fenomeno ChatGPT: l’AI mostra i muscoli

ChatGPT non comprende davvero ciò che diciamo né ciò che…

Il nuovo Bing: ChatGPT col turbo, ma un work in progress

Bing Chat e ChatGPT sono entrambi esempi di chatbot intelligenti,…

ChatGPT, Dall-E, Midjourney: il (difficile) rapporto tra intelligenza artificiale e copyright

La necessità di addestramento di un'intelligenza artificiale generativa si può…