Era il 2006 quando Clive Humby disse una frase destinata a passare alla storia e a diventare sempre più vera col trascorrere degli anni: Data is the new oil (i dati sono il nuovo petrolio). Sono passati solo 17 anni da quell'affermazione, ma in termini di progresso tecnologico sembrano essere trascorsi dei secoli. Humby, a questo proposito, si è rivelato profetico, come profetica vuole essere la nuova tecnologia basata sui dati. Cosimo Accoto, nel suo saggio Il mondo dato: Cinque brevi lezioni di filosofia digitale edito da Egea nel 2017, ha sottolineato il passaggio da una società archiviale, che basa la comprensione del presente sull'apprendimento dal passato, ad una società oracolare, che osserva il presente per predire il futuro. Ma come si osserva il presente in quest'ottica? Studiando i dati.
Come devono essere questi dati?
E se non lo fossero? La soluzione sta (forse, e non completamente) nei dati sintetici.
I dati sintetici sono dati creati artificialmente da appositi algoritmi, che imitano (quasi) alla perfezione i dati normalmente provenienti dal mondo reale.
Com'è possibile che ci sia bisogno di creare altri dati in un periodo storico in cui la sovrabbondanza di informazioni dilaga e l'information overload rischia di diventare una vera e propria patologia? I due fenomeni non vanno in contrasto tra loro, come potrebbe sembrare in prima battuta. Vediamo perché.
Le stime della Commissione Europea per il 2025 relative alla quantità di dati prodotta a livello globale sono impressionanti: dal 2018, in cui venivano prodotti 33 zettabytes di dati, si va verso i 175 zettabytes del 2025, un incremento pari al 530%. Per capire di che cifre stiamo parlando, basti pensare che uno zettabyte corrisponde a 1.000.000.000.000.000.000.000 (un triliardo) di byte, nel sistema binario 1.180.591.620.717.411.303.424 byte. C'è però il problema dei limiti tecnologici, organizzativi e culturali che ancora aziende ed enti hanno nell'utilizzare questi dati. Senza contare che una grandissima parte di questi dati risultano sporchi o scadenti, essendo incompleti, parziali o falsati da pregiudizi ed errori. Il loro utilizzo non risulta dunque utile ma in certi casi addirittura dannoso.
Di fronte a questa sovrabbondanza di dati molte volte inutilizzabili, si è resa necessaria la produzione di dati puliti, omogenei e soprattutto chiaramente leggibili. Ciò che però ha reso indispensabile un investimento massiccio nella generazione di dati sintetici è stata la vera e propria esplosione dell'utilizzo dell'intelligenza artificiale. Non c'è azienda tecnologica che possa ignorare l'importanza sempre crescente dell'intelligenza artificiale o che possa decidere di non investire in essa. Lo confermano i dati della Computing Technology Industry Association (CompTIA) americana, secondo cui il 91,5% delle aziende leader nei rispettivi mercati sta concretamente investendo in AI.
Ad avere più fame di dati è l'intelligenza artificiale generativa, che si basa su algoritmi di machine learning i quali necessitano di una quantità enorme di dati il più possibile coerenti con lo scenario e le funzionalità da generare. Questi dati, quindi, non devono essere solo numerosi, ma anche ordinati ed analizzabili con il minor dispendio possibile di tempo e risorse.
Come sottolineato da Agenda Digitale, "negli ultimi anni, gli esperti di intelligenza artificiale hanno imparato che i dati di buona qualità (Good Data) sono più importanti dei dati “di grande quantità” (Big Data). In soldoni, piccole quantità di dati esatti, etichettati nel modo giusto, possono migliorare le prestazioni di un sistema di intelligenza artificiale fino a dieci volte di più che con l’utilizzo di una maggiore quantità di dati inesatti".
Delineato questo scenario, diventa assai facile comprendere come i dati sintetici si renderanno sempre più necessari con il passare degli anni e con i progressi dell'intelligenza artificiale. Secondo uno studio condotto da Grand View Research, ilmercato globale deidati sintetici nel 2030 arriverà a 1,79 miliardi, mentre bisogna aspettare solo il prossimo anno per arrivare al punto in cui il 60% dei dati utilizzati per lo sviluppo di progetti di AI e di analisi sarà generato sinteticamente, stando alle stime di Gartner. Un balzo incredibile se pensiamo che ad oggi i dati sintetici rappresentano solo l’1% dei dati digitali.
Le possibilità relative alla creazione di dati sintetici utilizzabili nel training dei modelli di machine learning sono praticamente infinite. Le tipologie di dati creati, però, possono essere categorizzate facilmente in base alla loro natura, struttura e al loro campo di applicazione. I dati sintetici possono essere:
Sono moltissimi i possibili campi di applicazione dei dati sintetici, siano essi multimediali o testuali, strutturati o non strutturati. Vediamone solo alcuni, consapevoli del fatto che in realtà qualsiasi ambito può trarre beneficio dalla generazione di dati creati appositamente per capire il presente e prevedere il futuro in base ai propri interessi specifici:
Sono molti i benefici derivanti dalla generazione di dati sintetici, come era possibile intuire dai massicci investimenti che le principali corporation stanno destinando a questo tipo di tecnologia futuristica e futuribile. Eccone alcuni:
Non è tutto oro ciò che luccica, e anche i dati sintetici, come moltissime nuove tecnologie (prima fra tutte l'intelligenza artificiale, che dei dati sintetici è la maggiore causa, generatrice ed utilizzatrice) hanno il loro lato oscuro, svantaggi che non possono essere ignorati e che in molti casi danno molti grattacapi prima del loro utilizzo. Tra i limiti dei dati sintetici ci sono tre o quattro questioni che elenchiamo a titolo esemplificativo:
Per quanto gli esiti di nuove tecnologie così invasive siano imprevedibili, è ancora troppo presto per dire che la generazione di dati sintetici manderà in pensione la raccolta e l'analisi di dati reali da parte degli istituti di ricerca tradizionali.
I motivi per sostenerlo sono diversi, e tutti si evincono facilmente dal contenuto dell'articolo. Vediamone solo qualcuno a titolo di esempio:
Alle macchine stiamo affidando dati, impulsi, gli stiamo delegando letteralmente il nostro futuro. Ma nel momento in cui scriviamo il cervello è ancora il più potente computer esistente. Per quanto questo assunto varrà ancora? Come si dice dalla notte dei tempi, ai posteri l'ardua sentenza.
Indagini di mercato, Ricerche sociali, Insight per le decisioni
Via del cinema, 5 - 61122 Pesaro
+39 0721 415210
info@sigmaconsulting.biz
Sigma Consulting srls unipersonale – P. Iva 02625560418 - Capitale sociale € 2.000,00 i.v. - REA PS 196812 - Privacy Policy - Cookie Policy -
Sigma Consulting S.r.l.s. unipersonale (di seguito per brevità “Sigma Consulting”) informa l’Utente, ai sensi dell’art. 13 del Regolamento 679/2016/UE e della normativa italiana applicabile in materia di trattamento dei dati personali, che i dati personali dallo stesso forniti formeranno oggetto di trattamento nel rispetto della normativa richiamata e degli obblighi di riservatezza a cui è ispirata l’attività di Sigma Consulting.
1. Tipologia di dati - Finalità e modalità del trattamento – Conservazione dei dati
1.1 Il trattamento si riferisce ai seguenti dati: anagrafici, identificativi, fiscali, c.d. “particolari categorie di dati” quali opinioni (su prodotti, servizi, economia, politica, attualità, sanità,) abitudini di consumo, orientamenti (in ambito politica, società, salute, sesso, religione).
1.2 I dati personali forniti dall’Utente sono utilizzati da Sigma Consulting, in qualità di titolare del trattamento, per le seguenti finalità:
a) gestire l’iscrizione e la partecipazione dell’Utente a Oraculum, la community di Sigma Consulting, ed ogni correlato adempimento legale, contrattuale, fiscale anche in sede di recesso o esclusione dell’Utente dalla community;
b) assegnare i punti ed erogare gli omaggi;
c) aggiornare il profilo di ciascun Utente;
d) invitare l’Utente alle attività della community in base al suo profilo socio-demografico;
e) inviare all’Utente comunicazioni inerenti alle attività della community;
f) aggregare le informazioni dei singoli sondaggi a cui ha partecipato l’Utente e creare profili statistici anonimi in base alle informazioni fornite dall’Utente;
g) migliorare e monitorare la qualità dei servizi forniti, garantire la sicurezza e la protezione della piattaforma e delle attività proposte.
Nell’ambito delle finalità suindicate, il trattamento dei dati anagrafici, identificativi e di contatto è necessario all’esecuzione di obblighi di legge e/o di contratto, mentre per le c.d. “particolari categorie di dati” è richiesto il consenso dell’interessato.
1.3 Previo consenso dell’interessato, il Titolare potrà associare alcuni dati personali alle risposte, oppure rilasciare alcuni dati personali a terzi identificati, ovvero invitare l’interessato a partecipare ad iniziative di terzi. In tutti questi casi sarà richiesto un consenso aggiuntivo, esplicito e dettagliato rispetto alla singola attività proposta. Il mancato conferimento del consenso non pregiudica il trattamento per le finalità indicate al §1.2.
1.4 Il trattamento dei dati avverrà mediante strumenti idonei a garantirne la sicurezza, pertinenza, integrità, disponibilità, completezza, non eccedenza e riservatezza dei dati, e potrà essere effettuato con strumenti cartacei e/o mediante strumenti automatizzati atti a memorizzare, gestire e trasmettere i dati stessi. I dati dell’Utente saranno trattati per tutto il periodo in cui l’Utente sarà iscritto a Oraculum e successivamente saranno anonimizzati.
1.5 I dati saranno conservati per tutto il tempo in cui l’Utente è iscritto a Oraculum e successivamente alla cancellazione o esclusione, come disciplinate dal regolamento della community, i dati saranno cancellati e/o anonimizzati.
2. Natura del conferimento dei dati e conseguenze di un eventuale rifiuto di rispondere
2.1 Il conferimento, da parte dell’Utente, dei dati e del consenso al trattamento dei dati, ove richiesto, per le finalità di cui al punto 1 è facoltativo. Il rifiuto a fornire i dati in relazione anche ad una soltanto delle predette finalità o il rifiuto di fornire il consenso al trattamento comporta, per l’Utente, l’impossibilità di iscriversi a Oraculum e di partecipare a tutte le attività della stessa; in tal caso, i dati dell’Utente non verranno in alcun modo utilizzati e/o trattati da parte di Sigma Consulting.
3. Titolare del trattamento e soggetti e categorie di soggetti ai quali i dati personali possono essere comunicati o che possono venirne a conoscenza in qualità di responsabili o incaricati, e ambito di diffusione dei dati medesimi
3.1 Il titolare del trattamento è Sigma Consulting S.r.l.s. unipersonale (P.IVA 02625560418), con sede legale in Pesaro, Via del Cinema n. 5, CAP 61122 e-mail: community@sigmaconsulting.biz, P.E.C.: sigmaconsulting@gigapec.it.
3.2 I dati personali dell’Utente saranno trattati da dipendenti, collaboratori, consulenti e professionisti, fornitori e società di consulenza incaricati da Sigma Consulting di svolgere specifiche attività in relazione alle suddette finalità di trattamento o per adempiere ad un obbligo di legge.
3.3 Fatto salvo quanto previsto al precedente punto 3.2, i dati dell’Utente potranno essere temporaneamente trasferiti presso un server negli Stati Uniti ai fini della gestione del panel, nel rispetto dei principi indicati agli articoli 44 e seguenti del Regolamento 679/2016/UE. I dati personali non saranno diffusi.
Diritti dell’interessato
Relativamente ai dati personali, l’interessato potrà in ogni momento, mediante semplice richiesta scritta indirizzata al Titolare, anche a mezzo e-mail o tramite soggetto delegato:
(i) ottenere l'accesso ai dati personali per conoscere origine dei dati, finalità del trattamento, logica applicata al trattamento con uso di strumenti elettronici, categorie di dati, destinatari (o categorie di destinatari) ai quali gli stessi saranno comunicati, periodo di conservazione, e la loro comunicazione in una forma intellegibile;
(ii) ottenere la rettifica, l’integrazione, la cancellazione dei dati o la limitazione del trattamento;
(iii) opporsi al trattamento dei dati personali;
(iv) ottenere la portabilità dei dati, ove pertinente;
(v) revocare il consenso in qualsiasi momento e richiedere al cancellazione da Oraculum, come indicato nel regolamento;
(vi) proporre reclamo al Garante per la protezione dei dati personali (https://www.garanteprivacy.it/i-miei-diritti).
Per l’esercizio di tali diritti potrà contattare, telefonicamente e/o per iscritto, Sigma Consulting ai seguenti recapiti:
- titolare del trattamento: Sigma Consulting S.r.l.s. unipersonale, sede legale Pesaro (PU), Via del Cinema n. 5, c.a.p. 61122; Tel.: 0721.415210, Fax: 0721.1622038, e-mail: community@sigmaconsulting.biz, P.E.C.: sigmaconsulting@gigapec.it;
- responsabile della Protezione dei Dati (DPO): e-mail: privacy@sigmaconsulting.biz, pec: privacysigmaconsulting@gigapec.it.