Come è fatto un dato buono? Partiamo dal traffico

Immagine tratta dal film L’ingorgo, di Luigi Comencini (1978) Credits: Filmaffinity

Nel precedente post, abbiamo visto che una buona comunicazione permette di risalire ai dati sottostanti, ossia di ripercorrere la concatenazione di dato, informazione e comunicazione. Torniamo allora a ciò che sta alla base di tutto, vale a dire i dati, per porre di nuovo una semplice domanda: come si definisce la qualità dei dati?

Per rispondere, teniamo presente quanto abbiamo detto in precedenza sulle tre parti di cui si compone un dato: una identifica l’oggetto a cui si riferisce, una il contesto in cui si è prodotto il dato, mentre la terza è il dato vero e proprio, il suo contenuto specifico. A queste tre parti corrispondono due attributi che ci permettono, insieme ad altri che stiamo per vedere, di valutare la qualità del dato:

  • l’attendibilità, che è strettamente legata all’oggetto e al contesto. In altre parole, un dato è attendibile quando descrive univocamente il proprio oggetto e lo colloca nel contesto di riferimento (la tale auto si è immessa nell’autostrada al tale casello). Questo aspetto è di particolare importanza quando i dati non sono esaustivi ma campionati: in altre parole, quando non prendono in considerazione tutti gli eventi ma una parte di essi. In molti casi, infatti, i dati non sono una registrazione puntuale della realtà, come nel caso del nostro esempio in cui vengono registrate tutte le auto che entrano al casello, ma una sua rappresentazione, in cui viene esaminata solo una parte dell’insieme, come in un sondaggio di opinione o, per rimanere in tema, se si devono fare delle osservazioni sul traffico e si osservano gli ingressi a certe ore e in certi giorni per esaminare l’andamento dei flussi, In questi casi, l’attendibilità è legata alla rappresentatività del campione di dati scelti, ossia alla qualità dei criteri e delle procedure che si usano;
  • la precisione, che si riferisce al contenuto e che è fondamentale per il valore del dato. La precisione di un dato è la sua ricchezza, vale a dire l’esattezza con cui descrive oggetto e contesto (il momento esatto in cui l’auto si è immessa, la sua velocità ecc.);

Questi due attributi sono, per così dire, intrinseci, nel senso che si trovano completamente all’interno del dato stesso. Ci sono altri tre attributi, non meno importanti, che possiamo definire estrinesci, perché possono svilupparsi soltanto nella trasformazione del dato in informazione, anche se dipendono completamente dal dato stesso. Tipicamente, infatti, i dati hanno un sistema informativo di riferimento, in funzione del quale vengono prodotti e che, come abbiamo visto in precedenza, conferisce loro un significato: nel caso degli esempi appena visti, questo sistema può essere il controllo del traffico autostradale. Venendo agli attributi, essi sono:

  • la tempestività, ossia l’intervallo di tempo tra la produzione del dato e la il suo ingresso nel sistema informativo di riferimento. Si tratta di un parametro misurabile oggettivamente, ma il cui valore dipende dalle caratteristiche del sistema informativo: se si pilota un aereo è vitale essere informati in tempo reale se l’aeromobile stia per entrare in una condizione di stallo, mentre nella catalogazione dei reperti di uno scavo archeologico, il più delle volte c’è meno fretta. È importante notare come il più delle volte tempestività e precisione, a risorse costanti, siano inversamente proporzionali;
  • la pertinenza, ovvero quanto il contenuto del dato corrisponde alle specifiche dei sistema informativo. Questo aspetto è centrale nell’analisi dei dati, che spesso deve depurarli da tutti i contenuti irrilevanti o fuorvianti. Per rimanere nel nostro esempio, se il dato deve essere gestito da un sistema di controllo del traffico, è importante sapere quante auto ci sono in un dato tratto in un dato momento, non il loro colore;
  • infine, la rilevanza, o significatività, che viene determinata dall’interazione tra dato e sistema informativo. Qui, i dati non sono più uguali tra loro, ma dipendono dal loro valore all’interno di una specifico schema interpretativo, anche a parità rispetto agli altri attributi. Continuando con l’esempio del controllo del traffico, se lo scopo è segnalare gli ingorghi, allora il numero di auto è rilevante solo al di sopra di una certa soglia, se si vuole determinare il tasso di utilizzo normale dell’infrastruttura allora i picchi sono meno rilevanti rispetto alle condizioni prevalenti (la moda statistica), mentre se vogliamo capire come si comporta l’infrastruttura nelle condizioni di massimo utilizzo, allora sono rilevanti solo i picchi.

Nel prossimo post, cercherò di esaminare, alla luce di questi attributi, alcuni dei dati che compongono i bollettini quotidiani della Protezione civile, per capirne il valore informativo e le implicazioni in termini di comunicazione.

Info Autore
Chief of Strategy , Tombolini & Associati
Ho studiato filosofia alla Sapienza (tesi su Hegel, dottorato su Husserl, qualche pubblicazione qua e là) e, fin dai miei ultimi anni da studente, lavoro nella comunicazione e nell’analisi strategica. Adesso faccio queste cose con Tombolini & Associati, di cui sono socio e partner.
×
Chief of Strategy , Tombolini & Associati
Ho studiato filosofia alla Sapienza (tesi su Hegel, dottorato su Husserl, qualche pubblicazione qua e là) e, fin dai miei ultimi anni da studente, lavoro nella comunicazione e nell’analisi strategica. Adesso faccio queste cose con Tombolini & Associati, di cui sono socio e partner.
Latest Posts

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Ridimensiona font
Contrasto