discover our data rooms
Tra sicurezza, privacy e valore aggiunto: la nuova frontiera dei dati impliciti
digi tales 2021

Tra sicurezza, privacy e valore aggiunto: la nuova frontiera dei dati impliciti

Il progetto di UniBas e Multipartner per l’analisi, la sanificazione e la riscrittura dei metadati dei documenti digitali

Un documento dice più di quanto mostra. Come le spie romane usavano una sorta di “inchiostro simpatico” per scrivere tra le righe sulle pergamene che trasportavano da una parte all’altra dell’impero, così le odierne pergamene digitali – in pdf o altri formati – nascondono informazioni che possono essere sensibili quando lo scambio ha i caratteri dell’ufficialità come nelle trattative di business, nelle pubblicazioni o nei rapporti commerciali e professionali: le informazioni nascoste dietro al testo o alle immagini possono riguardare l’autore del documento, orari, luoghi e tempi di creazione e realizzazione, revisioni, sistemi e dispositivi informatici utilizzati. Per farle emergere e gestirle al meglio non serve, come avveniva un paio di millenni fa, scaldare il supporto.

Il progetto Unibas-Multipartner sui metadati

Un progetto di ricerca dell’Università della Basilicata, in collaborazione con Multipartner – pmi innovativa specializzata nelle virtual data room e nella cybersecurity – ha avviato la caccia ai cosiddetti “dati impliciti” nei documenti digitali, una frontiera che promette di diventare rilevante per le aziende sia nella sicurezza informatica sia in altre funzioni come il monitoraggio interno o la gestione di operazioni e rapporti con terzi. “Le informazioni implicite ed esplicite nei documenti digitali”, questo il nome dell’iniziativa in jv tra l’ateneo e l’azienda IT, è stata presentata negli stand del Maker Faire 2021 ed è stata inserita da Italian Tech tra i 20 progetti più interessanti dell’ultima edizione dello stesso salone romano dell’innovazione.

 “Il progetto di ricerca riguarda il controllo e la tracciabilità dei documenti, ma anche l’analisi dettagliata di tutto ciò che i documenti contengono non solo nei dati espliciti, quindi nel testo del documento, ma anche nei dati impliciti: tutte le informazioni cioè contenute nei metadati del documento – spiegano i responsabili del progetto Domenico Daniele Bloisi, Ricercatore del Dipartimento di Matematica, Informatica ed Economia dell’Università della Basilicata,  e  Laura Atzeni, Project Manager di Multipartner – Questi metadati sono importantissimi: se analizzati possono fornire un valore aggiunto alle aziende, ad esempio fornendo statistiche sul lavoro interno; in contesti come le due diligence, le operazioni di Merger&Acquisition o la board communication (il flusso di informazioni e documenti di cui vengono forniti gli amministratori di una società, ndr) è essenziale d’altro canto la possibilità di oscurare alcuni dati sensibili perché non arrivino a terzi”. Il settore sanitario, in particolare nella sperimentazione clinica, e quello bancario, a partire dalle operazioni sui portafogli di mutui e crediti deteriorati, sono due campi in cui l’anonimizzazione di tutti i dati è fondamentale.

Sanificazione ma anche riscrittura dei dati

Recuperare i dati e sanificare i documenti sono due obiettivi del progetto UniBas-Multipartner (che hanno una convenzione per progetti R&D fino a fine 2022)  a cui se ne aggiunge un terzo, cioè la possibilità di “manipolare” i dati impliciti inserendo nei documenti delle ulteriori informazioni per diverse finalità: ad esempio, monitorare i download o geolocalizzare gli utenti per poter escludere dall’accesso ai dati i soggetti esterni a una area geografica. “Analisi, sanificazione, riscrittura dei dati – sottolinea Atzeni – così si può sintetizzare il progetto. In questi ambiti siamo precursori: se al momento si può dire che non c’è una richiesta specifica del mercato, vogliamo però prevedere quali sono i prossimi passi che il settore farà e vediamo nel breve termine la necessità delle aziende di controllare al massimo livello i propri documenti”.

Il modello a grafi ispirato ai social

“Per immagazzinare i dati – aggiunge Bloisi - utilizziamo tecniche ispirate ai social network e non più i tradizionali metodi basati sullo schema relazionale, che fanno uso di tabelle. Utilizziamo invece i grafi che si ispirano al concetto di personalizzazione del dato. Il gruppo di ricerca è formato da esperti di informatica e di matematica e intendiamo applicare gli algoritmi utilizzati dalla teoria dei grafi a un esempio concreto che è la piattaforma Multipartner dove troviamo tantissimi dati, tanti utenti e soprattutto una divisione dei ruoli con utenti che visualizzano alcuni dati e non altri: l’obiettivo è trasformare un sistema complesso come questo in un grande social network dei dati dove l’utente possa avere una visione più sintetica dei propri dati. Le strutture a grafi inoltre evitano i problemi per la sicurezza informatica che invece hanno i sistemi basati sulla centralizzazione”.

Radiocor ©