C'è un numero che mi ha cambiato la prospettiva sul mio lavoro: 80-90%. È la percentuale di dati aziendali che sono "non strutturati" — ovvero che non stanno ordinatamente in un database, ma sono dispersi in documenti, email, PDF, presentazioni, contratti.
L'ho letto per la prima volta in un articolo di Box sui dati non strutturati qualche anno fa, e all'inizio ho pensato fosse esagerato. Poi ho iniziato a guardare le aziende con cui lavoravo. E mi sono reso conto che, se mai, quel numero è ottimistico.
Il tesoro nascosto che ignoriamo
Pensaci un attimo. La tua azienda probabilmente ha un CRM perfettamente organizzato, un gestionale con tutti i dati contabili in ordine, magari un ERP che traccia ogni movimento di magazzino. Questi sono i "dati strutturati" — quelli che stanno in tabelle, con righe e colonne, interrogabili con una query.
Ma dove sta la vera conoscenza della tua organizzazione?
Sta nel contratto firmato tre anni fa con quella clausola particolare che nessuno ricorda. Sta nell'email del commerciale che spiega perché quel cliente ha esigenze specifiche. Sta nel verbale della riunione dove si è deciso di cambiare strategia. Sta nelle slide della presentazione al board che nessuno ha più aperto.
Secondo un'analisi di Athento sul futuro dei dati non strutturati, i dati non strutturati stanno crescendo a un ritmo del 55-65% all'anno. E la maggior parte delle aziende non ha idea di cosa ci sia dentro.
Il problema non è conservare, è trovare
Ho un cliente — uno studio di consulenza con 40 anni di storia — che ha un archivio documentale impressionante. Migliaia di pratiche, centinaia di migliaia di documenti. Un patrimonio di conoscenza accumulato in decenni.
Il problema? Quando un partner senior va in pensione, quella conoscenza se ne va con lui. Perché i documenti ci sono, ma trovarli è un'impresa. Il giovane consulente che deve gestire una pratica simile a una del 2015 non sa nemmeno che quella pratica esiste.
Non è un problema di storage. È un problema di accessibilità.
Come nota Nanonets nel loro blog sull'IDP, i dipendenti passano in media il 19% della loro settimana lavorativa — quasi un giorno intero — solo a cercare informazioni. Non a lavorarci sopra. A cercarle.
Perché l'AI cambia le regole del gioco
Fino a qualche anno fa, l'unica soluzione era l'organizzazione manuale. Cartelle, tag, metadati compilati a mano, sistemi di archiviazione con regole rigide. Funziona, certo. Ma richiede disciplina costante e non scala.
L'intelligenza artificiale ha cambiato tutto per un motivo semplice: può "leggere" i documenti e capirne il contenuto. Non cerca solo parole chiave — capisce il significato.
Ti faccio un esempio concreto. Con un sistema tradizionale, se cerchi "rescissione anticipata" trovi solo i documenti che contengono esattamente quelle parole. Con un sistema basato su AI, trovi anche i documenti che parlano di "risoluzione prima della scadenza", "uscita anticipata dal contratto", "termine anticipato dell'accordo". Perché l'AI capisce che sono concetti equivalenti.
V7 Labs spiega bene questo concetto nella loro guida all'analisi documentale: non si tratta più di cercare stringhe di testo, ma di cercare significati.
Il paradosso dell'abbondanza
Ecco la cosa paradossale: più documenti hai, più sei ricco di informazioni, ma più sei povero di conoscenza accessibile.
Un'azienda con 10.000 documenti ben organizzati è più efficiente di una con 1.000.000 di documenti in cui nessuno trova nulla. Il volume è diventato un problema, non un vantaggio.
Ho visto studi legali paralizzati dalla loro stessa storia. Avvocati che rifanno ricerche già fatte da colleghi anni prima, semplicemente perché non sanno che esistono. Aziende che perdono cause perché non trovano il documento che dimostrerebbe la loro posizione — documento che è lì, da qualche parte, in uno dei mille server.
La soluzione non è solo tecnologica
Quando parlo con i clienti di questo problema, la tentazione è sempre quella di cercare una soluzione puramente tecnologica. "Compriamo un software e risolviamo."
Non funziona così.
Il software è necessario, certo. Ma serve anche un cambio di mentalità. Bisogna smettere di pensare ai documenti come a file da archiviare e iniziare a pensarli come a conoscenza da rendere accessibile.
Questo significa, per esempio, che quando crei un documento dovresti chiederti: "Tra tre anni, qualcuno riuscirà a trovarlo quando ne avrà bisogno?" Se la risposta è no, stai creando un problema futuro, non una risorsa.
Cosa fare, concretamente
Se ti riconosci in quello che ho descritto — e statisticamente, con l'80-90% di dati non strutturati, probabilmente sì — ecco da dove iniziare.
Primo: fai una mappatura onesta. Quanti documenti ha la tua organizzazione? Dove sono? In quanti sistemi diversi? Quanti sono effettivamente ricercabili? La risposta ti sorprenderà, quasi sempre in negativo.
Secondo: identifica i "punti di dolore". Dove le persone perdono più tempo a cercare? Quali informazioni vengono richieste più spesso? Quali documenti vengono ricreati da zero perché nessuno trova gli originali?
Terzo: valuta soluzioni che usino l'AI per la ricerca semantica. Non tutti i software di gestione documentale sono uguali. Quelli che usano solo ricerca per parole chiave sono obsoleti. Hai bisogno di qualcosa che capisca il contenuto, non solo il testo.
Quarto — e questo è il punto critico — scegli soluzioni che rispettino la riservatezza. Molti servizi cloud di AI documentale processano i tuoi documenti su server esterni. Per certi tipi di contenuti (legali, sanitari, finanziari), questo è inaccettabile. Esistono alternative on-premises che ti danno le stesse capacità senza far uscire i dati.
Il futuro è già qui
La buona notizia è che le tecnologie per risolvere questo problema esistono già. Non stiamo parlando di fantascienza — stiamo parlando di strumenti disponibili oggi.
La cattiva notizia è che molte organizzazioni non se ne sono ancora accorte. Continuano a operare come se fossimo nel 2010, accumulando documenti senza renderli accessibili.
Chi si muove prima avrà un vantaggio competitivo enorme. Perché mentre i concorrenti cercano informazioni per giorni, tu le troverai in secondi. Mentre loro rifanno lavori già fatti, tu costruirai su quello che è già stato creato.
L'80-90% dei tuoi dati è invisibile. La domanda è: vuoi continuare a ignorarlo, o vuoi iniziare a usarlo?
Per capire come trasformare dati non strutturati in ricerca operativa, la pagina Tecnologia è il punto di partenza più utile.



