Se la tua organizzazione ha tantissime informazioni contenute in PDF accumulati nel corso degli anni e non sa come sfruttarli al meglio ti potrebbe essere utile sapere che ora c’è un modo semplice e veloce per utilizzarli.
Fin ora i PDF con layout complessi o solo con immagini sono stati ostici da analizzare con metodi tradizionali. Si stima che circa l’80-90% dei dati organizzativi globali giace sotto forma di informazioni non strutturate all’interno di documenti.
Per leggere questi PDF si rendeva necessario l’uso di software di riconoscimento ottico dei caratteri (OCR) per trasformarli in dati utilizzabili, una sfida particolarmente ardua quando si ha a che fare con documenti datati o che includono scrittura a mano.
A differenza dell’OCR tradizionale, i modelli linguistici di grandi dimensioni (LLM) dotati di capacità visive analizzano i documenti con un approccio quasi umano, riconoscendo relazioni tra elementi visivi e comprendendo sfumature contestuali. L’architettura consente l’utilizzo di LLM open source installati in locale, configurabili con fine-tuning specifico per garantire che nessun dato sensibile vada oltre il perimetro aziendale, eliminando i rischi dei servizi SaaS che non offrono questo livello di controllo.
Ex Machina ha creato COSMO42, una piattaforma AI che trasforma il tuo repository documentale in una risorsa importante e un valore andando oltre alla semplice digitalizzazione, analizzando gli archivi per estrarne conoscenza strutturata e creando assistenti digitali personalizzati. La soluzione integra nativamente i sistemi IAM esistenti, con controllo granulare dei ruoli che garantisce l’accesso selettivo alle informazioni in base alle autorizzazioni utente. Questo approccio basato sul contesto permette di gestire meglio layout complessi, interpretare tabelle e distinguere tra elementi del documento come intestazioni e corpo del testo.
Il sistema opera in modalità completamente blindata: tutte le elaborazioni avvengono nell’infrastruttura aziendale senza trasmissione esterna di dati, preservando know-how e segreti industriali attraverso un modello di Retrieval Augmented Generation (RAG) che mantiene i documenti originali nel repository protetto. Ma COSMO42 non si ferma ai PDF infatti può analizzare qualsiasi formato visualizzabile, per esempio files di testo, fotografie, video, scontrini, appunti scritti a mano creando quindi un archivio vivo e consultabile facilmente in modo naturale chiedendo informazioni sia in modo testuale che vocale.
Con COSMO42, puoi trovare rapidamente informazioni precise in migliaia di documenti, ottenere suggerimenti basati sui tuoi dati storici e ridurre il lavoro manuale di estrazione dati in diversi ambiti, pubblica amministrazione, università, biblioteche, finanza e case editrici. L’architettura compliant al GDPR assicura la massima tutela della privacy rendendo la piattaforma ideale per organizzazioni che gestiscono dati sensibili o soggetti a regolamentazioni stringenti.
Se vuoi scoprire di più sulle nostre soluzioni AI esplora il nostro sito