Speaker
Alessandro Rosa
Azienda
Expert.ai
Ruolo
Software engineer
Lingua
Italiano
Speech
In questo intervento verrà presentata una panoramica completa dei processi di analisi di documenti non strutturati utilizzando un tool avanzato basato su una combinazione di tecnologie ibride, come il machine learning e metodi euristici. Saranno trattati i seguenti aspetti chiave:
Estrazione del testo tramite OCR: processi di riconoscimento ottico dei caratteri per digitalizzare e rendere ricercabili i contenuti testuali.
Analisi del layout: identificazione dell'ordine di lettura, gerarchia dei titoli, struttura della tabella dei contenuti (TOC) e gestione delle tabelle.
Estrazione di informazioni rilevanti: individuazione automatica di coppie chiave-valore e dati significativi all'interno del documento.
Classificazione dei documenti: categorizzazione automatica di tipologie documentali come fatture, bolle, report e CID.
Estrazione di campi specifici: focalizzazione su campi particolari a seconda della tipologia di documento, come importi o date in fatture.
Questo approccio consente di automatizzare e ottimizzare l'elaborazione di grandi volumi di documenti, riducendo significativamente i tempi di gestione manuale e migliorando la precisione dell'estrazione delle informazioni.
Bio
Laureato in Filosofia e Linguistica Computazionale presso l’Università di Bologna, Alessandro ha completato la sua formazione con una tesi su Smart Document Understanding.
Da due anni lavora come data scientist in expert.ai, concentrandosi sull'intelligenza artificiale generativa e contribuendo a progetti all'avanguardia nel campo dell'AI e del machine learning.