Libreria per l'analisi del layout
download demo download versione di valutazione richiedi informazioni
Recogniform Layout Analysis SDK consente di effettuare l'analisi del layout di qualsiasi documento attraverso complessi algoritmi in grado di riconoscere con estrema precisione le diverse tipologie di aree che compongono la pagina.
Questa libreria identifica le seguenti tipologie di aree:
- testo
- testo invertito
- rumore
- immagini (fotografie o disegni)
- tabelle (righe, colonne e celle)
- linee orizzontali e verticali
In seguito al riconoscimento di questi elementi, è quindi possibile operare un'ulteriore sotto-classificazione definendo un insieme di regole determinabili in base alla tipologia del documento da analizzare. Ad esempio, analizzando una pagina di giornale, potremmo riconoscere come "didascalia" un'area di testo, qualora la stessa si trovi in corrispondenza della parte inferiore di un'immagine,
magari
centrata, magari con un carattere di dimensione inferiore alla media degli altri caratteri riportati nella pagina, riconosciuti come corpo del testo. Alla stessa maniera, è possibile riconoscere come "titolo" eventuali linee di testo in base alla posizione ed alla dimensione dei caratteri in esse contenuti.
Finalità dell'analisi del layout:
Generalmente obiettivo di chi effettua l'analisi del layout di un documento (sia esso un giornale, una rivista, un contratto, un modulo, una fattura, o qualsiasi altro tipo di documento) è comprenderne automaticamente la struttura, per poi identificarlo, estrarne le aree di interesse ed eventualmente effettuare il riconoscimento automatico del testo attraverso l'uso di motori di lettura ottica (OCR,
ICR, BCR), per gli usi più disparati, dalla semplice estrazione dati, all'indicizzazione automatica, alla conversione in documento elettronico editabile, mantenendo lo stesso layout dell'originale.
Per migliorare i risultati dell'analisi è importante che la qualità dell'immagine sia la migliore possibile e che, prima di essere processata da Recogniform Layout Analysis, sia sottoposta a pre-processing per effettuare:
Raddrizzamento (Deskew)
Utilizzando scanner ad
alte prestazioni, l' alimentatore automatico di fogli inevitabilmente inclina
leggermente il foglio: è possibile risolvere il problema ed ottenere immagini
diritte senza riscandire, correggendo l' inclinazione in modo automatico e
velocemente. Vengono gestiti fino a 45 gradi di inclinazione e l' angolo può
essere stimato con grande accuratezza in due modi diversi: analizzando il testo
contenuto nell' immagine o trovando il bordo nero interno al foglio. Per avere
ulteriori informazioni sul deskew è possibile dare uno sguardo al nostro
Deskew SDK
Despeckle e rimozione
del rumore
Scandendo delle fotocopie o dei microfilm, la polvere e la
sporcizia possono generare rumore nelle immagini: è possibile risolvere
il problema con la rimozione automatica del rumore. Determinando quanto grande una particella di sporco può essere, è possibile tarare il processo per le proprie immagini. Per avere ulteriori informazioni sul despeckle è possibile
dare uno sguardo al nostro Despeckle SDK
Rimozione del bordo
nero e ritaglio automatico
Utilizzando un scanner per microfilm o uno
scanner per documenti con sfondo nero, tutto intorno all' immagine viene
generato un bordo nero: è possibile risolvere il problema ottenendo immagini
pulite senza la necessità di effettuare un'altra scansione. Basta selezionare un livello di
soglia e scegliere se rimuovere il bordo scuro ritagliando l' immagine o se
sbiancarlo. Per avere ulteriori informazioni sul black border removal è possibile
dare uno sguardo al nostro Black Border Removal SDK
Esempio:
Prendiamo ad esempio un'immagine di cui è necessario eseguire l'analisi del layout: si noti come, attraverso i processi sopra descritti, il sistema riconoscerà automaticamente le aree, distinguendo tra aree di testo, testo invertito, immagini, linee, tabelle, ecc.
Come si evince dall'immagine a destra, con Recogniform Layout Analysis è possibile individuare le diverse aree con contenuto omogeneo, qui contrassegnate ciascuna
con un colore diverso. In questo caso abbiamo:
Versione di valutazione:
E' possibile scaricare una versione di valutazione del prodotto per Visual Basic, Visual C++ o Delphi
. E' anche possibile scaricare una dimostrativo completo cliccando qui.
Prezzo e ordini:
Per informazioni riguardanti il prezzo di Recogniform LayOut Analysis si prega di usare la pagina dei contatti.
Ulteriori Informazioni
Per ulteriori informazioni si prega di usare la pagina dei contatti.