22/03/2021
Potresti non saperlo, ma hai svolto un ruolo chiave nell'aiutare gli esperti a decifrare testi storici vecchi e persino antichi. Ogni volta che compili un captcha su un sito web per dimostrare che sei umano, contribuisci a questo prezioso progetto. Inoltre, partecipi a una moderna tecnologia di conversione del testo chiamata riconoscimento ottico dei caratteri (OCR). Ma cos'è l'OCR? Quali altri ruoli nascosti gioca nella tua vita? Ecco cosa devi sapere su questa cruciale tecnologia all'avanguardia.
Il riconoscimento ottico dei caratteri è una tecnologia all'avanguardia alla base di dozzine di strumenti che utilizzi ogni giorno. In parole povere, è un tipo di software che "traduce" i documenti scansionati in un formato leggibile dal computer.
Senza OCR, il tuo computer percepisce ogni documento scansionato come una singola immagine, come vediamo le fotografie o le opere d'arte. In quel formato, il tuo computer non è in grado di riconoscere singole lettere, parole o frasi. Ciò limita i modi in cui il tuo computer, e quindi tu e altri utenti, potete interagire con il documento.
Il software di scansione OCR consente al computer di "vedere" un documento scansionato nello stesso modo in cui vede i documenti di testo che potresti creare in Word, Excel o programmi equivalenti. Ciò consente al tuo computer e, di conseguenza, di interagire con i documenti scansionati nello stesso modo in cui faresti con i documenti digitali originali. Ciò comprende:
Il riconoscimento ottico dei caratteri può essere utilizzato per tradurre il testo stampato e include due processi correlati progettati per acquisire dati scritti a mano e contrassegnati da persone:
Insieme, queste soluzioni software di riconoscimento sono utili in un'ampia gamma di applicazioni e situazioni.
1. Miglioramento
Per aiutare il software OCR a tradurre con successo un documento, un software di miglioramento delle immagini come la tecnologia leader del settore Perfect Page di Kodak Alaris prima "ripulirà" le scansioni per ridurre il rumore non necessario su un documento e amplificare i dati. Più pulita è l'immagine, migliore e più accurata è la traduzione, quindi la tecnologia Perfect Page cerca e corregge automaticamente gli errori o problemi comuni di scansione e documento come:
Il software OCR può convertire in Perfect Page, la tecnologia integrata nel portafoglio di scanner Kodak Alaris per ottimizzare la chiarezza dei dati e massimizzare l'accuratezza dell'OCR, creando al contempo le dimensioni di file più piccole possibili. Di conseguenza, gli scanner Kodak Alaris forniscono una velocità di lettura OCR del 20-70% migliore * rispetto alla concorrenza e creano file di dimensioni quasi la metà di quelli dei dispositivi concorrenti.
2. Classificazione
Una volta convertiti e migliorati i dati, il passaggio successivo del processo OCR è capire quale tipo di documento è entrato nel sistema e determinare il passaggio successivo per quel tipo di documento.
OCR, ICR e OMR abilitano software di acquisizione come Kodak Capture Pro e Kodak Info Input Solution per determinare quale tipo di documento è stato importato. Quindi il software può acquisire le immagini e applicare le regole di classificazione in base al contenuto del documento, al layout del documento, ai codici a barre o ai dati di indicizzazione.
La classificazione determinerà se un documento è, ad esempio, una fattura, una cartella clinica del paziente o una registrazione fiscale. E la nostra soluzione di input delle informazioni può acquisire documenti avanzati con solo uno o due campioni per "imparare" a classificare i documenti.
Kodak Alaris ottiene questo risultato tramite algoritmi di apprendimento automatico brevettati. Il sistema utilizza una varietà di tecniche per classificare i dati: ricerca di contenuto, immagini, codici a barre e unione di un documento. Se il sistema ha scarsa fiducia in qualsiasi documento che tenta di classificare, il processo può richiedere conferma a un operatore umano, proprio come siamo chiamati a verificare testi antichi che i computer non possono decifrare utilizzando Captcha.
3. Estrazione dei dati
L'ultimo passaggio del processo OCR è l'estrazione dei dati.
Estrarre le informazioni più importanti da un documento da utilizzare come metadati o dati di indice è vitale per il recupero e l'elaborazione. La classificazione automatizzata basata su regole informa il sistema di quali informazioni chiave dovrebbero esistere all'interno di un documento e, spesso, dove queste informazioni dovrebbero essere collocate.
Le soluzioni software di Kodak Alaris possono identificare il testo nel documento utilizzando il riconoscimento di pattern e funzioni. Identificano la lingua del documento da scansionare e ordinano il testo in singole lettere, parole, frasi e paragrafi.
Successivamente, il software estrae e crea una copia di tali informazioni da utilizzare come metadati per la fase successiva del processo. Nel caso dei documenti, i metadati possono essere utilizzati per organizzare, trovare e / o inserire documenti in un altro tipo di sistema aziendale.
Con queste soluzioni, è possibile estrarre i dati in base alle regole di business e alle informazioni di cui un'azienda ha bisogno tramite ricerche nel database. Gli utenti possono impostare il processo di indicizzazione per estrarre automaticamente i dati chiave dai documenti (tramite codice a barre, OCR, ICR o OMR), riducendo i tempi di elaborazione.
La tecnologia OCR offre una miriade di vantaggi sia in ambito personale che professionale. Il software di riconoscimento ottico dei caratteri consente di tradurre il testo stampato da quasi tutti i materiali e:
Che tu te ne renda conto o no, utilizzi molte di queste funzionalità ogni giorno. Puoi anche trarre vantaggio dall'applicazione di altre persone e organizzazioni. Ad esempio, l'uso da parte della polizia della tecnologia OCR per identificare le targhe li aiuta a tenerci al sicuro. L'uso da parte delle banche del riconoscimento della firma digitale, una forma di OCR, impedisce ai potenziali ladri di identità di accedere e spendere i tuoi soldi.
I fornitori di servizi in una vasta gamma di settori possono offrirti prezzi migliori e un servizio più rapido perché sono in grado di utilizzare l'OCR per scansionare, caricare, confrontare e modificare i contratti invece di pagare singole persone per eseguire ciascuno di questi passaggi. Ogni volta che utilizzi un'app come Google Translate per tradurre un segno o un'etichetta durante il viaggio, beneficerai dell'OCR.
L'OCR può essere particolarmente utile sul posto di lavoro. Ad esempio, le aziende possono eseguire la scansione di documenti esistenti tramite il software OCR e trasformarli immediatamente in formati compatibili con i programmi di sintesi vocale.
Questo può aiutare le aziende a soddisfare gli standard di conformità ADA senza bisogno di anni di tempo e enormi quantità di denaro e ore di lavoro per arrivarci. Consente inoltre alle aziende di soddisfare le esigenze dei clienti ipovedenti in tempo reale.
In altri settori, come quello sanitario, la tecnologia OCR può letteralmente salvare vite umane. Il software di scansione per OCR può rendere l'enorme quantità di informazioni nella storia medica di un paziente salvabile, ricercabile e verificabile in modi che migliorano l'accessibilità e prevengono errori pericolosi.
Kodak Alaris comprende il ruolo fondamentale svolto dall'OCR nella scansione dei documenti, siano essi personali o professionali. Ecco perché forniamo software OCR gratuito e avanzato con ogni scanner.
I nostri scanner sono progettati per integrarsi perfettamente con gli altri tuoi strumenti digitali. Dai dispositivi intelligenti alle app ai vecchi standbys come la posta elettronica, i nostri programmi funzionano con tutte le tue infrastrutture digitali. Semplifichiamo lo spostamento, l'archiviazione e la condivisione delle informazioni, indipendentemente da come o da dove entrano nel sistema.
Il software di scansione OCR di Kodak Alaris ha aiutato i nostri clienti:
La nostra tecnologia è supportata dal nostro programma di assistenza tecnica di prim'ordine, che ti garantisce di ottenere il massimo dal tuo acquisto ogni volta. Che tu sia interessato a Kodak Alaris per applicazioni personali o professionali, abbiamo l'hardware, il software e le soluzioni di supporto giuste per te.
Informativa sulla privacy
Informativa ai sensi dell'art. 13 del D. Lgs. 196/2003 per richieste inviate attraverso il sito. La scrivente società comunica che i dati a Lei rilasciati attraverso la compilazione dei campi sotto evidenziati, sono trattati al solo fine di evadere la sua richiesta di informazioni sui prodotti e servizi forniti dalla società.
Il conferimento dei dati è facoltativo, tuttavia il loro mancato conferimento comporta l’impossibilità di ottenere quanto eventualmente richiesto.
I dati conferiti saranno trattati sia su supporto cartaceo sia informatico, oltre che in via telematica per dare esecuzione alla Sua richiesta, mediante sistemi che in ogni caso sono atti a tutelare la riservatezza dei suoi dati. I dati da lei rilasciati verranno conservati per il tempo strettamente necessario a prendere in considerazione la Sua richiesta e degli stessi potranno venirne a conoscenza tutti gli incaricati al trattamento (individuati ai fini di legge) secondo il loro profilo di autorizzazione ed eventuali responsabili della Società.
La informiamo, infine, che l'art. 7 del Decreto Legislativo succitato conferisce ad ogni soggetto, interessato al trattamento di dati personali che lo riguardano specifici diritti.
Titolare del trattamento è:
Innovate Italia S.r.l.
Via della Maglianella, 65 E/H
00166 Roma
Responsabile per il riscontro, ai sensi e per gli effetti di cui all'art. 8 del D.Lgs. n. 196/2003, è Innovate Italia S.r.l. Via della Maglianella, 65 E/H - 00166 Roma - Direzione Amministrativa\r\nLe comunicazioni potranno essere effettuate, per iscritto, inviando una richiesta:
• per posta ordinaria all'indirizzo sopra riportato;
• via mail all’indirizzo: amministrazione@innovateitaliasrl.com
Informativa sulla privacy
Informativa ai sensi dell'art. 13 del D. Lgs. 196/2003 per richieste inviate attraverso il sito. La scrivente società comunica che i dati a Lei rilasciati attraverso la compilazione dei campi sotto evidenziati, sono trattati al solo fine di evadere la sua richiesta di informazioni sui prodotti e servizi forniti dalla società.
Il conferimento dei dati è facoltativo, tuttavia il loro mancato conferimento comporta l’impossibilità di ottenere quanto eventualmente richiesto.
I dati conferiti saranno trattati sia su supporto cartaceo sia informatico, oltre che in via telematica per dare esecuzione alla Sua richiesta, mediante sistemi che in ogni caso sono atti a tutelare la riservatezza dei suoi dati. I dati da lei rilasciati verranno conservati per il tempo strettamente necessario a prendere in considerazione la Sua richiesta e degli stessi potranno venirne a conoscenza tutti gli incaricati al trattamento (individuati ai fini di legge) secondo il loro profilo di autorizzazione ed eventuali responsabili della Società.
La informiamo, infine, che l'art. 7 del Decreto Legislativo succitato conferisce ad ogni soggetto, interessato al trattamento di dati personali che lo riguardano specifici diritti.
Titolare del trattamento è:
Innovate Italia S.r.l.
Via della Maglianella, 65 E/H
00166 Roma
Responsabile per il riscontro, ai sensi e per gli effetti di cui all'art. 8 del D.Lgs. n. 196/2003, è Innovate Italia S.r.l. Via della Maglianella, 65 E/H - 00166 Roma - Direzione Amministrativa\r\nLe comunicazioni potranno essere effettuate, per iscritto, inviando una richiesta:
• per posta ordinaria all'indirizzo sopra riportato;
• via mail all’indirizzo: amministrazione@innovateitaliasrl.com