Categorias

Scanners de OCR são ou digitar o texto ou scanner para aquisição de dados . Texto de entrada Scanner ler todo o documento , ou pelo menos grande parte dela. A entrada de dados pode ser alimentado manualmente ou o scanner pode ter o poder de leitura , classificação e capacidade de empilhamento automático de dados. Quando um scanner é usado para digitar o texto, a mudança ocorre durante ou após a digitalização. Scanners de captura captura de dados e formatar os dados durante o processo de digitalização , e nenhuma modificação humana de dados ocorre . Devido a isso , um scanner de captura de dados deve ser mais precisa.

tipos

Tipos de scanners podem ser fixos ou portáteis. Scanners fixos, como os scanners chão, tiras e tambor de usar principalmente para digitar um texto para ler , processar e armazenar dados de imagens no seu computador, onde você pode modificar ou formatar o texto capturado contrário. Scanners portáteis, tais como canetas digitais ou scanner de código de barras , use o texto ou de captura de dados para ler e processar informações de dados e , em seguida, armazená-la para posterior edição ou " bloco " dados para evitar edição.

métodos 

Em suma, um scanner ocr tira uma foto do documento , o scanner software OCR examina a imagem contém , em seguida, lê e converte-o em texto usando uma combinação ou método Matrix Recurso Extraction . Matriz de Correspondência é uma forma de correspondência de padrão , em que o leitor olha para um personagem e corresponde a um em sua biblioteca de personagens ou modelos de personagens . Extracção de funcionalidades não se baseia em uma biblioteca pré-definida, mas sobre as características gerais, tais como áreas abertas , formas fechadas e das linhas se cruzam ao decifrar caracteres. Extração recurso também atende pelo nome de Intelligent Character Recognition ou ICR .

benefícios

A vantagem mais significativa do uso de um scanner OCR é a eliminação de erros de entrada de dados os seres. Do scanner OCR para ler os dados a velocidades que podem chegar a mais de 200 caracteres por segundo . A taxa de acerto de um leitor OCR é 99,9975 por cento, ou uma leitura errada caractere a 40.000 , em comparação com uma taxa de erro de leitura de um ser humano em 300 caracteres . Verificação de validação dígitos automático capaz de trazer a taxa de precisão de OCR para menos de uma em 3.000.000.

considerações

Original de má qualidade irá resultar em documentos OCR menos precisos. Documentos manuscritos , documentos contendo texto com estilo, documentos antigos , fotocópias e documentos enviados por fax não funcionam bem com o scanner OCR . Recomendações para documentos aceitáveis incluem caracteres de texto impresso em menos de 72 pontos , laser e texto impressora jato de tinta , documentos de fax com 200 pontos por polegada ( dpi) ou de resolução superior e os materiais impressos no mercado , tais como livros, brochuras e revistas .