Como o OCR funciona? Explicado de forma simples e compreensível
Neste artigo, explicamos como o OCR funciona. OCR significa "Reconhecimento óptico de caracteres" e é simplesmente referido em alemão como reconhecimento de texto. Isso significa que um computador pode reconhecer texto em uma imagem digitalizada usando OCR e depois convertê-lo em um documento de texto simples.
É assim que o OCR funciona
Imagine que você recebeu uma apresentação em papel de um colega. Agora você deseja editá-los no PC porque não gosta de passagens individuais. Então, digitalize e vá para o seu programa de OCR. Agora acontece o seguinte:
- O software primeiro faz a chamada análise de layout. Para fazer isso, ela analisa o layout da página e separa imagens do texto. Ela também observa a posição deles na página. Em seguida, o número de parágrafos é contado e elementos individuais, como números de página, são salvos.
- Agora vem a parte mais difícil. O software examina os blocos de texto individuais e os divide em frases. As frases são então divididas em palavras individuais e as palavras em letras.
- O software OCR contém padrões de letras e caracteres. O programa agora compara as letras digitalizadas com esses padrões. Se eles são 99% semelhantes, o algoritmo decide que provavelmente deve ser essa letra. É muito preciso porque pode comparar muitos padrões em um curto espaço de tempo. Dessa maneira, ele diferencia com sucesso entre um "8" e um "B".
- Portanto, as letras e os caracteres são gradualmente reconhecidos. Em seguida, eles são combinados novamente como palavras e recolocados em seu lugar na frase. Assim que o software é concluído, tudo é salvo em um documento normal, que você pode editar. Feito!
Deseja testar seus conhecimentos de software? Participe do nosso grande teste de software!