OCR de Documentos: como extrair informações de CNH, RG e outros documentos

Sumário

Newsletter da QI Tech

Assine a newsletter da QI Tech e fique por dentro das notícias e análises mais importantes para fintechs, setor financeiro, cybersegurança e mercado de capitais.

Ao seguir com a Assinatura da Newsletter, declaro que li, compreendi e concordo com os termos da Política de Privacidade da QI Tech.

Uma das tecnologias que mais impulsiona a produtividade no cadastro, análise de identidade ou onboarding é o OCR, sigla para Optical Character Recognition (Reconhecimento Ótico de Caracteres, em tradução livre). 

Em síntese, é por meio do OCR que é possível converter dados de documentos diversos em informações acionáveis, legíveis por “robôs” e até editáveis. 

Essa extração de dados é feita de maneira automática e pode armazenar as informações em formato de texto em uma database. 

Valendo-se desse reconhecimento ótico de caracteres, é possível escanear documentos impressos, PDFs, e até textos dentro de imagens. 

Um exemplo de aplicação de OCR é quando você tira uma foto da sua Carteira Nacional de Habilitação (CNH) enquanto cria uma conta em um banco digital, e o sistema consegue ler os dados deste documento.

Como funciona o OCR de documentos? 

Uma aplicação que usa OCR serve basicamente para transpor dados de imagem para texto. Para isso, ela segue alguns passos feitos em milissegundos. São eles: 

  • Scan: em uma primeira varrida na imagem, o sistema detecta onde existem potenciais caracteres de texto como letras e números. Também são eliminados ruídos como fotos, ícones, marcas d’água, sombras, e outros aspectos;
  • Comparação: os caracteres são delineados por meio de tecnologias como machine learning, que busca também outras fontes similares já existentes no banco de dados – como números e letras, por exemplo; 
  • Tradução: os caracteres são convertidos em texto, seguindo a ordem das informações na imagem. Pode haver distorções, especialmente em caracteres especiais, outros alfabetos, parágrafos longos e quebra de linhas;
  • Exibição: os caracteres traduzidos são mostrados em texto e guardados em um banco de dados, e podem ser editados digitalmente.

Quais as vantagens de se usar OCR? 

Quando você consegue transferir informações de documentos e páginas impressas para um formato legível no computador em forma de texto editável, torna-se possível utilizar esses dados de diversas maneiras. 

Busca por palavras-chave, edição, inclusão em bancos de dados, comparação com os órgãos oficiais ou outras formas de background check são algumas dessas maneiras, bem como o compartilhamento de informações. 

Quando aplicada a documentos, essa leitura sistematizada pode também significar um primeiro passo em uma análise ou validação de identidade, ou em um background check. 

A solução agiliza a jornada tanto para a companhia quanto para o usuário final, por automatizar boa parte do processo manual de input de informações, evitando retrabalho e erros manuais. 

CNH: OCR de habilitação como forma de segurança

Uma das formas mais comuns de identificação é por meio da leitura dos dados em uma Carteira Nacional de Habilitação (CNH). 

Como o documento traz uma maior quantidade de informações em relação ao RG e abrange mais de 60 milhões de brasileiros, a CNH pode ser utilizada para automatizar e acelerar a grande parte dos processos de onboarding digital.

Ao extrair automaticamente os dados da CNH, você não apenas tem acesso às informações nela contidas, mas também consegue validar o próprio documento: se está dentro da validade, se corresponde à categoria necessária para o motorista, entre outros aspectos.

Com uma base de mais de 110 milhões de rostos, a QI Tech consegue ajudar a sua empresa na validação também das fotos de CNH e RG. 

A CNH é um ótimo documento para validar a identidade de um usuário por uma série de fatores. 

Além de ser unificado — todos os estados brasileiros emitem o documento no mesmo formato e modelo, e há um padrão único de numeração —, ele também tem um prazo de validade que garante que a foto do indivíduo seja sempre relativamente recente. Portanto, o processo de biometria facial também é facilitado.

Além de impedir fraudes e outros riscos ao negócio, a extração automatizada de dados também elimina a possibilidade de um cadastro ser erroneamente considerado irregular por causa de um erro de digitação do usuário, por exemplo. 

Dessa forma, você diminui as chances de rejeitar um usuário idôneo por causa disso ou de ter que estender o tempo de onboarding para que o indivíduo corrija seus dados pessoais.

Dados que a QI Tech consegue extrair: 

  • nome completo;
  • número do CPF;
  • data de nascimento;
  • nome do pai;
  • nome da mãe;
  • permissão;
  • ACC;
  • categoria;
  • número de registro;
  • validade;
  • primeira habilitação;
  • número de espelho;
  • observações;
  • local de emissão;
  • estado de emissão;
  • data de emissão;
  • número de segurança;
  • número do Renach;
  • e órgão emissor.

Enquanto isso, a foto do indivíduo presente na CNH pode ser posteriormente utilizada para um processo de validação de biometria facial com prova de vida. Assim, você tem acesso aos principais dados necessários para uma verificação de identidade e Background Check robusta, confiável e ágil — para a empresa e para o usuário.

Customização e integração

Com o OCR da QI Tech, a empresa consegue focar nos dados cruciais e otimizar a operação. A solução permite selecionar e extrair apenas os campos necessários para as validações que a empresa precisa para a sua operação.

Com isso, a empresa economiza tempo e otimiza sua operação, capturando e tratando apenas as informações que são realmente necessárias. Além de cumprir com as regulamentações, como a LGPD, que impede o uso de dados que não são relevantes para o negócio.

Por ser uma ferramenta de onboarding e antifraude completa, a QI Tech também consegue integrar o OCR de documentos com outros mecanismos de segurança como biometria facial, device scan, geolocalização e mais. 

Compartilhe esse conteúdo 😃

Equipe Blog QI Tech
Equipe Blog QI Tech
Somos o principal blog sobre serviços financeiros B2B do Brasil e a 1ª Sociedade de Crédito Direto – nº329 a oferecer infraestrutura bancária para construção de serviços financeiros. Temos a missão de democratizar o acesso ao crédito. 🚀💙

Melhores Posts

PlataformaAll-in-Onepara
criar produtos financeiros

Monte seu banco digital. Ofereça crédito e financiamento. Automatize pagamentos e cobranças. Analise clientes de maneira imediata e segura contra fraudes. Tudo o que você precisa para lançar soluções financeiras, com uma tecnologia robusta, rápida, modular e com APIs simples e de alta disponibilidade.

Rolar para cima