Please ensure Javascript is enabled for purposes of website accessibility

Organização de documentos digitalizados com o uso da tecnologia OCR

Carregando...
Imagem de Miniatura

Data

Título da Revista

ISSN da Revista

Título de Volume

Editor

Resumo

Atualmente, temos à disposição diversas ferramentas tecnológicas para auxiliar com as atividades que fazemos no cotidiano.Tratando-se do ambiente de trabalho, ferramentas tecnológicas podem auxiliar e automatizar algumas tarefas que são executadas rotineiramente poupando esforço manual. Neste estudo, abordaremos o desenvolvimento de um software para automatizar a organização de documentos digitalizados. O objetivo é desenvolver um software de interface gráfica web que utiliza OCR para renomear, organizar e reconhecer textos em arquivos de documentos digitalizados. Para o reconhecimento do texto foi utilizado o software de código aberto Tesseract. Também foi utilizado a linguagem de programação Python para manipular o texto dos arquivos. A interface gráfica do usuário foi desenvolvida com o Framework Flutter. Para verificar a viabilidade de desenvolver o projeto proposto, foi realizado um teste que será abordado adiante, no qual utilizou-se a ferramenta Tesseract para extrair o texto de alguns documentos digitalizados, como a funcionalidade principal do software a ser desenvolvido é renomear arquivos digitalizados com base em um ou mais padrões presentes no próprio documento. Consideramos como fator principal para taxa de sucesso do teste o reconhecimento ou não de palavras como data e nome, presentes em cada documento analisado. Os dados verificados nos testes foram satisfatórios, apresentando uma taxa de erro de apenas 10% com os demais resultados sendo 40% considerado bom e 50% considerado ótimo. Os critérios de classificação do teste serão apresentados adiante.

Descrição

Trabalho de Conclusão de Curso (Artigo Científico) apresentado ao curso de Tecnologia em Análise e Desenvolvimento de Sistemas do Instituto Federal de Educação, Ciência e Tecnologia de Rondônia (IFRO) – Campus Porto Velho Calama, como requisito parcial para obtenção do Título de bacharel em Tecnologia em Análise e Desenvolvimento de Sistemas.

Palavras-chave

Automatizar, Organizar, Renomear, Tesseract

Citação

CHAVES, Bruno da Silva. Organização de documentos digitalizados com o uso da tecnologia OCR. Porto Velho, 2025. 24 f. Orientador: Fernando Dall'Igna. Trabalho de Conclusão de Curso (Superior de Tecnologia em Análise e Desenvolvimento de Sistemas) - Instituto Federal de Educação, Ciência e Tecnologia de Rondônia - IFRO, Porto Velho 2025.