Organização de documentos digitalizados com o uso da tecnologia OCR
Carregando...
Arquivos
Data
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
Atualmente, temos à disposição diversas ferramentas tecnológicas para auxiliar com as atividades que fazemos no cotidiano.Tratando-se do ambiente de trabalho, ferramentas tecnológicas podem auxiliar e automatizar algumas tarefas que são executadas rotineiramente poupando esforço manual. Neste estudo, abordaremos o desenvolvimento de um software para automatizar a organização de documentos digitalizados. O objetivo é desenvolver um software de interface gráfica web que utiliza OCR para renomear, organizar e reconhecer textos em arquivos de documentos digitalizados. Para o reconhecimento do texto foi utilizado o software de código aberto Tesseract. Também foi utilizado a linguagem de programação Python para manipular o texto dos arquivos. A interface gráfica do usuário foi desenvolvida com o Framework Flutter. Para verificar a viabilidade de desenvolver o projeto proposto, foi realizado um teste que será abordado adiante, no qual utilizou-se a ferramenta Tesseract para extrair o texto de alguns documentos digitalizados, como a funcionalidade principal do software a ser desenvolvido é renomear arquivos digitalizados com base em um ou mais padrões presentes no próprio documento. Consideramos como fator principal para taxa de sucesso do teste o reconhecimento ou não de palavras como data e nome, presentes em cada documento analisado. Os dados verificados nos testes foram satisfatórios, apresentando uma taxa de erro de apenas 10% com os demais resultados sendo 40% considerado bom e 50% considerado ótimo. Os critérios de classificação do teste serão apresentados adiante.
Descrição
Trabalho de Conclusão de Curso (Artigo Científico) apresentado ao curso de Tecnologia em Análise e Desenvolvimento de Sistemas do Instituto Federal de Educação, Ciência e Tecnologia de Rondônia (IFRO) – Campus Porto Velho Calama, como requisito parcial para obtenção do Título de bacharel em Tecnologia em Análise e Desenvolvimento de Sistemas.
Palavras-chave
Automatizar, Organizar, Renomear, Tesseract
Citação
CHAVES, Bruno da Silva. Organização de documentos digitalizados com o uso da tecnologia OCR. Porto Velho, 2025. 24 f. Orientador: Fernando Dall'Igna. Trabalho de Conclusão de Curso (Superior de Tecnologia em Análise e Desenvolvimento de Sistemas) - Instituto Federal de Educação, Ciência e Tecnologia de Rondônia - IFRO, Porto Velho 2025.
