Organização de documentos digitalizados com o uso da tecnologia OCR
| dc.contributor.advisor | Dall'Igna, Fernando | |
| dc.contributor.author | Chaves, Bruno da Silva | |
| dc.date.accessioned | 2025-12-12T21:56:42Z | |
| dc.date.available | 2025-12-12T21:56:42Z | |
| dc.date.issued | 2025 | |
| dc.description | Trabalho de Conclusão de Curso (Artigo Científico) apresentado ao curso de Tecnologia em Análise e Desenvolvimento de Sistemas do Instituto Federal de Educação, Ciência e Tecnologia de Rondônia (IFRO) – Campus Porto Velho Calama, como requisito parcial para obtenção do Título de bacharel em Tecnologia em Análise e Desenvolvimento de Sistemas. | |
| dc.description.abstract | Atualmente, temos à disposição diversas ferramentas tecnológicas para auxiliar com as atividades que fazemos no cotidiano.Tratando-se do ambiente de trabalho, ferramentas tecnológicas podem auxiliar e automatizar algumas tarefas que são executadas rotineiramente poupando esforço manual. Neste estudo, abordaremos o desenvolvimento de um software para automatizar a organização de documentos digitalizados. O objetivo é desenvolver um software de interface gráfica web que utiliza OCR para renomear, organizar e reconhecer textos em arquivos de documentos digitalizados. Para o reconhecimento do texto foi utilizado o software de código aberto Tesseract. Também foi utilizado a linguagem de programação Python para manipular o texto dos arquivos. A interface gráfica do usuário foi desenvolvida com o Framework Flutter. Para verificar a viabilidade de desenvolver o projeto proposto, foi realizado um teste que será abordado adiante, no qual utilizou-se a ferramenta Tesseract para extrair o texto de alguns documentos digitalizados, como a funcionalidade principal do software a ser desenvolvido é renomear arquivos digitalizados com base em um ou mais padrões presentes no próprio documento. Consideramos como fator principal para taxa de sucesso do teste o reconhecimento ou não de palavras como data e nome, presentes em cada documento analisado. Os dados verificados nos testes foram satisfatórios, apresentando uma taxa de erro de apenas 10% com os demais resultados sendo 40% considerado bom e 50% considerado ótimo. Os critérios de classificação do teste serão apresentados adiante. | |
| dc.description.abstract2 | Currently, we have various technological tools available to assist with the activities we perform daily. In the workplace, technological tools can assist and automate some routine tasks, saving manual effort. In this study, we will address the development of software to automate the organization of digitized documents. The objective is to develop a web graphical interface software that uses OCR (Optical Character Recognition) to rename, organize, and recognize text in digitized document files. The open-source software Tesseract was used for text recognition, and the Python programming language was also used to manipulate the text within the files. The user graphical interface was developed using the Flutter Framework. To verify the feasibility of developing the proposed project, a test was carried out, which will be discussed later. This test utilized the Tesseract tool to extract text from some digitized documents, as the main functionality of the software to be developed is to rename digitized files based on one or more patterns present in the document itself. We considered the recognition or non-recognition of words such as date and name, present in each analyzed document, as the main factor for the test's success rate. The data verified in the tests were satisfactory, showing an error rate of only 10%, with the remaining results being 40% considered good and 50% considered excellent. The test classification criteria will be presented later. | |
| dc.identifier.citation | CHAVES, Bruno da Silva. Organização de documentos digitalizados com o uso da tecnologia OCR. Porto Velho, 2025. 24 f. Orientador: Fernando Dall'Igna. Trabalho de Conclusão de Curso (Superior de Tecnologia em Análise e Desenvolvimento de Sistemas) - Instituto Federal de Educação, Ciência e Tecnologia de Rondônia - IFRO, Porto Velho 2025. | |
| dc.identifier.uri | http://repositorio.ifro.edu.br/handle/123456789/2228 | |
| dc.language | Português | pt_BR |
| dc.language.iso | pt_BR | |
| dc.publisher.campi | Campus Porto Velho Calama | pt_BR |
| dc.publisher.program | Tecnologia em Análise e Desenvolvimento de Sistemas | pt_BR |
| dc.subject | Automatizar | |
| dc.subject | Organizar | |
| dc.subject | Renomear | |
| dc.subject | Tesseract | |
| dc.subject.keyword | Automate | |
| dc.subject.keyword | Organize | |
| dc.subject.keyword | Rename | |
| dc.subject.keyword | Tesseract | |
| dc.title | Organização de documentos digitalizados com o uso da tecnologia OCR | |
| dc.type | Trabalho de Conclusão de Curso |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- TCC_BRUNO_CHAVES.pdf
- Tamanho:
- 3.87 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
- Trabalho de Conclusão de Curso (Artigo Científico) apresentado ao curso de Tecnologia em Análise e Desenvolvimento de Sistemas do Instituto Federal de Educação, Ciência e Tecnologia de Rondônia (IFRO) – Campus Porto Velho Calama, como requisito parcial para obtenção do Título de bacharel em Tecnologia em Análise e Desenvolvimento de Sistemas.
Licença do Pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 682 B
- Formato:
- Item-specific license agreed upon to submission
- Descrição:
