- O programa tem como objetivo separar um PDF contendo vários documentos digitalizados em folhas frente e verso (ou mais). É identificado quantas paginas devem ter cada documento, então o programa os extrai e os salva como documentos individuais. Isso facilita a organização e o gerenciamento dos documentos digitalizados, tornando mais fácil acessar e trabalhar com cada documento separadamente.
- Python
- Biblioteca tkinter: Tkinter é uma biblioteca padrão do Python para criar interfaces gráficas de usuário (GUI)
- Bibliotecas pdf2image e PyPDF2: Tanto
pdf2image
quantoPyPDF2
são bibliotecas em Python usadas para manipular e extrair informações de documentos PDF. Enquantopdf2image
foca na conversão de páginas de PDF em imagens,PyPDF2
é mais abrangente, permitindo a extração de texto, metadados e objetos PDF, bem como operações como mesclagem, divisão e criptografia de arquivos PDF. - Poppler: Poppler é uma biblioteca de software livre, de código aberto, amplamente utilizada para renderizar e manipular documentos no formato PDF. Ele fornece funcionalidades para visualizar, converter e extrair conteúdo de arquivos PDF. Poppler é escrito em C++ e possui interfaces disponíveis para várias linguagens de programação.
- No exemplo, é apresentado um PDF simulando um documento digitalizado que inclui cinco documentos distintos, cada um com dados dispostos na frente e no verso da folha.