Skip to content

Latest commit

 

History

History
15 lines (11 loc) · 1.62 KB

README.md

File metadata and controls

15 lines (11 loc) · 1.62 KB

PDFFador

Resumo

  • O programa tem como objetivo separar um PDF contendo vários documentos digitalizados em folhas frente e verso (ou mais). É identificado quantas paginas devem ter cada documento, então o programa os extrai e os salva como documentos individuais. Isso facilita a organização e o gerenciamento dos documentos digitalizados, tornando mais fácil acessar e trabalhar com cada documento separadamente.

Principais tecnologias

  • Python
  • Biblioteca tkinter: Tkinter é uma biblioteca padrão do Python para criar interfaces gráficas de usuário (GUI)
  • Bibliotecas pdf2image e PyPDF2: Tanto pdf2image quanto PyPDF2 são bibliotecas em Python usadas para manipular e extrair informações de documentos PDF. Enquanto pdf2image foca na conversão de páginas de PDF em imagens, PyPDF2 é mais abrangente, permitindo a extração de texto, metadados e objetos PDF, bem como operações como mesclagem, divisão e criptografia de arquivos PDF.
  • Poppler: Poppler é uma biblioteca de software livre, de código aberto, amplamente utilizada para renderizar e manipular documentos no formato PDF. Ele fornece funcionalidades para visualizar, converter e extrair conteúdo de arquivos PDF. Poppler é escrito em C++ e possui interfaces disponíveis para várias linguagens de programação.

Exemplo Pratico

  • No exemplo, é apresentado um PDF simulando um documento digitalizado que inclui cinco documentos distintos, cada um com dados dispostos na frente e no verso da folha.

image](https://youtu.be/OMdcjv0o68M)