Primeiro clone o repositório na sua máquina
Após a clonagem entre na pasta pdf_extractor e em seguida crie uma pasta pdfs para guardar os seus pdfs
Crie um ambiente virtual *Opcional
python -m venv envApós criar o ambiente virtual *Opcional
source ./env/bin/activeCertifique-se de instalar os seguintes componentes para o sistema operacional:
tesseract-ocr poppler-utils
Após concluídas as etapas anteriores:
Instale as extensões do python
pip install -r requirements.txtRode o programa
python setup.py