Skip to content

thomasBontempsTecrisViattech/implentationCode

Repository files navigation

PDF to JSON to DOCX

Le but de ce programme est de transformer les CV pdf pour les transformer en un fichier JSON structuré.
Le fichier JSON structuré permet ensuite de créer un documents DOCX comme bon vouloir.

Propriété :

Ce code a été réalisé par Thomas Bontemps dans le but d'une mission pour Tecris Consulting. Celui-ci utilise le travail de 1rgs de la class JsonFormer. Merci de préciser les auteurs si vous réutiliser ce code ou des parties de celui-ci.

Information

1. Installation de tesseract et de poppler

Tesseract

Avant toute utilisation de ce code, il est impératif d'installer Tesseract.
Pour l'installation sur Windows, je vous invite à suivre ce repository github

2. Installation des librairies avec conda

Le code ci-dessous permet de créer un environnement python sous conda et d'installer les librairies.
J'utilise python 3.9.18 pour utiliser les LLMs

conda create --name "ProjectName" python=3.9.18
conda activate "ProjectName"
conda install pip

Pip permet d'installer le reste des modules.

pip install requirements.txt

Python-poppler

Ce module est obligatoire pour que pdf2image fonctionne dont vous avez l'information ici.

Pour éviter des erreurs, je vous invite à l'installer avec conda comme suit :

conda install poppler

3. Set-up API Key open-ai

Ouvrir le command prompt (cmd)

Utiliser la commande suivante pour mettre en place l'API Key :
setx OPENAI_API_KEY "your-api-key-here"

Pour un setup permanent, il est possible de le mettre dans les variables d'environnements.

Autrement, il faut utiliser un fichier '.env' où stocker sa variable. Je vous invite à vous rendre sur la plateforme pour comprendre comment réaliser cette étape.

4. Modifier le fichier variable.py

Il est impératif de changer les variables afin que cela corresponde à votre dossier.

5. Créer un assistant OpenAI

Veuiller suivre le fichier creationTypeAssistantOpenAi.ipynb pour créer l'assistant voulu. Pour lancer ce programme, il est primordiale d'ajouter la libraires jupyter dans votre environnement avec la commande:
pip install jupyter

6. Lancer le programme

Pour lancer le programme, veuillez réaliser cette commande :

cd Your/Folder/Where/Main
python main.py

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published