Ce script Python analyse les données de prénoms en France pour les années 2003 et 2004, offrant une exploration détaillée de la distribution des prénoms.
- 📂 Chargement et fusion des fichiers de prénoms de 2003 et 2004
- 🔍 Identification des 10 prénoms les plus fréquents par année
- 👧👦 Analyse des prénoms les plus fréquents par genre
- 💾 Exportation des données traitées dans des fichiers CSV
- Python 3.7 ou supérieur
- Bibliothèques requises :
- pandas
- logging
- Dézipper le projet
- Lancer le script
main.py - Lire le journal des opérations (
prenoms_processing.log) - Lire les fichiers générés (
Prenoms2003-2004.csv,Prenoms2003-2004_Jointure.csv) - Lire les top 10 prénoms pour chaque année (
Top 10 prénoms en 2003 :,Top 10 prénoms en 2004 :)
Prenoms2003-2004.csv: Données fusionnées des deux annéesPrenoms2003-2004_Jointure.csv: Données agrégées par prénomprenoms_processing.log: Journal détaillé des opérations
Le logging est un mécanisme de suivi des événements qui se produisent pendant l'exécution d'un programme logiciel. Il a été utilisé ici dans ce script pour débugger les erreurs au développement.
DEBUG: Informations détaillées pour le débogageINFO: Confirmation du bon fonctionnementWARNING: Avertissements sur des problèmes potentielsERROR: Erreurs qui bloquent une fonctionCRITICAL: Erreurs très graves pouvant arrêter le programme
logging.basicConfig(
level=logging.INFO, # Niveau minimum de logs
format='%(asctime)s - %(levelname)s: %(message)s',
handlers=[
logging.FileHandler('prenoms_processing.log'), # Log dans un fichier
logging.StreamHandler(sys.stdout) # Log dans la console
]
)# Log informatif
logging.info("Chargement du fichier de prénoms")
# Log d'avertissement
logging.warning("Données incomplètes détectées")
# Log d'erreur
logging.error("Impossible de charger le fichier CSV")- Vérification de l'existence des fichiers
- Validation des colonnes requises
- Gestion robuste des erreurs de lecture CSV
- Journalisation détaillée des problèmes
Projet soumis à la licence MIT
SYAN HILAIRE--BENAMOR (https://github.com/SyanCode)
Note : Ce projet est un exemple d'analyse de données démographiques utilisant Python et pandas.