FRFAM.COM >> Famille >> Technologie &Innovation >> Informatique

Importer des données Excel dans Python avec Pandas : Tutoriel étape par étape

Microsoft Excel est le tableur le plus utilisé au monde. Son interface intuitive et ses outils puissants simplifient la gestion des données au quotidien.

Pour des analyses avancées, il est temps de passer à Python. Évitez le copier-coller manuel vers une base de données : ce tutoriel vous guide pour charger vos fichiers Excel avec Pandas de manière efficace.

Note : Si vous débutez en Python, commencez par des ressources pour apprendre Python et des exemples basiques pour bien démarrer.

Qu'est-ce que Pandas ?

La bibliothèque Pandas est une librairie open source essentielle pour l'analyse et la manipulation de données en Python.

Pandas charge les données dans des objets appelés DataFrame, structurés en lignes et colonnes comme une table de base de données. Une fois chargé, le DataFrame peut être manipulé librement avec Python, débloquant d'innombrables possibilités d'analyse.

Installer Pandas

Note : Assurez-vous d'avoir Python 3.8 ou supérieur installé.

Pour utiliser Pandas, installez-le via votre terminal. Si vous préférez une solution complète, optez pour Anaconda qui inclut Pandas. Sinon, utilisez pip :

pip install pandas

Pandas dépend de NumPy, installez-la également :

pip install numpy

Pandas est prêt ! Créez votre premier DataFrame.

Préparer les données Excel

Pour cet exemple, utilisons un fichier Cars.xlsx contenant marque, modèle, couleur et année de voitures.

Importer des données Excel dans Python avec Pandas : Tutoriel étape par étape

Pandas lit automatiquement les plages de données. Le fichier est ici :

/Users/grant/Desktop/Cars.xlsx

Vous devez connaître le chemin complet de votre fichier. Ouvrez Visual Studio Code (recommandé) ou un autre éditeur comme Atom.

Écrire le script Python

Dans votre éditeur, créez script.py et intégrez Excel à Python via Pandas.

Importer les bibliothèques

Importez Pandas :

import pandas as pd

Pour les fichiers Excel multi-feuilles, importez ExcelFile (optionnel ici) :

from pandas import ExcelFile

Gérer le chemin du fichier

Définissez le chemin en variable pour plus de clarté :

cars_path = '/Users/grant/Desktop/Cars.xlsx'

Extraire les données avec pd.read_excel()

Utilisez read_excel() qui lit le fichier et retourne un DataFrame :

df = pd.read_excel(cars_path)

Affichez le résultat :

print(df)

Exécuter le script

Dans le terminal, naviguez vers le dossier et lancez :

python script.py
Importer des données Excel dans Python avec Pandas : Tutoriel étape par étape

Les données s'affichent :

Importer des données Excel dans Python avec Pandas : Tutoriel étape par étape

Examiner le DataFrame

Le DataFrame ressemble à un tableau Excel, avec en-têtes et index (de 0 par défaut). Pour supprimer l'index :

df = pd.read_excel(cars_path, index_col=None)

Aller plus loin avec Python

Chargez vos données Excel et appliquez analyses, visualisations ou automatisations. Pandas rend Python idéal pour les data scientists.

Python domine grâce à sa simplicité et sa puissance en data science.

Crédit image : Rawpixel/Depositphotos

[]