L'un des calculs statistiques les plus simples et courants dans Excel est celui de la corrélation. Cette mesure descriptive révèle si deux variables sont liées. Avec les bonnes fonctions, obtenir le coefficient de corrélation est un jeu d'enfant.
Dans ce guide détaillé, nous explorerons la définition de la corrélation, ses interprétations, puis les méthodes pour la calculer dans Excel : via la fonction CORREL, les nuages de points et l'outil d'analyse de données. Nous aborderons enfin une introduction à la régression linéaire pour approfondir vos analyses.
La corrélation mesure le degré de liaison entre deux variables. Prenons deux variables sans lien apparent :

Ces points (axe X et Y) sont aléatoires et indépendants.
À l'inverse, ces variables sont corrélées :

Lorsque l'une augmente, l'autre suit la même tendance (corrélation positive). Une diminution inverse indique une corrélation négative.
Ce coefficient, noté r, varie de -1 à +1. Une valeur de 0 indique l'absence de relation linéaire. -1 est une corrélation négative parfaite, +1 une positive parfaite.
Par exemple, r = 0,5 signale une corrélation positive modérée. Attention : la corrélation ne détecte que les relations linéaires. Des liens non linéaires peuvent donner r = 0 malgré une forte association :

Excel intègre la fonction CORREL à syntaxe simple :
=CORREL(plage1; plage2)Plage1 et plage2 sont vos ensembles de données. Le résultat est le coefficient r.
Exemple avec des voitures (modèle/année et valeur) :

Ici, r ≈ 0,1 indique une faible corrélation positive : les véhicules récents valent légèrement plus cher.
Pour une vue intuitive, créez un graphique en nuage de points : Insertion > Nuage de points.

La dispersion confirme la faible tendance positive observée avec CORREL.
Ajoutez une courbe de tendance pour plus de clarté : sous Windows, Outils de graphique > Création > Ajouter un élément de graphique > Courbe de tendance. Sur Mac, via Disposition du graphique ou Création de graphique.

Consultez notre guide pour des graphiques Excel impeccables avant toute présentation !
Pour corréler de multiples ensembles, activez l'addon Analyse de données (voir notre tutoriel d'activation).
Allez dans Données > Analyse de données > Corrélation :

Sélectionnez la plage d'entrée et la sortie :

Résultat :

Exemple sur année, population mondiale et nombres aléatoires : forte corrélation (≈1) entre année et population, faible avec les aléas.
La corrélation mesure l'association, sans impliquer causalité ni prédiction. Une corrélation n'implique pas de cause à effet !
Pour tester la causalité, utilisez la régression linéaire via Analyse de données > Régression :

Définissez plages X (explicative) et Y (réponse), puis sortie. Focalisez sur la valeur p de X : < 0,05 indique une significativité.

Exemple : l'année prédit significativement la population mondiale.
Pour multivariée (année + population sur prix pétrole) :

Les deux p < 0,05 valident les prédicteurs (attention multicolinéarité).
Cette intro simplifie ; consultez des ressources stats avancées pour la causalité approfondie.
Maîtriser la corrélation et au-delà transforme vos analyses. Commencez par ces bases avant les stats complexes.
Utilisez-vous souvent CORREL ? Quelles autres fonctions stats vous intéressent ?
[]