FRFAM.COM >> Famille >> Technologie &Innovation >> Informatique

Comment faire une analyse de données de base dans Excel

La plupart du temps, lorsque vous exécutez des statistiques, vous souhaitez utiliser un logiciel statistique. Ces outils sont conçus pour faire des calculs comme t -tests, tests du chi carré, corrélations, etc. Excel n'est pas destiné à l'analyse de données. Mais cela ne signifie pas que vous ne pouvez pas le faire.

Malheureusement, les fonctions statistiques d'Excel ne sont pas toujours intuitives. Et ils vous donnent généralement des résultats ésotériques. Ainsi, au lieu d'utiliser les fonctions de statistiques, nous allons utiliser le complément de statistiques incontournable d'Excel :le Data Analysis Toolpak.

Le Toolpak, malgré son orthographe plutôt malheureuse, comprend un large éventail de fonctionnalités statistiques utiles. Voyons ce que nous pouvons faire avec les statistiques Excel.

Ajout de l'outil d'analyse de données Excel

Pendant que vous pouvez faites des statistiques sans le Data Analysis Toolpak, c'est beaucoup plus facile avec. Pour installer le Toolpak dans Excel 2016, accédez à Fichier> Options> Compléments .

Cliquez sur Aller à côté de "Gérer :Compléments Excel."

Comment faire une analyse de données de base dans Excel

Dans la fenêtre résultante, cochez la case à côté de Analysis Toolpak puis cliquez sur OK .

Comment faire une analyse de données de base dans Excel

Si vous avez correctement ajouté le Data Analysis Toolpak à Excel, vous verrez une Analyse de données bouton dans les Données onglet, regroupés dans l'Analyse rubrique :

Comment faire une analyse de données de base dans Excel

Si vous voulez encore plus de puissance, assurez-vous de consulter les autres compléments d'Excel.

Statistiques descriptives dans Excel

Quel que soit le test statistique que vous exécutez, vous souhaitez probablement d'abord obtenir les statistiques descriptives d'Excel. Cela vous donnera des informations sur les moyennes, les médianes, la variance, l'écart type et l'erreur, l'aplatissement, l'asymétrie et une variété d'autres chiffres.

L'exécution de statistiques descriptives dans Excel est facile. Cliquez sur Analyse des données dans l'onglet Données, sélectionnez Statistiques descriptives, et sélectionnez votre plage d'entrée. Cliquez sur la flèche à côté du champ de plage d'entrée, cliquez et faites glisser pour sélectionner vos données, puis appuyez sur Entrée (ou cliquez sur la flèche vers le bas correspondante), comme dans le GIF ci-dessous.

Comment faire une analyse de données de base dans Excel

Après cela, assurez-vous de dire à Excel si vos données ont des étiquettes, si vous voulez la sortie dans une nouvelle feuille ou sur la même, et si vous voulez des statistiques récapitulatives et d'autres options.

Comment faire une analyse de données de base dans Excel

Après cela, appuyez sur OK , et vous obtiendrez vos statistiques descriptives :

Comment faire une analyse de données de base dans Excel

Test t de Student dans Excel

Le t -test est l'un des tests statistiques les plus élémentaires, et il est facile à calculer dans Excel avec le Toolpak. Cliquez sur Analyse des données et faites défiler vers le bas jusqu'à ce que vous voyiez le t -options de test.

Comment faire une analyse de données de base dans Excel

Vous avez trois choix :

  • Test t :deux échantillons appariés pour les moyennes doit être utilisé lorsque vos mesures ou observations ont été appariées. Utilisez-le lorsque vous avez pris deux mesures sur les mêmes sujets, comme la mesure de la pression artérielle avant et après une intervention.
  • Test t :deux échantillons en supposant des variances égales doit être utilisé lorsque vos mesures sont indépendantes (ce qui signifie généralement qu'elles ont été effectuées sur deux groupes de sujets différents). Nous discuterons de la partie "écarts égaux" dans un instant.
  • Test t :deux échantillons en supposant des variances inégales est également pour les mesures indépendantes, mais est utilisé lorsque vos variances sont inégales.

Pour tester si les variances de vos deux échantillons sont égales, vous devrez exécuter un test F. Trouver F-Test à deux échantillons pour les variances dans la liste Outils d'analyse, sélectionnez-le et cliquez sur OK .

Comment faire une analyse de données de base dans Excel

Entrez vos deux ensembles de données dans les zones de plage d'entrée. Laissez la valeur alpha à 0,05 à moins que vous n'ayez une raison de la changer - si vous ne savez pas ce que cela signifie, laissez-la. Enfin, cliquez sur OK .

Excel vous donnera les résultats dans une nouvelle feuille (sauf si vous avez sélectionné Plage de sortie et une cellule de votre feuille courante) :

Comment faire une analyse de données de base dans Excel

Vous regardez la valeur P ici. S'il est inférieur à 0,05, vous avez des variances inégales . Donc, pour exécuter le t -test, vous devez utiliser l'option variances inégales.

Pour exécuter un t -test, sélectionnez le test approprié dans la fenêtre Analysis Tools et sélectionnez les deux ensembles de données de la même manière que vous l'avez fait pour le test F. Laissez la valeur alpha à 0,05 et appuyez sur OK .

Comment faire une analyse de données de base dans Excel

Les résultats incluent tout ce que vous devez signaler pour un t -test :les moyennes, les degrés de liberté (dl), la statistique t et les valeurs P pour les tests unilatéraux et bilatéraux. Si la valeur P est inférieure à 0,05, les deux échantillons sont significativement différents.

Si vous n'êtes pas sûr d'utiliser un t à une ou deux queues -test, consultez cet explicatif de UCLA.

ANOVA dans Excel

Le Toolpak d'analyse de données Excel propose trois types d'analyse de la variance (ANOVA). Malheureusement, cela ne vous donne pas la possibilité d'exécuter les tests de suivi nécessaires comme Tukey ou Bonferroni. Mais vous pouvez voir s'il existe une relation entre quelques variables différentes.

Voici les trois tests ANOVA dans Excel :

  • ANOVA :facteur unique analyse la variance avec une variable dépendante et une variable indépendante. Il est préférable d'utiliser plusieurs t -tests lorsque vous avez plus de deux groupes.
  • ANOVA :deux facteurs avec réplication est similaire au t apparié -test; il implique plusieurs mesures sur des sujets uniques. La partie "à deux facteurs" de ce test indique qu'il existe deux variables indépendantes.
  • ANOVA :deux facteurs sans réplication implique deux variables indépendantes, mais aucune réplication dans la mesure.

Nous allons passer en revue l'analyse à facteur unique ici. Dans notre exemple, nous examinerons trois ensembles de nombres, intitulés "Intervention 1", "Intervention 2" et "Intervention 3". Pour exécuter une ANOVA, cliquez sur Analyse des données , puis sélectionnez ANOVA :facteur unique .

Comment faire une analyse de données de base dans Excel

Sélectionnez la plage d'entrée et assurez-vous d'indiquer à Excel si vos groupes sont en colonnes ou en lignes. J'ai également sélectionné "Libellés dans la première ligne" ici pour que les noms de groupe soient affichés dans les résultats.

Après avoir cliqué sur OK , nous obtenons les résultats suivants :

Comment faire une analyse de données de base dans Excel

Notez que la valeur P est inférieure à 0,05, nous avons donc un résultat significatif. Cela signifie qu'il y a une différence significative entre au moins deux des groupes du test. Mais parce qu'Excel ne fournit pas de tests pour déterminer quel groupes diffèrent, le mieux que vous puissiez faire est de regarder les moyennes affichées dans le résumé. Dans notre exemple, l'intervention 3 semble être probablement celui qui diffère.

Ce n'est pas statistiquement valable. Mais si vous voulez juste voir s'il y a une différence, et voir quel groupe en est probablement la cause, ça marchera.

L'ANOVA à deux facteurs est plus compliquée. Si vous voulez en savoir plus sur quand utiliser la méthode à deux facteurs, regardez cette vidéo de Sophia.org et les exemples "sans réplication" et "avec réplication" de Real Statistics.

Corrélation dans Excel

Le calcul de la corrélation dans Excel est beaucoup plus simple que le t -test ou une ANOVA. Utilisez l'analyse des données pour ouvrir la fenêtre Outils d'analyse et sélectionnez Corrélation .

Comment faire une analyse de données de base dans Excel

Sélectionnez votre plage d'entrée, identifiez vos groupes sous forme de colonnes ou de lignes et indiquez à Excel si vous avez des étiquettes. Après cela, appuyez sur OK .

Comment faire une analyse de données de base dans Excel

Vous n'obtiendrez aucune mesure de signification, mais vous pouvez voir comment chaque groupe est corrélé avec les autres. Une valeur de un est une corrélation absolue, indiquant que les valeurs sont exactement les mêmes. Plus la valeur de corrélation est proche de un, plus la corrélation est forte.

Régression dans Excel

La régression est l'un des tests statistiques les plus couramment utilisés dans l'industrie, et Excel offre une puissance surprenante pour ce calcul. Nous allons exécuter une régression multiple rapide dans Excel ici. Si vous n'êtes pas familier avec la régression, consultez le guide de HBR sur l'utilisation de la régression pour les entreprises.

Disons que notre variable dépendante est la tension artérielle et que nos deux variables indépendantes sont le poids et la consommation de sel. Nous voulons voir lequel est le meilleur prédicteur de la tension artérielle (ou s'ils sont tous les deux bons).

Cliquez sur Analyse des données et sélectionnez Régression . Vous devez être prudent lorsque vous remplissez les cases de plage d'entrée cette fois. La plage Y d'entrée la case doit contenir votre variable dépendante unique. La Plage d'entrée X box peut inclure plusieurs variables indépendantes. Pour une simple régression, ne vous souciez pas du reste (mais n'oubliez pas de dire à Excel si vous avez sélectionné des étiquettes).

Voici à quoi ressemble notre calcul :

Comment faire une analyse de données de base dans Excel

Après avoir cliqué sur OK , vous obtiendrez une longue liste de résultats. J'ai mis en évidence la valeur P ici pour le poids et l'apport en sel :

Comment faire une analyse de données de base dans Excel

Comme vous pouvez le voir, la valeur P pour le poids est supérieure à 0,05, il n'y a donc pas de relation significative ici. La valeur P du sel, cependant, est inférieure à 0,05, ce qui indique qu'il s'agit d'un bon prédicteur de la pression artérielle.

Si vous prévoyez de présenter vos données de régression, n'oubliez pas que vous pouvez ajouter une ligne de régression à un nuage de points dans Excel. C'est une excellente aide visuelle pour cette analyse.

Statistiques Excel :étonnamment performantes

Bien qu'Excel ne soit pas connu pour sa puissance statistique, il contient en fait des fonctionnalités très utiles, telles que l'outil PowerQuery, qui est pratique pour des tâches telles que la combinaison d'ensembles de données. (Apprenez à générer votre premier script Microsoft Power Query.) Il existe également le complément de statistiques Data Analysis Toolpak, qui fait vraiment ressortir certaines des meilleures fonctionnalités d'Excel. J'espère que vous avez appris à utiliser le Toolpak et que vous pouvez maintenant jouer seul pour découvrir comment utiliser davantage de ses fonctions.

Avec cela maintenant à votre actif, faites passer vos compétences Excel au niveau supérieur avec nos articles sur l'utilisation de la fonction de recherche d'objectifs d'Excel pour plus de traitement de données et de recherche de valeurs avec vlookup. À un moment donné, vous voudrez peut-être également apprendre à importer des données Excel dans Python.


[]