Test de Shapiro-Wilk dans un mémoire : interpréter la normalité avec SPSS 2026

tesify.team@gmail.com Avatar

5 min de lecture

Test de Shapiro-Wilk dans un mémoire : interpréter la normalité avec SPSS 2026

Avant d’appliquer un test paramétrique — test t, ANOVA, régression — dans votre mémoire, vous devez vérifier que votre variable dépendante suit approximativement une distribution normale. Le test de Shapiro-Wilk avec SPSS est le test de normalité de référence pour les petits et moyens échantillons (n < 50 à 100), unanimement recommandé par la littérature psychométrique et méthodologique française. Son interprétation, pourtant simple en apparence, soulève de nombreuses questions chez les étudiants.

Ce guide vous explique précisément ce que teste Shapiro-Wilk, comment l’exécuter sous SPSS, comment interpréter sa p-value selon la taille de votre échantillon, et quelle décision prendre pour le choix entre tests paramétriques et non paramétriques.

Réponse rapide
Dans SPSS : Analyze → Descriptive Statistics → Explore → Plots → Normality plots with tests. Interprétation : si p (Shapiro-Wilk) > 0,05, vous ne rejetez pas la normalité → test paramétrique applicable. Si p < 0,05, la normalité est rejetée → envisagez un test non paramétrique ou vérifiez si n ≥ 30 (robustesse du TCL). Ne vous fiez jamais au seul test : complétez toujours par un Q-Q plot et les indices d’asymétrie/aplatissement.

Principe du test de Shapiro-Wilk

Développé par Samuel Shapiro et Martin Wilk en 1965, le test de Shapiro-Wilk évalue si un échantillon provient d’une population normalement distribuée. Son hypothèse nulle est : H₀ : la distribution est normale. La statistique W est calculée comme le rapport de la meilleure estimation de la variance (basée sur les statistiques d’ordre) à la variance observée de l’échantillon :

W = (Σ aᵢ x₍ᵢ₎)² / Σ (xᵢ − x̄)²

W est toujours compris entre 0 et 1. Plus W est proche de 1, plus la distribution ressemble à une normale. Une valeur faible de W (et donc une p-value significative) indique un écart à la normalité.

Shapiro-Wilk vs Kolmogorov-Smirnov : lequel choisir ?

SPSS produit automatiquement les deux tests dans la procédure Explore. Voici les recommandations basées sur la simulation de Monte Carlo :

Test Taille d’échantillon recommandée Puissance Notes
Shapiro-Wilk n < 50 (fiable jusqu’à n ≈ 100) Plus puissant Recommandé dans les mémoires
Kolmogorov-Smirnov (Lilliefors) n ≥ 50 Moins puissant Moins performant pour détecter les déviations dans les queues

En pratique dans les mémoires français : référencez toujours Shapiro-Wilk, quels que soient vos effectifs. SPSS le calcule et le présente en premier dans l’output.

Procédure SPSS

Vidéo : Tests de normalité et homogénéité des variances dans SPSS — Olivier M

  1. Analyze → Descriptive Statistics → Explore
  2. Glissez votre variable dépendante dans Dependent List
  3. Si vous souhaitez tester la normalité par groupe (ex. pour un test t), glissez votre variable de groupe dans Factor List
  4. Cliquez sur Plots
  5. Cochez Normality plots with tests
  6. Optionnel : cochez également Histogram et Stem-and-leaf pour une vision complète
  7. Cliquez Continue → OK
Alternative rapide : Pour une vérification rapide sans les graphiques, vous pouvez aussi passer par Analyze → Descriptive Statistics → Descriptives → Options → Kurtosis et Skewness. Ces indices d’asymétrie et d’aplatissement permettent un premier diagnostic avant même de lancer le test formel.

Lire l’output SPSS

SPSS produit un tableau nommé Tests of Normality avec deux colonnes : Kolmogorov-Smirnov (avec correction de Lilliefors) et Shapiro-Wilk. Chaque ligne présente la statistique (W pour Shapiro-Wilk), les degrés de liberté (= n) et la p-value (Sig.).

Exemple de lecture

Groupe Statistique W dl Sig. Décision
Groupe A (n=28) .962 28 .389 Normalité retenue (p > .05)
Groupe B (n=31) .924 31 .032 Normalité rejetée (p < .05)

Dans cet exemple, la normalité est respectée pour le Groupe A mais pas pour le Groupe B. La décision dépend alors de la taille des groupes et de la sévérité de la violation (voir section suivante).

Interpréter selon la taille d’échantillon

La subtilité centrale du test de Shapiro-Wilk est sa sensibilité à la taille d’échantillon :

Petit échantillon (n < 30)

Le test manque de puissance — il peut ne pas détecter une non-normalité réelle. Un p > 0,05 dans ce contexte ne garantit pas la normalité : examinez attentivement le Q-Q plot et l’histogramme. Si la distribution a une forme en cloche approximative, le test t reste raisonnable.

Échantillon moyen (30 ≤ n ≤ 100)

C’est la zone de fonctionnement optimal du test. Un résultat p < 0,05 est un signal sérieux à prendre en compte. Vérifiez les indices d’asymétrie : si |asymétrie| < 1, la violation est modérée et le test t reste robuste. Si |asymétrie| ≥ 1, le test de Mann-Whitney ou Kruskal-Wallis est plus approprié.

Grand échantillon (n > 100)

Le test devient excessivement sensible : il rejette la normalité pour des déviations négligeables sans conséquence pratique. Avec n = 300, presque toute distribution produira un p < 0,05. Dans ce cas, la décision se prend sur les graphiques et les indices standardisés d’asymétrie et d’aplatissement :

  • Asymétrie standardisée (skewness / erreur standard) : acceptables entre −2 et +2
  • Aplatissement standardisé (kurtosis / erreur standard) : acceptables entre −2 et +2

Avec n > 200 : utilisez les seuils élargis |asymétrie| < 2 et |kurtosis| < 7 (West et al., 1995) pour invoquer la robustesse du test t via le théorème central limite.

Le Q-Q plot : indispensable complément visuel

Le Q-Q plot (Normal Q-Q Plot) que SPSS produit automatiquement est souvent plus informatif que la p-value du test de Shapiro-Wilk. Il trace les quantiles observés de votre variable contre les quantiles théoriques d’une distribution normale.

  • Points sur la ligne diagonale : distribution normale
  • Points en courbe S : distribution avec asymétrie ou aplatissement
  • Points divergeant aux extrémités : queues trop épaisses (leptokurtique) ou trop minces (platykurtique)

Dans votre mémoire, incluez le Q-Q plot en annexe et décrire visuellement l’alignement des points avec la diagonale : « Le Q-Q plot (Figure X) indique un alignement satisfaisant des points observés sur la diagonale de normalité, confirmant le résultat du test de Shapiro-Wilk (W = .962, p = .389). »

Arbre de décision : que faire si la normalité est violée ?

Shapiro-Wilk p < 0,05 ?

Non (p ≥ 0,05) : normalité retenue → Tests paramétriques (test t, ANOVA, régression) applicables

Oui (p < 0,05) : examiner n et l’asymétrie

→ n ≥ 30 et |asymétrie| < 1 : TCL → Tests paramétriques acceptables, mentionner la limite

→ n < 30 ou |asymétrie| ≥ 1 : envisager les alternatives

→ Comparaison 2 groupes : Mann-Whitney

→ Comparaison 3+ groupes : Kruskal-Wallis

→ Mesures répétées (2 niveaux) : Wilcoxon signed-rank

→ Corrélation avec variable ordinale : Spearman (ρ)

Rédiger dans votre mémoire

Modèle — normalité respectée

La normalité de la distribution des scores de performance a été vérifiée par le test de Shapiro-Wilk pour chaque groupe. Les résultats indiquent des distributions non significativement différentes de la normale dans le groupe expérimental (W(32) = .965, p = .370) et le groupe contrôle (W(29) = .955, p = .240). Les Q-Q plots confirmaient visuellement ces résultats. Le test t pour échantillons indépendants a été appliqué.

Modèle — normalité violée, recours à Mann-Whitney

Le test de Shapiro-Wilk a révélé une violation de la normalité dans le groupe B (W(22) = .891, p = .023), confirmée par une asymétrie positive (asymétrie = 1,42, ET = .48). Compte tenu de ce résultat et de la petite taille d’échantillon (n = 22 < 30), le test de Mann-Whitney a été préféré au test t pour l’analyse comparative.

Pour des informations complémentaires sur les choix statistiques dans votre mémoire, consultez notre article sur le test t vs Mann-Whitney, l’ANOVA factorielle et la méthodologie de recherche.

Structurez votre section statistiques avec Tesify : La justification des choix statistiques — vérification de la normalité, homogénéité des variances, décision paramétrique/non paramétrique — est une des sections les plus critiquées par les jurys. Tesify vous aide à rédiger cette section avec rigueur et clarté.

Questions fréquentes

Dois-je tester la normalité sur la variable brute ou sur les résidus ?

Pour une ANOVA ou une régression, testez idéalement la normalité des résidus (résidus standardisés sauvegardés après l’analyse). Pour un test t, tester la variable dépendante dans chaque groupe séparément est la pratique habituelle et suffisante dans la plupart des mémoires. La distinction est plus importante dans les analyses multivariées comme la MANOVA ou la régression multiple.

Mon test de Shapiro-Wilk est significatif mais mon histogramme ressemble à une cloche. Que faire ?

Ce cas est classique avec des échantillons moyens (n = 50–100). Le test peut détecter des déviations mineures invisibles à l’œil nu. Examinez l’asymétrie et l’aplatissement : s’ils sont proches de 0 (|valeur standardisée| < 2), les tests paramétriques restent valides. Mentionnez explicitement dans votre mémoire que le test de Shapiro-Wilk était significatif mais que les indices descriptifs confirmaient une distribution approximativement normale, justifiant le recours aux tests paramétriques.

Quelle est la limite de taille d’échantillon pour le test de Shapiro-Wilk dans SPSS ?

SPSS calcule le test de Shapiro-Wilk pour des échantillons jusqu’à n = 2000 environ. Au-delà, il produit uniquement le test de Kolmogorov-Smirnov. Cependant, même en dessous de cette limite, l’utilisation du test de Shapiro-Wilk pour n > 200 est déconseillée en raison de sa trop grande sensibilité — il détectera des déviations négligeables. Pour ces grands échantillons, fiez-vous aux graphiques Q-Q et aux indices d’asymétrie/aplatissement.

Faut-il tester la normalité pour chaque variable ou seulement pour la variable dépendante ?

Pour la plupart des tests (t, ANOVA, régression), l’hypothèse de normalité porte sur la variable dépendante (ou sur les résidus du modèle), pas sur les prédicteurs. En régression multiple, la normalité des prédicteurs n’est pas requise — seuls les résidus doivent être normalement distribués. Dans un test t, vérifiez la normalité de la variable dépendante dans chaque groupe séparément.

Peut-on utiliser une transformation logarithmique pour normaliser les données ?

Oui, une transformation log (Transform → Compute Variable → LN(X) dans SPSS) est une pratique courante pour les distributions à forte asymétrie positive (salaires, durées, scores de fréquence). Après transformation, vérifiez à nouveau le test de Shapiro-Wilk. Si la normalité est obtenue, appliquez votre test paramétrique sur la variable transformée et précisez dans votre mémoire que les analyses ont été conduites sur des données transformées en log naturel.


Leave a Reply

Your email address will not be published. Required fields are marked *