Analyse en composantes principales (ACP) avec SPSS pour votre mémoire : guide complet 2026
L’analyse en composantes principales (ACP) est l’une des techniques statistiques multivariées les plus utilisées dans les mémoires de master en sciences humaines, sociales et de gestion. Elle permet de réduire un grand nombre de variables corrélées en un nombre restreint de composantes (ou facteurs) qui en capturent l’essentiel de l’information. Pourtant, beaucoup d’étudiants appliquent l’ACP mécaniquement, sans comprendre ce qu’ils font ni comment interpréter les sorties de SPSS — ce qui conduit à des erreurs d’interprétation sévèrement sanctionnées par les jurys. Ce guide vous donne les clés pour conduire, interpréter et rédiger une ACP irréprochable dans votre mémoire universitaire en 2026.
L’ACP est particulièrement utile quand vous avez construit ou utilisé un questionnaire à de nombreux items et que vous souhaitez vérifier que ces items mesurent bien les dimensions théoriques que vous pensez mesurer. Elle constitue également la première étape d’une validation d’instrument de mesure, avant de calculer la fidélité (alpha de Cronbach) de chaque sous-échelle identifiée. Nous verrons comment articuler ces deux analyses dans votre mémoire.
Qu’est-ce que l’ACP et à quoi sert-elle ?
L’ACP est une technique d’analyse exploratoire multivariée proposée par Karl Pearson en 1901 et formalisée par Harold Hotelling en 1933. Son objectif est de réduire la dimensionnalité d’un jeu de données : si vous avez mesuré 20 variables corrélées entre elles, l’ACP peut vous permettre de les résumer en 3 ou 4 composantes qui capturent la majeure partie de l’information originale, avec une perte minimale.
Dans un mémoire universitaire, on l’utilise principalement pour deux finalités :
- La validation de la structure factorielle d’un questionnaire : Vous avez adapté ou créé une échelle psychométrique. L’ACP (exploratoire) vous permet de vérifier empiriquement que vos items se regroupent bien en dimensions théoriquement cohérentes.
- La réduction de données avant une analyse prédictive : Vous avez trop de variables pour une régression multiple (multicolinéarité) ; vous remplacez les variables originales par leurs scores factoriels.
Il est crucial de distinguer l’ACP exploratoire (EFA) — que couvre ce guide — de l’analyse factorielle confirmatoire (CFA), qui teste a priori un modèle de structure prédéfini et requiert des logiciels spécialisés comme R (package lavaan) ou Mplus. La CFA est l’étape suivante dans la validation d’instrument ; l’ACP exploratoire est l’étape de découverte.
Conditions d’application de l’ACP
Avant de lancer l’ACP, vérifiez que vos données respectent les conditions suivantes :
1. Variables continues ou quasi-continues
L’ACP s’applique idéalement à des variables mesurées sur des échelles continues. Pour des échelles de Likert à 5 ou 7 points, l’ACP est généralement acceptable si les distributions ne sont pas trop asymétriques. Pour des variables dichotomiques (0/1), préférez l’analyse en correspondances multiples (ACM).
2. Taille d’échantillon suffisante
La règle classique est d’avoir au moins 5 à 10 participants par item, avec un minimum absolu de 100 participants. Si vous avez 20 items, visez au moins 100-200 participants. Des échantillons plus petits donnent des solutions factorielles instables qui ne se répliquent pas. Un tableau de référence :
| Nombre d’items | Taille minimale (N) | Taille recommandée (N) |
|---|---|---|
| 5-10 | 50 | 100 |
| 10-20 | 100 | 200 |
| 20-40 | 200 | 400 |
| >40 | 300 | 500+ |
3. Intercorrélations suffisantes entre les variables
L’ACP suppose que les variables sont corrélées entre elles (sinon, il n’y a rien à factoriser). Inspectez la matrice de corrélations : la majorité des corrélations doit dépasser |.30|. Si toutes les corrélations sont inférieures à |.20|, l’ACP n’est pas appropriée.
4. Absence de valeurs manquantes excessives
SPSS exclut par défaut les cas listwise (un cas avec une seule valeur manquante est exclu de l’ACP). Si vous avez plus de 5% de valeurs manquantes, traitez-les avant l’ACP (imputation multiple, expectation-maximization).
Réaliser l’ACP sous SPSS : étape par étape
Voici la procédure exacte sous SPSS 29 (les versions antérieures sont identiques) :
- Cliquez sur Analyze → Dimension Reduction → Factor…
- Déplacez vos variables dans la case “Variables”.
- Cliquez sur Descriptives : cochez “Coefficients” (matrice de corrélations), “KMO and Bartlett’s test of sphericity”, “Anti-image”. Validez.
- Cliquez sur Extraction : dans “Method”, sélectionnez “Principal Components”. Sous “Extract”, choisissez “Based on Eigenvalue” avec le seuil à 1 (règle de Kaiser, à ajuster selon le scree plot). Cochez “Scree plot”. Validez.
- Cliquez sur Rotation : sélectionnez “Varimax” (si vous supposez que les facteurs sont indépendants) ou “Direct Oblimin” (si vous supposez qu’ils peuvent être corrélés). Cochez “Loading plot(s)” et “Rotated solution”. Validez.
- Cliquez sur Options : cochez “Exclude cases listwise” et “Suppress small coefficients” avec un seuil à .30 (pour clarifier la lecture de la matrice). Validez.
- Cliquez sur OK pour lancer l’analyse.
Interpréter le KMO et le test de Bartlett
La première sortie à regarder est le tableau “KMO and Bartlett’s Test”.
L’indice KMO (Kaiser-Meyer-Olkin)
Le KMO mesure l’adéquation de l’échantillon pour l’ACP. Il compare les corrélations observées aux corrélations partielles. Un KMO proche de 1 indique que les corrélations sont bien expliquées par des facteurs communs. Le barème d’interprétation de Kaiser (1974) :
| Valeur du KMO | Interprétation | Décision |
|---|---|---|
| >.90 | Excellent (marvelous) | Procéder |
| .80-.89 | Très bien (meritorious) | Procéder |
| .70-.79 | Bien (middling) | Procéder |
| .60-.69 | Médiocre (mediocre) | Procéder avec prudence |
| .50-.59 | Mauvais (miserable) | Retirer des items problématiques |
| <.50 | Inacceptable | Ne pas procéder à l’ACP |
Le test de sphéricité de Bartlett
Ce test vérifie que la matrice de corrélations n’est pas une matrice identité (ce qui signifierait que les variables sont indépendantes et qu’il n’y a rien à factoriser). Vous cherchez un résultat significatif (p < .05). Dans la quasi-totalité des études sur des questionnaires psychologiques, ce test est significatif. S’il ne l’est pas, vos variables ne sont pas assez corrélées pour justifier une ACP.
Dans votre mémoire, rapportez-le ainsi : “Le test de sphéricité de Bartlett est significatif (χ²(190) = 1847.3, p < .001), et l’indice KMO = .86 (très bien), confirmant que les données sont factorisables.”
Choisir le nombre de composantes à retenir
C’est la décision la plus importante et la plus délicate de l’ACP. SPSS vous fournit plusieurs outils :
La règle de Kaiser (valeurs propres > 1)
Retenez les composantes dont la valeur propre (eigenvalue) est supérieure à 1. Cette règle, simple et largement utilisée, tend cependant à surestimer le nombre de facteurs. Ne l’utilisez pas seule.
Le scree plot (graphique des éboulis)
SPSS génère un graphique représentant les valeurs propres de chaque composante en ordre décroissant. Cherchez le “coude” — le point où la courbe s’infléchit et commence à s’aplatir. Retenez les composantes situées à gauche de ce coude. C’est souvent le critère le plus fiable en pratique.
La variance expliquée totale
Inspectez le tableau “Total Variance Explained”. La somme des variances expliquées par les composantes retenues doit idéalement dépasser 60% de la variance totale pour les sciences sociales (50% est le minimum acceptable). En psychologie et en sciences de gestion, 65-75% est une cible raisonnable.
Analyse parallèle (parallel analysis)
La méthode la plus rigoureuse : elle compare vos valeurs propres observées à celles attendues sous un modèle aléatoire. Vous ne retenez que les composantes dont la valeur propre observée dépasse celle du modèle aléatoire au même rang. SPSS ne la fait pas nativement, mais vous pouvez utiliser JASP (gratuit) ou un script R pour la calculer. Les jurys avancés apprécient cet effort supplémentaire.
La rotation : varimax, oblimin et promax
La rotation transforme la solution factorielle initiale pour la rendre plus interprétable, sans changer la quantité de variance expliquée au total. Elle redistribue simplement cette variance entre les composantes.
Rotation orthogonale : Varimax
La rotation varimax suppose que les facteurs sont indépendants (non corrélés). Elle maximise la variance de chaque colonne de la matrice des composantes, produisant une structure où chaque item sature fortement sur une composante et faiblement sur les autres. C’est la rotation la plus utilisée et la plus facile à interpréter.
Choisissez varimax quand : vous supposez théoriquement que vos dimensions sont indépendantes (par exemple, différentes compétences non liées entre elles).
Rotation oblique : Direct Oblimin / Promax
Ces rotations permettent aux facteurs d’être corrélés entre eux. Elles sont plus réalistes en sciences humaines, où les dimensions psychologiques ou sociales sont rarement totalement indépendantes. Si la corrélation interfactorielle est inférieure à |.30|, la différence avec varimax est négligeable.
Choisissez oblimin/promax quand : vous supposez que vos dimensions sont reliées (par exemple, différentes formes d’anxiété). Vérifiez a posteriori la matrice de corrélations entre facteurs : si elles dépassent |.30|, la rotation oblique était justifiée.
Interpréter la matrice des composantes
Après rotation, SPSS produit la “Rotated Component Matrix” (varimax) ou la “Pattern Matrix” (oblimin). Cette matrice contient les saturations (loadings) de chaque item sur chaque composante.
Seuil de signification des saturations
La convention courante est de considérer une saturation comme significative si elle dépasse |.40| (ou |.30| pour les grands échantillons). Avec la suppression des petits coefficients que vous avez configurée dans SPSS (seuil .30), seules les saturations significatives apparaissent dans la matrice.
Items problématiques
Deux situations requièrent une attention particulière :
- Saturation croisée (cross-loading) : L’item sature significativement sur deux composantes ou plus. Il introduit de l’ambiguïté. Envisagez de le supprimer ou de l’affecter à la composante sur laquelle il sature le plus fortement, en le justifiant théoriquement.
- Item isolé (faible communauté) : L’item ne sature sur aucune composante (toutes les saturations < |.30|). Sa communauté (h²) est faible, ce qui signifie qu’il n’est pas bien expliqué par le modèle factoriel. Envisagez de le supprimer.
Nommer les composantes
Une fois que vous avez identifié quels items saturent sur chaque composante, donnez un nom théorique à chaque composante qui reflète le contenu des items qui la constituent. C’est l’étape intellectuellement la plus importante — et la plus subjective — de l’ACP. Justifiez chaque nom en citant votre cadre théorique. Exemple : “La première composante rassemble les items relatifs à l’évitement des situations sociales (items 3, 7, 12, 15) et à la peur du jugement (items 2, 9, 14). Conformément à la théorie de Clark & Wells (1995), nous nommons cette composante ‘Anxiété sociale anticipatoire’.”
Rédiger les résultats de l’ACP dans votre mémoire
Voici un modèle de paragraphe conforme aux normes APA 7 pour rapporter une ACP :
“Une analyse en composantes principales avec rotation varimax a été réalisée sur les 24 items de l’échelle d’auto-efficacité académique (N = 215). Les conditions préalables à l’ACP étaient réunies : le test de sphéricité de Bartlett est significatif (χ²(276) = 2143.7, p < .001) et l’indice KMO = .87, indiquant une adéquation très satisfaisante. Le scree plot et la règle de Kaiser ont conduit à retenir trois composantes, expliquant cumulativement 61.4% de la variance totale (composante 1 : 29.7% ; composante 2 : 18.3% ; composante 3 : 13.4%). Deux items (items 11 et 18) ont été supprimés en raison de saturations croisées (>.40 sur deux composantes). La première composante (8 items) renvoie à l’auto-efficacité en contexte de présentation orale (α = .87) ; la deuxième (7 items) à l’auto-efficacité rédactionnelle (α = .83) ; la troisième (7 items) à l’auto-efficacité organisationnelle (α = .79). Les résultats détaillés sont présentés au Tableau 3.”
Accompagnez ce paragraphe d’un tableau récapitulatif présentant, pour chaque item, ses saturations sur chaque composante et sa communauté (h²). C’est une exigence standard dans les mémoires de psychologie et de gestion.
Pour la rédaction de votre bibliographie, consultez notre guide APA 7e édition. Pour comprendre comment articuler l’ACP avec votre cadre théorique, notre article sur la méthodologie de recherche vous donnera les bases nécessaires. Si vous utilisez R ou SPSS et souhaitez aller vers une validation plus poussée, consultez notre article sur la analyse de données pour mémoire.
Erreurs fréquentes à éviter
- Utiliser l’ACP sans vérifier les conditions préalables : Ne passez jamais directement à la procédure Factor sans vérifier le KMO, le test de Bartlett et la matrice de corrélations. Un jury compétent vous demandera ces vérifications.
- Appliquer la règle de Kaiser aveuglément : La règle des valeurs propres > 1 peut conduire à retenir trop de composantes, surtout avec de nombreuses variables. Toujours corroborer avec le scree plot.
- Ignorer les communautés : SPSS produit un tableau des communautés (Initial et Extraction). Une communauté d’extraction très faible (<.30) pour un item indique qu’il n’est pas bien capturé par la solution factorielle retenue.
- Ne pas justifier les noms des composantes : Nommer une composante “Facteur 1” sans explication théorique est insuffisant. Le nom doit refléter le contenu des items et être ancré dans votre revue de littérature.
- Confondre ACP et régression : L’ACP est descriptive/exploratoire. Elle ne permet pas de conclure sur des relations causales entre les composantes et d’autres variables. Pour cela, une régression sur les scores factoriels (ou une modélisation par équations structurelles) est nécessaire.
- Ne pas vérifier la fidélité après l’ACP : L’ACP identifie des dimensions ; le coefficient alpha de Cronbach (ou l’oméga de McDonald) vérifie que les items de chaque dimension mesurent bien le même construit de façon cohérente. Ces deux analyses sont complémentaires et toutes deux attendues dans un mémoire qui valide un instrument.
Besoin d’aide pour structurer votre analyse ou rédiger votre section méthodologie ? Tesify vous accompagne dans la structuration de votre mémoire et la rédaction de vos sections méthodologiques.
FAQ
Quelle est la différence entre ACP et analyse factorielle dans SPSS ?
Dans SPSS, la procédure s’appelle “Factor Analysis” mais vous pouvez choisir la méthode d’extraction “Principal Components” pour faire une ACP, ou “Maximum Likelihood” / “Principal Axis Factoring” pour une analyse factorielle commune. La différence technique : l’ACP utilise des communautés initiales de 1 (elle explique toute la variance, y compris l’erreur), tandis que l’AF commune n’explique que la variance commune entre items. Pour les mémoires de master en sciences humaines, les deux donnent généralement des résultats très similaires quand le nombre d’items est élevé et les communautés sont fortes.
Mon KMO est à .65 : puis-je quand même faire une ACP ?
Un KMO entre .60 et .69 est classé “médiocre” mais pas rédhibitoire. Procédez à l’ACP avec prudence et inspectez la matrice anti-image : les éléments diagonaux (mesures individuelles de KMO) doivent tous dépasser .50. Si certains items ont un MSA (measure of sampling adequacy) très bas, envisagez de les retirer un par un et de relancer l’analyse. Un KMO amélioré après suppression de quelques items problématiques justifie de conserver la solution.
Combien de variance expliquée est suffisant pour une ACP dans un mémoire ?
En sciences sociales et humaines, un seuil de 50-60% de variance totale expliquée est généralement considéré comme acceptable, même si 60-75% est préférable. Ce seuil est plus faible qu’en sciences dures car les construits psychologiques et sociaux sont intrinsèquement plus complexes et bruyants. L’essentiel est de justifier votre solution sur des bases théoriques solides, pas seulement statistiques.
Varimax ou oblimin : comment choisir la rotation ?
Si vos facteurs sont censés être théoriquement indépendants, utilisez varimax (rotation orthogonale). Si vous pensez qu’ils peuvent être corrélés (ce qui est souvent plus réaliste en psychologie et sociologie), utilisez Direct Oblimin ou Promax (rotations obliques). En pratique, lancez les deux et comparez. Si la corrélation interfactorielle dans la solution oblique est inférieure à |.30|, les deux solutions seront très similaires et varimax suffit. Si elle dépasse |.30|, la solution oblique est plus appropriée.
Dois-je calculer l’alpha de Cronbach après l’ACP ?
Oui, systématiquement. L’ACP identifie les dimensions ; l’alpha de Cronbach vérifie la fidélité interne de chaque dimension. Pour chaque groupe d’items formant une composante, calculez l’alpha sous SPSS (Analyze → Scale → Reliability Analysis). Un alpha ≥ .70 est acceptable, ≥ .80 est bon, ≥ .90 est excellent (mais peut indiquer une redondance excessive entre items). Si un item augmente l’alpha quand on le retire (“alpha if item deleted”), envisagez sa suppression.
Peut-on faire une ACP avec moins de 100 participants ?
Techniquement oui, mais la solution sera instable et peu généralisable. Si vous avez moins de 100 participants, des études de simulation montrent que les saturations peuvent varier considérablement d’un échantillon à l’autre. Si votre contrainte est la taille d’échantillon, réduisez le nombre d’items (moins de 10, ratio 10:1 participants/items) et reconnaissez cette limite dans votre mémoire. Alternativement, utilisez un test exact de McDonald (ω) plutôt que l’ACP si votre objectif est uniquement la validation de fidélité.




Leave a Reply