Analyse thématique : meilleure méthode en 7 étapes claires
L’analyse thématique est l’une des méthodes qualitatives les plus utilisées en recherche académique française — et pourtant, c’est aussi l’une des moins bien comprises. Combien de mémoires de master ou de thèses de doctorat présentent une “analyse thématique” qui se limite, au fond, à un simple tri de citations sans véritable démarche systématique ? La confusion est réelle, et elle coûte cher : des comités de jury qui questionnent la rigueur, des articles refusés pour manque de transparence méthodologique.
Ce guide vous propose une méthode en 7 étapes concrètes, ancrée dans les standards de la recherche qualitative et adaptée aux exigences des institutions françaises. Que vous travailliez sur des données d’entretiens, des archives ou des corpus textuels, vous trouverez ici un cadre opérationnel immédiatement applicable.
Pour approfondir ce sujet, consultez également notre guide sur méthodologie de recherche et normes de citation (france).

Qu’est-ce que l’analyse thématique ? Définition et fondements
La référence fondatrice reste l’article de Virginia Braun et Victoria Clarke publié en 2006 dans Qualitative Research in Psychology — un texte cité plus de 100 000 fois selon Google Scholar. Ce n’est pas anodin : leur cadre a imposé un standard de rigueur qui fait aujourd’hui autorité dans les comités éditoriaux internationaux, y compris pour les revues françaises indexées sur Cairn.info.
Mais voilà ce que la plupart des manuels ne disent pas clairement : l’analyse thématique n’est pas une méthode “par défaut” qu’on choisit quand on ne sait pas quoi faire d’autre. C’est une approche qui implique des choix épistémologiques précis, notamment sur la question de savoir si les thèmes sont découverts dans les données (approche inductive) ou projetés sur elles à partir d’un cadre théorique préexistant (approche déductive).
En France, cette distinction prend une importance particulière dans le cadre des thèses déposées sur theses.fr, où les jurys scrutent la cohérence entre le positionnement épistémologique déclaré et les choix méthodologiques opérationnels. L’analyse thématique peut s’inscrire dans un paradigme constructiviste, interprétatif ou même réaliste critique — mais ce choix doit être explicité dès l’introduction du chapitre méthodologique.
Analyse thématique inductive vs déductive
| Critère | Approche inductive | Approche déductive |
|---|---|---|
| Point de départ | Les données elles-mêmes | Un cadre théorique existant |
| Construction des thèmes | Émergence à partir du corpus | Application de catégories prédéfinies |
| Risque principal | Manque d’ancrage théorique | Confirmation bias, données forcées |
| Usage typique | Exploration d’un phénomène peu étudié | Test ou extension d’une théorie |
| Paradigme dominant | Constructiviste / interprétatif | Post-positiviste / réaliste |
Analyse thématique vs autres méthodes qualitatives
Ici, la confusion est presque universelle — même chez des chercheurs expérimentés. L’analyse thématique est souvent confondue avec l’analyse de contenu, la grounded theory ou l’analyse phénoménologique interprétative (IPA). Ces méthodes ont des points communs, mais elles ne sont pas interchangeables.
| Méthode | Objectif principal | Niveau d’interprétation | Ancrage théorique requis |
|---|---|---|---|
| Analyse thématique | Identifier des patterns de sens | Sémantique ou latent | Flexible |
| Analyse de contenu | Quantifier des éléments textuels | Surtout manifeste | Modéré |
| Grounded Theory | Construire une théorie nouvelle | Conceptuel | Minimal au départ |
| IPA (phénoménologique) | Comprendre l’expérience vécue | Idiographique et latent | Fort (phénoménologie) |
Ce qu’on oublie souvent : l’analyse thématique est la seule de ces méthodes qui n’est pas liée à un cadre épistémologique spécifique. C’est sa force — et aussi son piège, car cette flexibilité exige que le chercheur soit d’autant plus explicite sur ses propres choix de positionnement.
Pour aller plus loin sur le cadrage épistémologique et les étapes de la recherche qualitative, le guide complet sur la méthodologie de recherche de Tesify offre un ancrage solide pour contextualiser votre démarche analytique.
Les 7 étapes de la méthode en analyse thématique
La méthode originale de Braun & Clarke propose 6 phases. Dans la pratique académique française, une 7e étape s’impose naturellement : la validation par triangulation ou par contrôle inter-codeurs, exigée par de nombreuses revues et jurys de thèse. Voici le cadre complet.

Étape 1 — Familiarisation avec le corpus
Avant tout codage, il faut lire et relire les données. Pas en diagonale : une lecture active, stylo à la main (ou annotation numérique), en notant les premières impressions, les récurrences intuitives, les formulations qui frappent. Cette étape, souvent bâclée, conditionne la qualité de tout ce qui suit.
Actions concrètes :
- Transcrire intégralement les entretiens (ou préparer les textes sources)
- Lire l’ensemble du corpus au moins deux fois sans coder
- Rédiger un mémo de première lecture (impressions générales, questions émergentes)
- Constituer un journal de bord analytique dès cette phase
Étape 2 — Génération des codes initiaux
Le code est l’unité de base de l’analyse : c’est un label court — un mot, une expression — qui capture l’essentiel d’un extrait de données. À ce stade, l’objectif est d’être exhaustif et non sélectif. Codez tout ce qui semble pertinent, même si vous n’êtes pas encore sûr de l’utilité de tel ou tel code.
Un extrait peut recevoir plusieurs codes simultanément. C’est même souhaitable : la polysémie des données est une richesse, pas un problème à résoudre.
Étape 3 — Recherche de thèmes potentiels
Les codes initiaux sont maintenant regroupés en thèmes candidats. Un thème, c’est plus qu’un sujet récurrent : c’est un pattern de sens qui dit quelque chose d’important sur les données en relation avec la question de recherche. La distinction entre thème et sujet est cruciale ici.
Astuce pratique : utilisez un tableau de tri visuel ou des post-its (physiques ou numériques dans Miro ou FigJam) pour regrouper les codes et voir émerger des clusters thématiques.
Étape 4 — Révision des thèmes
Retournez au corpus. Chaque thème candidat doit être testé : les extraits qui lui sont associés forment-ils un ensemble cohérent ? Le thème est-il distinguable des autres ? Est-il assez riche pour mériter une place dans l’analyse, ou doit-il être fusionné ou subdivisé ?
C’est l’étape la plus itérative — et la plus intellectuellement exigeante. Comptez plusieurs aller-retours entre les données brutes et votre cartographie thématique.
Étape 5 — Définition et nomination des thèmes
Chaque thème retenu reçoit un nom précis et une définition narrative. Le nom doit refléter l’essence du thème, pas simplement son sujet. Par exemple, “la peur du regard social” est un meilleur nom thématique que “regard” ou “social”.
Rédigez une phrase d’une ou deux lignes qui définit ce que capture ce thème et ce qu’il dit de votre question de recherche. Cet exercice révèle immédiatement les thèmes flous ou sous-développés.
Étape 6 — Production du rapport analytique
L’écriture n’est pas une transcription de l’analyse : elle est l’analyse. Chaque thème fait l’objet d’une section narrative qui articule les extraits de données, votre interprétation et le dialogue avec la littérature existante. Les verbatims doivent être sélectionnés pour leur pouvoir illustratif, pas pour leur fréquence.
Étape 7 — Validation et contrôle de la rigueur
Étape souvent absente dans les manuels introductifs, mais exigée dans les publications sérieuses. Les stratégies de validation comprennent :
- Le contrôle inter-codeurs (accord inter-juge) : un second chercheur code indépendamment un sous-ensemble du corpus ; le taux d’accord est calculé (kappa de Cohen ou % d’accord simple)
- La triangulation des données : croisement avec d’autres sources ou méthodes
- La validation par les participants (member checking) : retour aux participants pour vérifier la plausibilité des interprétations
- L’audit trail : documentation de toutes les décisions analytiques dans le journal de bord
Le codage des données : cœur de la démarche
Si l’analyse thématique avait un moment-clé, ce serait le codage. C’est là que se joue la qualité de toute l’analyse — et c’est souvent là que les erreurs les plus coûteuses se produisent.
On distingue classiquement trois niveaux de codage :
- Le codage descriptif : étiquette ce qui est dit explicitement (“parle de son manager”)
- Le codage interprétatif : étiquette ce qui est impliqué ou sous-entendu (“exprime une relation d’autorité conflictuelle”)
- Le codage conceptuel : ancre l’extrait dans un concept théorique (“pouvoir symbolique au sens de Bourdieu”)
Ce que la plupart des guides ne précisent pas : le niveau de codage doit être cohérent avec votre question de recherche et votre paradigme. Une recherche interprétative peut aller jusqu’au codage conceptuel dès le départ. Une approche inductive pure doit rester au niveau descriptif ou interprétatif bas lors du premier passage.
Le principe de saturation thématique
La saturation est le moment où les nouvelles données n’apportent plus de nouveaux codes ni de nouveaux thèmes. C’est un critère de clôture du corpus, pas seulement un constat a posteriori. En pratique, les chercheurs français travaillant sur des entretiens semi-directifs atteignent souvent la saturation entre 12 et 20 entretiens — mais ce chiffre varie énormément selon la complexité du phénomène étudié.
Attention : la saturation n’est pas la redondance. Des données redondantes peuvent coexister avec une saturation non atteinte si certaines dimensions du phénomène restent inexplorées.
Citer correctement en analyse thématique : APA, MLA et Chicago
Une analyse thématique rigoureuse s’appuie sur une littérature bien citée. C’est là qu’interviennent les normes de citation — et les erreurs sont légion, même chez des chercheurs confirmés.
Les trois systèmes les plus utilisés dans la recherche académique française sont APA (7e édition), MLA (9e édition) et Chicago (17e édition). Voici comment ils s’appliquent concrètement dans le contexte de l’analyse thématique :
| Norme | Format de citation dans le texte | Usage privilégié en France | Exemple (article de Braun & Clarke) |
|---|---|---|---|
| APA 7e éd. | (Auteur, Année, p. X) | Psychologie, sciences de l’éducation, sciences sociales | (Braun & Clarke, 2006, p. 79) |
| MLA 9e éd. | (Auteur page) | Lettres, langues, arts et humanités | (Braun and Clarke 79) |
| Chicago 17e éd. (notes) | Note de bas de page | Histoire, droit, sciences politiques | ¹ Virginia Braun et Victoria Clarke, « Using Thematic Analysis… » |
| Chicago 17e éd. (auteur-date) | (Auteur Année, page) | Sciences sociales, économie | (Braun et Clarke 2006, 79) |
Pour la norme APA, la 7e édition (2020) a introduit des changements significatifs, notamment pour les sources en ligne et les DOI. La référence officielle reste le guide APA du Purdue OWL, qui fait autorité même dans les universités françaises pour sa clarté et sa mise à jour régulière.
Pour les citations de verbatims dans votre analyse, une règle s’applique quel que soit le système de citation : les extraits de données primaires (entretiens, documents) ne sont pas des références bibliographiques. Ils relèvent de la confidentialité et sont cités avec des codes d’anonymisation (ex : P1, E3, ENT-07) définis dans le chapitre méthodologique.
Les erreurs de bibliographie sont parmi les plus fréquentes — et les plus évitables. Notre article sur la bibliographie APA et les 7 erreurs à éviter détaille les pièges les plus courants dans les mémoires universitaires.
Erreurs fréquentes et comment les éviter
Après avoir accompagné des dizaines de travaux de recherche, certaines erreurs reviennent avec une régularité déconcertante. Les voici, avec les correctifs concrets.
Erreur n°1 — Confondre thème et sujet
Un sujet, c’est ce dont parlent les données. Un thème, c’est ce que les données disent sur ce sujet. “La santé mentale” est un sujet. “La santé mentale perçue comme responsabilité individuelle dans un contexte de précarité professionnelle” — ça, c’est un thème.
Erreur n°2 — Présenter des comptes de fréquences comme preuve
L’analyse thématique n’est pas de l’analyse de contenu quantitative. Le fait qu’un code apparaisse 47 fois ne le rend pas plus important qu’un code apparu 3 fois si ce dernier capture quelque chose de crucial pour la question de recherche. La prévalence n’est pas la pertinence.
Erreur n°3 — Négliger la réflexivité
Le chercheur n’est pas une machine à coder neutre. Ses présupposés, son cadre culturel, sa position dans le champ scientifique influencent inévitablement l’analyse. Cette réflexivité doit être documentée — pas cachée — dans le chapitre méthodologique.
Erreur n°4 — Utiliser trop de thèmes
Un rapport thématique avec 15 thèmes et 32 sous-thèmes n’est pas plus riche : il est plus confus. La règle empirique : si vous ne pouvez pas expliquer en une phrase ce que chaque thème capture de spécifique, c’est qu’il y en a trop.
Erreur n°5 — Oublier de citer les sources secondaires
Toute affirmation méthodologique dans votre chapitre doit être sourcée. “Selon l’approche de Braun et Clarke (2006)” n’est pas du paraphrasage excessif — c’est de la transparence académique. Pour éviter les erreurs de gestion des références, consultez notre article sur la gestion des références bibliographiques et les pièges à éviter.
Outils et logiciels pour l’analyse thématique
Le choix de l’outil n’est pas neutre — il peut faciliter ou au contraire rigidifier votre démarche analytique. Voici les options réellement utilisées dans la recherche académique française.
Logiciels CAQDAS (Computer-Assisted Qualitative Data Analysis)
| Logiciel | Avantages | Limites | Coût |
|---|---|---|---|
| NVivo | Puissant, visualisations avancées, largement reconnu | Coûteux, courbe d’apprentissage élevée | ~€ 700/an (licences académiques disponibles) |
| ATLAS.ti | Flexible, bonne intégration multimédia | Interface moins intuitive | ~€ 480/an |
| MAXQDA | Interface claire, bon rapport qualité-prix | Moins répandu dans les publications françaises | ~€ 360/an |
| Taguette | Gratuit, open source, simple | Fonctionnalités limitées | Gratuit |
Une précision importante : ces logiciels gèrent le codage, ils ne font pas l’analyse à votre place. L’interprétation reste entièrement à la charge du chercheur. L’erreur classique est de confondre la facilité du codage assisté avec la rigueur analytique.
Zotero pour la gestion bibliographique
Si les logiciels CAQDAS gèrent vos données qualitatives, Zotero gère vos références bibliographiques — et son importance dans l’analyse thématique est souvent sous-estimée. Organiser ses sources par thème analytique dans Zotero, utiliser les notes et les tags, peut constituer un complément efficace au logiciel d’analyse principal.
La documentation officielle de Zotero en français est une ressource incontournable pour démarrer. Les tutoriels de la playlist DocToBib sur YouTube offrent également une présentation claire et pratique pour les chercheurs francophones.
Ressources francophones complémentaires
Pour les chercheurs francophones souhaitant approfondir leur méthode, quelques ressources de référence :
- Cairn.info : des centaines d’articles méthodologiques en sciences humaines et sociales, en accès institutionnel
- Persée : archives de revues françaises en accès libre, précieux pour retrouver les textes fondateurs
- HAL Archives ouvertes : dépôt institutionnel pour accéder aux thèses et articles en prépublication
- La vidéo Scribbr sur la méthodologie de mémoire en 5 minutes constitue une introduction utile pour les étudiants qui débutent
FAQ : vos questions sur l’analyse thématique
Quelle est la différence entre l’analyse thématique et l’analyse de contenu ?
L’analyse de contenu vise principalement à quantifier des éléments textuels (fréquences de mots, catégories prédéfinies) dans une logique souvent plus proche du positivisme. L’analyse thématique, elle, cherche à interpréter des patterns de sens — les thèmes — en s’autorisant une lecture interprétative des données. La frontière peut être poreuse dans les approches mixtes, mais l’intention analytique reste fondamentalement différente.
Combien d’entretiens faut-il pour atteindre la saturation thématique ?
Il n’existe pas de chiffre universel. La recherche empirique (Guest, Bunce & Johnson, 2006) suggère qu’on atteint souvent une saturation primaire autour de 12 entretiens dans des populations relativement homogènes, mais ce chiffre peut monter à 20-30 pour des phénomènes complexes ou des populations hétérogènes. L’important est de documenter le processus de saturation dans le chapitre méthodologique et non de viser un nombre arbitraire.
L’analyse thématique peut-elle être utilisée avec des données non textuelles ?
Oui. L’analyse thématique peut s’appliquer à des données visuelles (photographies, vidéos), des enregistrements audio, des notes d’observation ou tout corpus qui peut être “lu” de façon interprétative. La condition est de définir clairement votre unité d’analyse et votre convention de codage adaptée au type de données — ce qui doit figurer dans votre chapitre méthodologique.



Leave a Reply