Le corpus

Le choix d’un corpus approprié à ses objectifs de recherche et aux hypothèses avancées est une des étapes essentielles du travail de recherche. Le corpus représente un ensemble limité de données sur lequel se base l’étude d’un phénomène linguistique, empirique, etc.

  1. 1.        Les méthodes de recueil de données

On distingue les méthodologies[1] de type quantitatif[2] et de type qualitatif. 

Parmi les méthodes[3] disponibles (l’analyse documentaire, l’entretien ou le questionnaire, l’observation, le test, le sondage, la démarche expérimentale, la recherche-action, etc.), le chercheur va retenir celle qui correspond le mieux à ses objectifs et donc, la mieux adaptée à ses questionnements et à ses hypothèses de recherche. 

  1. 2.   Les critères de choix du corpus

Le corpus représente toujours un ensemble construit, il n’est jamais donné à l’avance. Tout corpus est le résultat d’un choix, dicté par :

-Les hypothèses du chercheur (ce qu’il veut démontrer)

-Les savoirs de départ (les connaissances dont le chercheur dispose pour amorcer son travail)

-Le champ disciplinaire (sciences du langage, didactique, littérature, etc.)

Tout corpus doit obéir à des critères de :

  • Ø Représentativité : il faut que l’ensemble des éléments choisis soit représentatif pour la classe dont il fait partie. Le corpus retenu doit par conséquent pouvoir référer à un ensemble plus large. L’extraction et la description d’un ou de plusieurs échantillons à partir d’un ensemble de données illimité permet ainsi de mettre à jour les caractéristiques de cet ensemble.
  • Ø Pertinence : il faut établir un corpus approprié à l’objectif de recherche. Pour entreprendre une comparaison par exemple, les corpus retenus doivent avoir un certain degré de ressemblance.
  • Ø Homogénéité : il faut que l’ensemble choisi comporte des éléments constants. L’homogénéité se manifeste de façons différentes selon les disciplines. Par exemple, dans le cadre d’enquêtes sur les pratiques des enseignants du moyen, on pourra interroger des enseignants répondant au même profil (âge, expérience, etc.)
  • Ø Différence : il faut que l’ensemble choisi comporte suffisamment de variables[4] pour que l’analyse soit pertinente. 
  1. 3.   Du recueil des données à l’identification des outils d’analyse

Le travail sur corpus nécessite une réflexion concernant :

  • Le type et les sources des données

Un corpus est un ensemble de données issues d’enquêtes, d’interviews, de tests, d’expériences, de productions verbales écrites ou orales, de documents audiovisuels, etc. Les éléments qui le constituent peuvent avoir été recueillis de façons variées : enregistrement audio et/ou vidéo, aspiration automatique de données en ligne, questionnaire, photographie, etc. On distingue en outre plusieurs sortes de corpus : attestés/forgés[5], oraux/écrits, en langue maternelle/ en langue étrangère, saisis au vol/provoqués[6], etc.  

  • La présentation du corpus :

Pour rendre accessible le corpus de travail, plusieurs opérations sont nécessaires : transcription, traduction, …Certains domaines impliquent le recours à des normes de transcription pré-établies. Néanmoins, selon ses objectifs de recherche, la transcription pourra être plus ou moins détaillée et/ou nécessiter des ajustements destinés à rendre visibles des éléments cruciaux pour l’analyse (gestuelle, tonalité, prosodie, systèmes d’écriture non alphabétiques,etc.).

  • La méthode d’analyse projetée

Plusieurs solutions peuvent être envisagées :

-L’application à l’identique d’une méthode d’analyse. Cela nécessite de faire des choix méthodologiques ;

-L’articulation de deux méthodes ou plus. La combinaison des méthodes quantitative et qualitative est possible et parfois même préférable. (Face à des corpus volumineux, il semble oppurtun d’opter pour une approche quantitative afin de mettre en évidence des phénomènes récurrents analysables en aval de façon qualitative.

-L’adaptation à l’objet d’étude  d’une méthode déjà existante ;

-L’élaboration d’une méthode capable de répondre à l’hypothèse de recherche et aux caractéristiques du corpus. Une telle option constitue une étape du travail de recherche. Elle peut aussi être envisagée comme une finalité en soi, si la méthode a été pensée dans l’optique d’une possible transférabilité ;

Application : après la lecture de ce fragment, remplissez le tableau suivant :

Afin de fournir un point d’ancrage pour l’analyse du concept de lecture scolaire en FLE, nous avons examiné un corpus de discours sur la lecture scolaire produits dans le contexte roumain pendant l’intervalle 1970-2000.  Pour ce qui est de la chronologie, il s’agit en même temps de l’intervalle temporel dans lequel se développe la recherche didactique sur la lecture en France, et de l’intervalle pendant lequel la Roumanie traverse des changements multiples du point de vue politique, qui se répercutent aussi sur l’institution scolaire. Le choix du contexte roumain, pour  lequel très peu d’études didactiques sont disponibles actuellement, nous permet d’inscrire  l’analyse sur un territoire concret, afin de mesurer l’impact des paramètres contextuels sur la constitution de la méthodologie de lecture en langue étrangère disponible à un moment donné. Le « niveau avancé » auquel nous plaçons notre étude est défini par le système d’enseignement roumain comme étant le niveau  du lycée, niveau auquel les apprenants sont censés avoir étudié la langue étrangère pendant au moins quatre ans.

Dans le contexte roumain sur lequel nous travaillons, les discours de recherche sur la lecture, les discours des programmes officiels  et les discours des manuels n’ont pas le même poids sur l’évolution des méthodologies scolaires et, conséquemment, sur l’évolution du concept de lecture en langue étrangère. Les discours de recherche appartiennent pour la plupart à des chercheurs universitaires, ils font très peu référence au contexte concret d’enseignement/apprentissage et fonctionnent  souvent sur le mode de la synthèse de discours didactiques français. C’est la raison pour laquelle nous leur assignons une place relativement restreinte dans l’analyse.

Pour ce qui est des programmes et des manuels, ces discours bénéficient dans le contexte roumain d’un très fort pouvoir prescriptif étant donné l’esprit centralisé et directif qui a guidé pendant de nombreuses années l’éducation dans le système communiste. Nous faisons l’hypothèse que ce statut central des programmes et des manuels rapproche beaucoup ces discours des pratiques de classe, ce qui nous permet d’examiner par leur biais l’évolution du statut méthodologique de la lecture en FLE, tout en restant à l’extérieur des observations de classes à proprement parler.

Le statut de la lecture scolaire en FLE au niveau avancé dans le contexte roumain sera donc examiné à travers un corpus de treize manuels scolaires et de quatre textes de Programmes officiels qui parlent de la lecture nous allons examiner, par le biais de repérages, les diverses désignations de la lecture ainsi que les attributs qui lui sont opposés. Dans les manuels qui intègrent la lecture en tant que contenu, et non comme objet de discours à proprement parler, nous allons identifier les catégories d’analyse de la lecture scolaire par le moyen de l’analyse de contenu et en fonction de prémisses épistémologiques portant sur le statut du concept de lecture en FLE. Les manuels et les Programmes ont été organisés sur trois générations distinctes découpées contextuellement (1970-1978 ; 1978-1999 ; 2000).

Corrigé 

Corpus écrit

Corpus oral (décrire)

Critères de choix

Méthodes d’analyse prévues

Des discours sur la lecture dans le contexte roumain pendant l’intervalle 1970-2000 : les discours de recherche sur la lecture, les discours de quatre programmes officiels et de 13 manuels scolaires.

 

 

Dans les programmes : repérage des diverses désignations  de la lecture ainsi que des attributs qui lui sont opposés.

Dans les manuels : analyse de contenu partant de catégories établies suite à l’analyse du concept de lecture scolaire.



[1] Composé à l'aide de méthode et de -logie, tiré du grec logos, « discours, traité ». 
Étude des méthodes de recherche et d'analyse propres à une science, à une discipline.  Ce terme ne doit pas être employé comme synonyme de Méthode

[2] L’analyse quantitative désigne l’ensemble des méthodes et des raisonnements utilisés pour analyser des données standardisées (c’est-à-dire des informations dont la nature et les modalités de codage sont strictement identiques d’un individu ou d’une situation à l’autre). Ces données résultent souvent d’une enquête par questionnaire mais peuvent également être produites par le codage de documents d’archives, ou de sources sonores ou visuelles. S’appuyant sur des méthodes statistiques (qui sont conçues comme des outils d’analyse des grandes séries de données), l’analyse quantitative produit des informations chiffrées (pourcentages, probabilités, effectifs, classifications, …). Ces chiffres ne constituent toutefois pas une fin en soi : le chercheur les utilise pour étayer son raisonnement, pour identifier des faits… 

 

[3] Emprunté, par l'intermédiaire du bas latin methodus, du grec methodos, proprement « cheminement, recherche ». [...] 2. Dans un sens plus général, désigne toute démarche ordonnée, tout ensemble de moyens raisonnés permettant de parvenir à un résultat, d'établir une pratique. Inventer, choisir, suivre une méthode. Procéder avec méthode, sans méthode. Manquer de méthode. Méthode de travail. Méthode de calcul…etc.

NB. A la lecture de ces définitions, on peut donc retenir une chose : La méthodologie sert à établir une méthode !

[4] Variable dépendante : Variable qui subit l'influence d'une autre variable (ex. : Poids en fonction de l'Âge).

Variable indépendante : Variable qui exerce une influence sur une autre variable, La variable indépendante peut être quantitative ou qualitative.

[5] A la différence du corpus forgé qui est constitué de données fabriquées pour les besoins de l’analyse (phrases artificielles, reproduction en laboratoire de phénomènes naturels, de comportements, etc.), le corpus attesté est un ensemble de données saisies en contexte naturel (conservations téléphoniques, observation du comportement moteur d’enfants de moins de 3ans, archives d’histoire, etc.)

[6] Un corpus au vol rassemble des données liées à sa problématique, recueillies dans diverses situations : prévisibles, mais aussi occasionnelles ou inattendues.  Par exemple, une étude du code switching (ou alternance codique, soit le passage d’une langue à l’autre au cours d’une même   conversation) pourra s’appuyer sur des données saisies dans le  bus, à la radio, etc. Un corpus provoqué est conditionné pour les besoins de l’analyse. Il peut s’agir de résultats d’enquêtes, de listes produites sur demande de l’analyste, de conversations sur des thèmes donnés,etc.

Modifié le: samedi 20 mai 2023, 15:30