Enjeux actuels et historique des évaluations des acquis des élèves

1.1 Enjeux et objectifs actuels

Aujourd’hui, d’une façon générale, les travaux et analyses de la Direction de l’Évaluation, de la Prospective et de la Performance (DEPP) permettent aux évaluations nationales et tests de positionnement standardisés de répondre à trois objectifs :

  • Fournir aux enseignants des outils afin d’enrichir leurs pratiques pédagogiques en évaluant mieux les acquis de leurs élèves ;
  • Disposer d’indicateurs permettant de mesurer, au niveau national, les performances de notre système (évolutions temporelles et comparaisons internationales) ;
  • Doter les « pilotes de proximité » (recteurs, DASEN, inspecteurs et personnels de direction) d’indicateurs leur permettant de mieux connaître les résultats des écoles et d’effectuer une vraie régulation.

Les dernières évolutions de ces évaluations facilitent la mesure de compétences individuelles fines via des tests spécifiques (pour exemples : Automatismes et Résolution de problème en mathématiques en classe de sixième, tests de Fluence et de Compréhension de l’Écrit) 

Les tests standardisés sont développés avec des méthodes d’analyse psychométrique afin d’assurer la comparabilité des résultats dans l’espace (entre établissements, départements et régions) et dans le temps (entre les générations). Les théories psychométriques fournissent des outils pour, en amont des passations, créer des évaluations pertinentes et équilibrées, et en aval, attribuer à chaque élève un niveau de compétence selon ses réponses à l’évaluation. Au lieu de calculer un score brut qui serait égal au rapport du nombre de bonnes réponses sur le nombre de questions posées, les Modèles de réponses à l’Item (MRI) permettent de positionner les élèves sur une échelle de compétence en fonction de la difficulté des questions auxquelles ils ont répondu juste. Pour chaque question, deux paramètres entrent en compte : la capacité de la question à discriminer les élèves selon leur niveau de compétence et le niveau de difficulté de la question.  Pour le second degré, la méthode et l’analyse psychométrique sont détaillées dans le document intitulé Méthodologie utilisée dans les évaluations nationales second degré. 

Les résultats individuels communiqués aux équipes et aux élèves après la passation indiquent dans quel groupe de besoin l’élève est placé. Les « niveaux de maîtrise » dans chaque domaine et/ou compétence (À besoins, Fragile ou Satisfaisant) sont déterminés en fonction du nombre de bonnes réponses.

Les seuils permettant de placer chaque élève dans un groupe de besoin pour chaque domaine/compétence sont fixés d’après la méthode des « marques pages » : cette méthode simple fait appel à des experts (inspecteurs du second degré, formateurs, enseignants, IEN, etc.) qui indiquent les questions correspondant à un changement de niveau de maitrise des acquis du domaine/de la compétence, à partir de la liste des questions ordonnées par difficulté.

Des résultats complémentaires sont fournis avec les scores psychométriques et les 6 groupes de niveau au niveau de la discipline (score de français et score de mathématiques): pour exemple, en 2019, l’échelle de référence pour les élèves de seconde générale, technologique et professionnelle suivait une loi de Gauss centrée en 250 et d’écart-type 50, ce qui impliquait qu’environ 2/3 des élèves avaient un score compris entre 200 et 300.

À la rentrée 2023, ces évaluations nationales standardisées en français et mathématiques ont concerné les niveaux CP, CE1, CM1, sixième, quatrième, 1ère année de CAP, seconde générale et technologique et seconde professionnelle. À la rentrée 2024, tous les niveaux de classe du premier degré et du collège bénéficieront de ces évaluations, ainsi que la première année de CAP et le niveau seconde en voie générale et technologique et en  voie professionnelle.  Depuis 2022, tous les élèves de troisième passent également le test de positionnement Ev@lang collège, ce qui permet de disposer d’éléments précis sur le niveau du CECRL en anglais.

Les évolutions structurelles et techniques liées à ces évaluations nationales doivent être accompagnées de l’évolution des pratiques enseignantes de façon à apporter la réponse pédagogique la plus ciblée aux besoins actuels de tous les élèves, en mettant en œuvre des stratégies de différenciation décidées en équipe, dans la mesure du possible. En français et mathématiques, les groupes de besoins en 6ème et 5ème seront constitués dès la rentrée 2024. La cohésion des équipes, leur capacité à caractériser ensemble les « besoins » des élèves ainsi que les réponses à apporter sont les garantes de la réussite de cette nouvelle organisation des enseignements. Lorsque les difficultés identifiées sont majeures, les élèves de collège peuvent bénéficier d’heures de soutien selon les choix et possibilités de l’établissement.  Le dispositif Devoirs Faits, temps d’étude accompagnée obligatoire pour les élèves de sixième, reste ouvert aux élèves des autres niveaux du collège. Au lycée, Les heures d’accompagnement personnalisé en seconde générale et technologique et de consolidation des acquis en français et en mathématiques en seconde professionnelle sont des leviers pour favoriser la réussite des élèves, dans leur diversité. 


1.2 Historique

Les services statistiques du système éducatif développent des évaluations standardisées pour rendre compte des évolutions du système et le piloter à différents niveaux. On distingue trois grandes périodes dans le développement de ces dispositifs : 

  • Entre la fin des années 1970 et la fin des années 1980, dans le cadre d’un « observatoire permanent des acquis des élèves », des dispositifs d’évaluations sont déployés, selon une méthodologie rigoureuse, sur des échantillons d’élèves, en fin d’année scolaire. Ils concernent la classe de 5ème dès 1975 et le CP dès 1979. Chaque niveau scolaire fera l’objet, une année donnée, d’une évaluation « bilan ».
  • La loi dite « Jospin », en 1989, entraîne la mise en place d’évaluations « diagnostiques de masse ». Un rapport annexé à la loi précise que « moins d’un élève sur deux arrive au collège avec une maîtrise suffisante de la lecture ». L’acquisition de la lecture fera l’objet d’une évaluation auprès de tous les élèves entrant en CE2 et en 6ème. Un plan d’apprentissage de la lecture est déployé. Le ministre précise aux enseignants que l’évaluation de septembre est « conçue comme un outil mis à votre disposition pour déceler, de façon précise et dès le début de l’année scolaire, les difficultés de vos élèves et vous permettre, dans toute la mesure du possible d’y apporter rapidement une réponse » [Éducation & formations, 1990].
  • Au début du XXIème siècle, l’OCDE met en place le Programme international pour le suivi des acquis des élèves (PISA) alors que les évaluations sur échantillons pour bilan des acquis des élèves en fin d’école primaire et en fin de collège deviennent systématiques (Cèdre). 

Ces évaluations-bilans sont des outils pour le pilotage d’ensemble du système éducatif. 

Concernant les « évaluations diagnostiques de masse », des outils informatisés de saisie et d’exploitation des résultats sont progressivement mis à disposition des enseignants.  Les passations sous format numérique permettent des retours rapides et des analyses fines des résultats d’ensemble et individuels.

À la rentrée 2024, la DEPP permet l’évaluation des acquis en français et mathématiques de l’ensemble des élèves du premier degré et du collège, les élèves de seconde et de première année de CAP sont également concernés. Les passations sont organisées en début d’année et les résultats sont disponibles à l’issue des passations.