dimanche 28 novembre 2010

Les notes à l'école primaire : utile ou pas ?



Vingt personnalités, Michel Rocard, Daniel Pennac, Richard Descoings, Marcel Rufo et des chercheurs comme Axel Kahn ou Eric Maurin, un collègue, parmi d’autres, se sont récemment joints à un appel lancé en septembre par l’AFEV qui vise à supprimer l’utilisation des notes au sein de l’école élémentaire. Les arguments principaux sont bien connus, les notes décourageraient les élèves, mineraient leur confiance en eux et la conclusion aussi, la suppression de la note permettant de faire une école de la coopération plutôt qu’une école de la compétition (voir ici).

En tant qu’enseignant, mon avis est effectivement partagé, l’évaluation personnelle doit faire partie de l’itinéraire d’un écolier ou d’un étudiant, car il lui faut bien des éléments lui permettant de se situer dans l’absolu et éventuellement relativement à l’ensemble de ces camarades. Par ailleurs, cette évaluation ne se réduit pas forcément à une note, mais peut prendre de multiples formes. Je comprends aussi les arguments d’Eric Maurin, qui donne une lecture sans doute plus sociologique du problème, basée sur une évidence factuelle qui est incontestable. En tant qu’économiste, je me dis que les incitations doivent avoir un effet, et toute la question est donc de savoir si les incitations tirées de la notation sont plus efficaces ou moins efficaces pour la réussite des élèves que l’absence de système d’incitation ou qu’un autre système d’incitation.
Par ailleurs, soit dit en passant, la suppression des notes est également un enjeu de politiques publiques, dans la mesure où l’efficacité des politiques d’éducation –quand elle est mesurée – est souvent jaugée au travers de la variation des performances des élèves au regard de ces fameuses notes. Bien évidemment, cette approche de l’évaluation par les notes ne saurait être que très partielle, et il a été affirmé depuis bien longtemps que l’efficacité des réformes de l’éducation devait être jugée au regard de multiples critères autres que les performances en termes de notes, par exemple au travers de l’impact sur l’état général et les comportements des enfants et des adolescents (santé, tendance à l’addiction, etc.). Je cite notamment Bowles, Gintis et Obsborne en 2001 dans l’American Economic Review à propos du caractère imparfait des notes (test scores) en matière d’évaluation des performances à l’école et la nécessité d’aller au-delà :

“(Economists) need broader indicators of school success, including measures based on the contribution of schooling to behavioral and personality traits »
Il semble par ailleurs que la relation entre les notes obtenues dans la scolarité et les revenus perçus ultérieurement par les personnes devenues actives soit relativement ténue.
D’un point de vue comportemental, la question qui est posée est celle de l’impact de l’information que peuvent obtenir les individus sur leur performance actuelle sur leurs niveaux d’efforts à venir et leurs performances futures. Ou, dit autrement, quel est l’effet incitatif de ces fameuses notes sur le niveau d’effort des élèves dans le travail ?

Cette question de l’impact du feedback est au cœur des travaux portant sur l’économie des ressources humaines (je ne sais pas traduire mieux « personal economics », mais peut être dit on simplement l’économie du personnel), qui n’est pas ou peu ma spécialité. La littérature empirique, en particulier expérimentale, a été importante ces dernières années sur cette question.
J’ai déjà évoqué dans ce billet les problèmes qu’il pouvait y avoir à essayer de mettre en place un système d’incitations dans un contexte d’éducation, l’effet pervers étant que les motivations extrinsèques se substituent aux motivations intrinsèques et que l’effet net total pouvait au final être négatif. Mutatis mutandis, l’effet de motivation liée aux notes pourrait évincer le goût du travail personnel et de l’effort.

Notamment, la question de l’efficacité des notes (du feedback en général) peut être abordée à travers deux aspects : le fait que le niveau de ma note me donne une information absolue sur ma performance, et secundo, le niveau relatif de ma note par rapport à celle des autres élèves, si cette information est publique. Si elle est publique, elle peut prendre de multiples formes, ma note pouvant être comparée à une moyenne assortie éventuellement d’un écart-type communiquée par la scolarité, voir aller jusqu’à une connaissance parfaite de la distribution des notes.
D’un point de vue économique, le feedback sur la performance passée peut affecter ma performance courante soit directement, selon que  les performances passée et présente sont des substituts ou des compléments dans la fonction d’utilité des agents, ou indirectement en révélant à l’individu une information sur le rendement de son effet (effet de signal).

Cette polémique tombe à pic, puisque la littérature sur cette question est en plein boom dans le domaine expérimental. Récemment, Azmat et Irriberi,2010 ont publié les résultats de deux études qui portent en particulier sur l’impact du feedback d’une part sur les performances, mais aussi sur le bien être des évalués. Ils se focalisent notamment sur l’impact du feeback relatif sur les performances des individus. Ils observent un effet significatif des scores relatifs sur la performance finale des étudiants, et donc sur leur niveau de motivation, à l'occasion d'une expérience naturelle. Ils confirment ces résultats dans ce papier, mais mettent également en évidence les effets négatifs sur le bien être des élèves en dessous de la moyenne d'un système d'évaluation relatif par rapport à un système d'évaluation absolu.

Toutefois, l’étude la plus intéressante car la plus proche de la question posée est celle de Todd Cherry &  Larry Ellis , dans un article publié en 2005 dans l’International Review of Economics Education. Ces auteurs comparent l’impact d’un système d’évaluation absolu (mon grade ou ma note sur une échelle de 1 à 10 par exemple) par rapport à un système d’évaluation relatif . Dans le système d’évaluation relatif, mon score (ma note finale) est déterminée relativement à la performance des autres élèves. Par exemple, si je réponds à plus de questions que 90% de ma classe, j’obtiens un A. Si je réponds mieux que 75% de ma classe, j’obtiens un B, etc.  Ce système met précisément en avant une forte compétition des élèves.

C’est précisément l’efficacité de l’un ou l’autre schéma d’évaluation sur la performance finale des élèves qu’ils cherchent à mesurer. Comme ils ont 4 classes dans un cours d’introduction à la macroéconomie, ils mettent en place pour deux de ces groupes une évaluation relative (rank order grading) et pour les deux autres l’évaluation absolue (criterion-referenced grading). Le graphique ci-dessous donne la distribution des scores finalement obtenus à l’examen en fonction des deux schémas d’incitation par les notes :
source : Cherry & Ellis, 2005

Comme il est difficile d’en tirer une conclusion très nette, ces auteurs font une analyse économétrique du score en mettant comme variable explicative le traitement « rank order grading » traité comme une variable « dummy ». Les résultats sont assez explicites : le score moyen des étudiants est meilleur dans le schéma qui donne une évaluation relative à l’étudiant plutôt qu’une évaluation absolue. Ils restent prudents toutefois et insistent sur le fait que ce genre de système de notation n’est pas forcément adéquat si l’objectif est de promouvoir la coopération des élèves, le système d’évaluation absolu étant, dans ces conditions, sans doute préférable.

Pour conclure ce billet, ce n’est pas tant la notation en elle-même qui semble poser problème mais la manière dont cette notation est utilisée par les enseignants et les étudiants pour se comparer aux autres. C’est cela qui peut avoir des effets pervers. Toutefois, les effets de la compétition ne sont pas toujours mauvais (je suis désolé de rappeler une telle évidence, mais beaucoup s’emportent dans de grands débats sur les effets pervers de la compétition en oubliant quelques uns de ses mérites incontestables). Pour finir, j’emprunte à Télérama de cette semaine cette conclusion que j'ai trouvée magnifique. Un professeur de français déclare à un élève effondré par sa note de 7/20 :

« Vous n’êtes pas ce 7/20. Ce 7/20, c’est ce que valait votre travail la semaine dernière entre 8 heures et midi. Faites bien la différence. »

En voilà un qui a tout compris à la pédagogie. Raison de plus pour ne pas casser trop vite le thermomètre et réfléchir de manière pondérée aux conséquences potentielles de la suppression des notes.