Un point sur l’évaluation

4 constats en établissement :

L’évaluation sans notes est régulièrement pratiquée au cycle 3 pour faciliter la transition CM2-6^e.
L’évaluation des compétences se poursuit au cycle 4 mais souvent en parallèle d’une évaluation chiffrée qui peut être déconnectée des compétences.
Au lycée, les compétences sont de plus en plus prises en compte mais pas autant qu’au collège et le modèle certificatif est le plus souvent utilisé.
Par glissement sémantique, ‘l’évaluation sans notes’ est devenue ‘l’évaluation par compétences’ rendant pour certains l’évaluation chiffrée incompatible avec l’évaluation des compétences.

Ces grandes tendances questionnent les enjeux de l’évaluation de manière générale mais plus particulièrement les pratiques de l’évaluation des compétences du socle commun.

Pb : En quoi l’évaluation des compétences sert-elle les apprentissages et ne se limite pas à la préparation des élèves à une épreuve certificative ?

Avant de revenir sur les quatre constats et de proposer une réflexion sur les pratiques d’évaluation dans le secondaire, revenons d’abord sur le concept même d’évaluation.

Qu’entendons-nous par évaluation ?

La littérature spécialisée (Cardinet, De Ketele & Roegiers) est d’accord pour affirmer que l’évaluation est un processus qui consiste à confronter un référent à un référentiel. Si les experts s’accordent sur ce point central, deux grands courants co-existent actuellement. Le premier consiste à affirmer que l’évaluation est un processus conduisant à produire une appréciation ou un jugement (Hadji, 1989 ; Allal, 2007). Le second estime que si le processus évaluatif comprend des démarches d’appréciation et de jugement, il a pour fin de fonder une prise de décision pertinente. L’évaluation peut revêtir plusieurs fonctions dont les plus importantes, dans le domaine de l’enseignement, de la formation et de l’éducation, sont les fonctions d’orientation, de régulation et de certification (De Ketele & Roegiers 1996, 2001)

Evaluation à visée diagnostique

Une évaluation a une visée diagnostique lorsqu’elle est réalisée en amont des apprentissages dans le but d’adapter ses pratiques d’enseignement aux élèves en s’appuyant sur leurs acquis et en identifiant leurs éventuelles lacunes. Parfois cela permet de réaliser que des rappels n’en sont pas pour des élèves ou inversement que certaines notions sont bien assimilées et peuvent être un appui solide pour ouvrir de nouveaux questionnements. Les périodes de confinement ont probablement augmenté l’hétérogénéité des élèves dans les classes. Le portfolio proposé dans l’académie de Rennes à l’issue du premier confinement a une visée diagnostique et peut aider à mieux gérer cette hétérogénéité.

Evaluation à visée formative

Une évaluation formative est une évaluation réalisée en cours d’apprentissage. Elle porte davantage sur les compétences en cours d’acquisition que sur les notions en elles-mêmes. Elle s’appuie sur des outils qui mettent l’élève en réflexion et lui permettent de comparer ce qu’il fait à ce qui est attendu en l’impliquant dans sa propre évaluation : ce sont les critères, les indicateurs de réussite, les échelles descriptives etc…Pour être efficace et bien mesurer une progression, il est important de bien cibler des compétences et de les évaluer plusieurs fois. L’autoévaluation n’est pas un exercice facile et selon le degré d’autonomie de l’élève, il est souvent judicieux de l’y amener progressivement en passant par de la coévaluation. Si l’évaluation formative est bien intégrée au processus d’apprentissage, il semble plus difficile d’accepter que le bilan intermédiaire trimestriel reflète à part égale l’évaluation sommative (la photo instantanée de ce qui est acquis ou pas à un moment de l’année) et l’évaluation formative qui reflète davantage l’investissement de l’élève individuellement et en groupe. Une enquête internationale (John Hattie, 2009, Visible learning. A synthesis of over 800 meta-analyses relating to achievement, Routledge) montre que la mise en place d’une évaluation formative fait partie des dispositifs éducatifs considérés comme efficaces pour faire réussir les élèves.

Remarque : aux expressions “évaluations formatives” et “diagnostiques”, nous préférons l’expression “à visée formative” ou “à visée “diagnostique” car tout n’est pas aussi cloisonné : toute évaluation peut avoir une visée diagnostique et/ou formative. Un exemple : une évaluation sommative de type brevet blanc ou bac blanc qui serait utilisée pour faire le point sur les acquis et les méthodes de l’élève dans le cadre d’un accompagnement personnalisé a, de fait, une dimension diagnostique et même formative.

Evaluation sommative

Une évaluation sommative est une évaluation réalisée après la phase d’apprentissage. Elle porte sur des savoirs et des savoir-faire qui ont été travaillés au préalable. Si le devoir bilan est bien associé à l’évaluation sommative, les ‘petites’ interrogations portant sur les connaissances sont parfois considérées à tort comme des évaluations formatives. Ces dernières restent des évaluations sommatives dans la mesure où elles portent sur des notions vues aux séances précédentes. Au lycée, particulièrement au cycle terminal, un poids énorme peut parfois peser sur les devoirs sommatifs qui ressemblent dans leur forme comme dans leur contenu aux évaluations du bac. Le ‘bac blanc’ compte généralement pour un fort coefficient dans la moyenne trimestrielle : il s’agit d’une épreuve longue pour celui qui la passe comme pour celui qui la corrige et lui donner une grande importance semble évident. Pourtant le bac blanc, comme toute évaluation sommative n’est qu’une photo instantanée et peut ne pas du tout refléter le niveau réellement atteint par l’élève justement parce que les attentes sont celles d’un niveau de fin d’année alors qu’il est encore « en cours de formation ». Si ce type d’épreuve sommative reste tout à fait pertinent dans une préparation de l’élève il faut bien veiller :

A ce que les attentes correspondent bien à celles du moment ;
A ne pas lui donner un poids disproportionné par le jeu des coefficients (conception très discutable et aléatoire qui relève de choix personnels rarement pensés en termes pédagogiques). Un échec peut s’expliquer par des difficultés d’apprentissage mais il peut aussi questionner le processus d’apprentissage lui-même : a t-il permis à l’élève de mesurer l’écart entre ce qu’il sait faire, ce qu’il comprend et ce qui est attendu ? L’a t-il vraiment préparé à cette épreuve ? L’enquête internationale de John Hattie a conclu que l’évaluation sommative fait partie des 15 dispositifs éducatifs dont la portée est limitée sur la réussite des élèves.

Evaluation certificative

Les évaluations certificatives sont des évaluations sommatives qui ne visent pas une régulation des apprentissages mais bien une reconnaissance institutionnelle des acquis en fin de formation. Au cours des trois trimestres, les élèves vont avoir des évaluations formatives et sommatives qui vont l’aider à se préparer à cette certification de fin de cycle (DNB ou bac).

Evaluation positive

Une évaluation positive est une évaluation qui n’enregistre pas les échecs. Redonner sa chance à un élève qui a échoué à un devoir ou ne prendre que la meilleure note entre deux devoirs similaires, sont des exemples parmi d’autres de pratiques de l’évaluation positive. Ce n’est pas de la démagogie mais simplement du bon sens et de la bienveillance : l’effet psychologique d’une mauvaise note indélébile (= qui ne peut pas être rattrapée) peut être dévastateur sur la motivation d’un élève et son estime de soi. Derrière l’évaluation positive, se joue peut-être le plus essentiel dans une relation prof/élève : la confiance.

Qu’entendons-nous par évaluer des compétences ?

Le décret du 31 mars 2015 relatif au ’socle commun de connaissances, de compétences et de culture’ définit la compétence comme « l’aptitude à mobiliser ses ressources (connaissances, capacités, attitudes) pour accomplir une tâche ou faire face à une situation complexe ou inédite ». Cette définition conduit à considérer qu’évaluer une compétence revient à évaluer l’aptitude de l’élève à accomplir une tâche au travers son engagement et sa réussite. Cette tâche à travers laquelle l’élève devra mettre en œuvre en les organisant, des savoirs, des savoir-faire et des attitudes, sera nécessairement une tâche complexe [1] et inédite. Le professeur Bernard REY, distingue trois degrés de compétences qui renvoient à des tâches de niveaux de complexité très variables :

1^er degré : « compétence élémentaire » (ou procédure)	Savoir exécuter une opération (ou une suite d’opérations) en réponse à un signal (une question, une consigne…) dans une tâche décontextualisée
2^e degré : « compétence élémentaire avec cadrage »	Face à une situation inédite, choisir parmi une gamme de compétences élémentaires, celle qui convient au traitement de la situation.
3^e degré : « compétence complexe »	Choisir et combiner correctement plusieurs compétences élémentaires pour traiter une situation inédite et complexe.

Une progressivité est indispensable pour permettre à l’élève de réussir des tâches complexes l’amenant à choisir et combiner des compétences élémentaires. Au collège, le DNB est plutôt du 2^e degré mais il est louable de viser le 3^e degré en veillant à cette progressivité dans les apprentissages et en pratiquant une différenciation. A l’inverse au lycée, si le bac est clairement du 3^e degré, il ne faut pas exclure de faire du 2^e degré de temps en temps. Commencer très tôt à évaluer des compétences complexes, c’est prendre le risque de mettre en échec de nombreux élèves et de les démotiver. Inversement, évaluer des tâches exécutives sans travailler suffisamment de tâches complexes ne permet pas de développer une autonomie de compréhension et de préparer correctement les élèves aux épreuves de fin de cycle. La progressivité va donc de pair avec la programmation des apprentissages en termes de notions mais aussi et surtout de compétences sur tous les cycles. L’expression ‘Evaluer « par » compétences’ [2] renvoie à l’évaluation des compétences que l’on a contribué à développer au cours de son enseignement. On s’intéresse alors à l’objet de l’évaluation : les compétences.

Evaluation sans note vs évaluation traditionnelle

Lorsque l’on parle d’évaluation sans note, on ne s’intéresse pas à l’objet de l’évaluation mais à l’outil d’évaluation. Les enseignants qui expérimentent l’évaluation sans note le font-ils pour évaluer des compétences ou simplement pour substituer d’autres outils à la note ? La note est un moyen pratique de classer les élèves mais beaucoup sont ceux qui reconnaissent que ce classement pousse à la comparaison et stigmatise les élèves en difficulté. Dans les années 1930, les premières recherches en docimologie montraient que la subjectivité des correcteurs joue pour une part non négligeable dans la note. L’ordre de correction des copies par exemple est un facteur important : le correcteur est inévitablement influencé par la correction de la copie précédente. Évaluer est un exercice de comparaison. Après une excellente copie, le professeur note plus sévèrement. Après une copie très faible, la notation est plus indulgente. Laugier et Weinberg ont calculé que, pour obtenir une « note vraie » aux épreuves du baccalauréat de 1930 (la « note vraie » correspond à la valeur scolaire d’une copie avec une marge d’erreur statistique faible), il faudrait recourir à la moyenne des notes de 13 correcteurs en mathématiques, 78 en composition française et 127 en philosophie. « Outre l’aléa de la note, il existe des biais de notation, c’est-à-dire des erreurs systématiques d’appréciation liées notamment aux effets d’attente et stéréotypes inconscients des correcteurs. Ainsi, les élèves redoublants et/ou plus âgés sont notés plus sévèrement que les élèves « à l’heure ». Un autre biais de notation concerne les enfants des catégories aisées. A compétences égales mesurées par des tests de compétences standardisés, ils sont systématiquement notés de façon plus indulgente que les autres élèves. Ce biais spécifique d’évaluation, présent dans toutes les recherches, est statistiquement très robuste. Il existe aussi des biais d’évaluation selon le genre. Ce biais est variable selon la discipline et le niveau scolaire. Par exemple, en classe de sixième, les filles sont mieux notées que les garçons à compétences égales. Mais ce biais est inversé en classe de seconde. La notation traditionnelle est injuste aussi pour une autre raison : elle exerce des effets défavorables aux apprentissages des élèves en difficulté scolaire. Des notes faibles provoquent un processus psychologique de « résignation apprise ». Les élèves sont découragés, développent un sentiment d’incompétence scolaire qui réduit sensiblement leur « ressources attentionnelles ». Cette résignation apprise bloque le processus d’apprentissage. Elle est notamment liée « aux comparaisons sociales forcées » produites par le recours aux notes. Pour les élèves en difficulté, la comparaison systématique à des élèves meilleurs provoque une baisse du sentiment de compétence scolaire, source de décrochage et de déviance, notamment d’absentéisme, de dégradation de matériel, de violences verbales et physiques. (…) À l’inverse, pour les bons élèves, la note traditionnelle renforce leur sentiment de compétence, leur motivation et leur désir de réussite. » Source : Pierre Merle, Les pratiques d’évaluation scolaire. Historique, difficultés, perspectives.

Du côté des élèves :

Dans leur grande majorité les élèves déclarent que l’expérience des évaluations sans note a pour effet de réduire la pression de la note et le « stress » quotidien qu’elle distille. Ils reconnaissent par exemple qu’un « non acquis » est bien moins « cassant » qu’un 6/20, même s’ils sont tout à fait capables d’établir une équivalence entre les deux. De ce fait, l’ambiance de classe est meilleure, la compétition est réduite et de leur aveu même, les élèves « se rabaissent moins entre eux » ; dans les classes qui évoluent depuis plusieurs années dans ce système, on remarque même un net développement de l’entraide.

Du côté des professeurs :

Beaucoup d’entre eux reconnaissent que la note est peu adaptée à l’évaluation de compétences mais continuent de noter au cycle 4 et au lycée. En pratique, les notes sont toujours nécessaires pour les évaluations certificatives et même les collèges qui ont abandonné les notes sur les bulletins sont obligés de transformer les compétences en notes. Mais dans la grande majorité des cas, les enseignants continuent de noter les élèves en superposant des grilles de compétences qu’ils remplissent en identifiant les compétences évaluées dans les devoirs. Ils y voient un progrès et s’appuient sur ces grilles pour mieux cerner les élèves au conseil de classe ou en entretien avec les familles. Ce double système demande du temps, de la réflexion, de la concertation et il est parfois difficile d’harmoniser les pratiques au sein d’un même établissement. Logiquement il devrait y voir une certaine cohérence entre le niveau de compétence atteint dans les domaines évalués et la note globale. Pourtant ce n’est pas toujours le cas, ce qui interroge sur le sens de la note. De surcroit, que l’on évalue des compétences ou pas, un élève qui a 15/20 puis 7/20 aura toujours la même moyenne que celui qui a eu 7/20 puis 15/20 en fin de période. La dynamique n’est pourtant pas la même et il y a fort à parier qu’en fin de cycle leurs notes certificatives seront très différentes. Cela interroge sur le sens des moyennes.

Evaluation « par » compétences = évaluation sans note ?

Non, pas forcément ! Une grille avec 4 niveaux de maîtrise peut très bien être utilisée pour obtenir une note sur 4. La pratique la plus courante est de donner un devoir mobilisant plusieurs compétences et de rechercher dans le questionnement la compétence évaluée. Le barème montre d’ailleurs souvent un déséquilibre dans le poids des différentes compétences dans la note globale. On peut aussi s’interroger sur le sens de cette addition de points. Sans la grille ou sans commentaire sur la copie, la note globale est peu signifiante : que dire de deux élèves qui ont 12/20 ? Leurs profils peuvent être très différents. Techniquement il est tout à fait possible de faire correspondre les notes aux échelles descriptives de compétences. Pour un devoir par exemple, on peut rentrer plusieurs notes correspondant aux compétences évaluées (des notes sur 4 pour 4 niveaux de maîtrise par exemple). Si l’on considère que toutes les compétences du socle se valent, il n’y a aucune raison d’affecter un coefficient différent à ces compétences. Un devoir requiert d’autant plus de compétences qu’il se rapproche de la tâche complexe. Il est important de focaliser son attention sur quelques compétences et de ne pas chercher à tout évaluer dans un même devoir. De la même manière, un élève mobilise plusieurs compétences dans une séance mais si l’on veut le faire progresser dans un domaine précis, il faut se concentrer sur ce domaine et évaluer ou coévaluer la principale compétence travaillée. La coévaluation est importante car elle permet d’impliquer l’élève dans son évaluation en l’amenant progressivement à être plus autonome et, plus tard, à mieux s’autoévaluer.

L’implicite dans l’évaluation

On appelle implicite ce qui n’est pas dit dans un énoncé en termes clairs et que l’élève doit comprendre par lui-même. On distingue deux sortes d’implicites : le sous-entendu et le présupposé.

Le sous-entendu se distingue du présupposé en ce qu’il ne se déduit pas de l’énoncé lui-même mais de la situation d’énonciation. On retrouve ce type d’implicite dans des consignes plutôt courtes et ouvertes : cas de consignes associées à des tâches complexes, ou des exercices de synthèse ou d’argumentation tels au baccalauréat. Les consignes type bac correspondantes induisent en fait de nombreuses compétences implicites derrière un sujet, par rapport à ce que l’élève devra mobiliser.

Problème : Ce type de sous-entendu est à l’origine d’ambiguïtés

Remarque : La consigne simple n’est pas forcément la plus claire et explicite pour les élèves. Les consignes les plus courtes sont parfois les plus denses, donc les plus complexes. Cependant, en langues vivantes, les consignes simples sont à privilégier pour éviter un obstacle supplémentaire à la compréhension

Le présupposé est une information implicite qui se déduit d’un mot ou de plusieurs mots présents dans l’énoncé. Il est souvent en lien avec des consignes liées aux pratiques d’apprentissages qui sont beaucoup plus diversifiées et dont des objectifs plus diffus. En témoignent les très nombreux verbes de consignes auxquels sont confrontés les élèves. Certains de ces verbes induisent souvent des compétences utiles pour les épreuves certificatives mais les élèves n’établissent pas toujours le lien.

Problème : cela peut présenter comme acquise une information qui ne l’est pas. Par exemple : « analyser » est un verbe d’action qui, selon les enseignants, donc implicitement, veut dire « décrire + faire un lien avec les connaissances + interpréter ». Nous rentrons là dans les spécificités et implicites disciplinaires directement liés aux consignes. Des consignes comme « expliquer », « décrire », « justifier » n’impliquent pas forcément les mêmes attentes et correspondent pourtant au même mot pour les élèves.

L’évaluation de compétences s’intéresse à l’objet d’évaluation, l’évaluation sans note renvoie simplement à l’outil. On peut donc évaluer avec ou sans note des compétences !
L’évaluation globale d’un élève sur un trimestre ne devrait pas reposer uniquement sur les évaluations sommatives qui ne reflètent pas toujours sa valeur réelle. Les évaluations formatives participent pleinement à la construction de cette évaluation globale qui doit être en cohérence avec la moyenne de l’élève. Il faut s’autoriser à effacer des échecs (mauvaise note) si l’élève a montré un progrès par la suite, au moment de calculer une moyenne trimestrielle.
Un écart de plusieurs points entre la moyenne d’une classe et la moyenne régionale au DNB ou au bac doit interroger les pratiques d’évaluation. Mais interroger n’est pas forcément remettre en cause l’évaluation menée car il peut y avoir des « effets classe » (Beaucoup d’élèves en difficulté regroupés, quelques élèves seulement qui sont très en dessous et qui font baisser la moyenne globale, etc..). Il faut sereinement en rechercher les raisons, par exemple en s’assurant qu’un effet classe se confirme dans toutes les disciplines.

Il est possible d’associer n’importe quel item de chaque colonne. Ainsi si l’évaluation de compétences associe le plus souvent compétences/en cours de formation/ pour mesurer un progrès/ degrés de compétences, cela n’est pas un dogme. Par exemple l’évaluation des compétences expérimentales en classe de terminale est l’association de compétences/en fin de formation/ pour certifier/ degrés de compétences puis score puis note/ un(e) autre enseignant(e). Avoir une vision précise de son spectre d’évaluation des élèves demande donc de distinguer prioritairement :

ce qu’on évalue (l’objet)
la fonction de l’évaluation (son rôle)
à quel moment de l’apprentissage on évalue La nature de l’outil de mesure ou bien la qualité de l’évaluateur sont certes importantes mais ne conditionnent pas les trois précédents points.

Références :

https://journals.openedition.org/dse/1022?lang=en#tocto1n1 http://math.univ-lyon1.fr/capes/IMG/pdf/evaluation.pdf

https://mediaserveur.u-bourgogne.fr/videos/evaluer-des-competences-ou-evaluer-par-competences-le-cas-des-classes-sans-notes/

http://www.cafepedagogique.net/lexpresso/Pages/2018/05/25052018Article636628309481624879.aspx

Espace pédagogique _{Pour développer votre professionnalité dans l’académie de Rennes}