Dans un article de The New York Times, où les tests de personnalité d'entreprise sont comparés à de l'astrologie de bureau, les scientifiques qui s'y expriment n'y vont pas de main morte. Le test MBTI par exemple (très souvent utilisé en recrutement), fournit selon le professeur de psychologie organisationnelle à l’Université de Pennsylvanie, Adam Grant, "l'illusion d'une expertise en psychologie".
Lors de notre échange avec Caroline Chavier au sujet des entretiens structurés, elle avait partagé son analyse sans filtres sur l'usage des tests de personnalité dans l'évaluation des candidats👇 .
"Attention parce que ces méthodes peuvent avoir une application perverse car si tu n'as pas la bonne personnalité, tu es stoppé.e dans le processus de recrutement, si tu n'es pas telle catégorie, tu ne continues pas. Et je trouve que ça c'est un acte de discrimination. Il faut dire les choses telles qu'elles sont.
En tests il n'y en a que quelques-uns qui sont solides.(...) Mais les entreprises ne sont pas toujours prêtes à payer ce type d'évaluation.(...)Nous ne sommes pas des psys, nous ne sommes pas des sociologues, nous ne connaissons pas les méthodologies scientifiques solides qui nous permettent de diffuser cette typologie d'évaluation."
❌ Cet article n'est pas une critique qui cherche à invalider le test de personnalité comme outil d'évaluation des candidat·es.
✅ Il a pour objectif d'apporter un éclairage scientifique sur les choix et les bons usages.
Pour y arriver, j'ai eu l'immense plaisir d'aller à la rencontre de :
👉 Mehdi Moussaid, Chercheur à l’institut Max Planck de Berlin. Auteur de « Fouloscopie ». Lauréat du prix Le Monde de la recherche. Vulgarisateur scientifique sur Youtube (+ de 300 000 abonnés). Consultant. Conférencier. Spécialisé dans l’étude du comportement des foules : mouvements de panique, propagation de rumeurs, contagion sociale, intelligence collective, marketing viral.
💬 "Ce sont des connaissances qui sont assez fermées quand on ne vient pas du milieu académique. Il faut pouvoir accéder aux journaux scientifiques. Ces journaux sont en grande majorité payants, même si de plus en plus les chercheurs s'orientent vers du Open Source."
Dans une de ses vidéos, il parle de tests de personnalité et notamment des tests de personnalité utilisés en entreprise pour recruter. Nous avons donc souhaité échanger avec lui afin d'approfondir le sujet. C'est parti !
Qu'est-ce qu'un test de personnalité scientifiquement parlant ?
Un test de personnalité est un instrument de mesure d'un attribut de la personnalité basé sur deux critères de qualité :
La fiabilité
Un test fiable ne change pas de mesure de manière inopinée. Dans sa vidéo sur les tests de personnalité, Mehdi donne l'exemple de la balance. Si vous pesez un objet plusieurs fois, vous devez toujours obtenir le même poids. Dans le cas contraire la balance n'est pas fiable.
Il en va de même pour les tests de personnalité. Si vous testez une même personne plusieurs fois avec quelques mois d'intervalle, on doit obtenir le même résultat. C'est ce qu'on appelle un test retest.
💬 "Le retest ce n'est pas quelque chose que l'on va utiliser en pratique, ce n'est pas le recruteur qui va faire un test et un retest pour confirmer le résultat. C'est une chose qui doit être faite en amont par les personnes qui ont conçu le test. Si vous vous testez deux fois pour vérifier que le test est fiable, statistiquement ça n'a pas beaucoup de valeur. Le test retest c'est vraiment quelque chose que l'on fait à l'échelle d'une population. On va mesurer sur 1000 personnes par exemple quelle est la moyenne, quel est l'écart type. On le refait avec les mêmes 1000 personnes plus tard et on vérifie si c'est la même moyenne et le même écart." Mehdi Moussaid
Prenons l'exemple du test MBTI qui propose de classer votre personnalité dans un des 16 profils possibles en analysant votre processus décisionnel inconscient, votre processus décisionnel conscient, votre niveau d'extraversion et votre processus d'analyse du monde extérieur.
❌ Avec un intervalle de 5 semaines entre le test et le retest, les études montrent que le candidat aura 50% de chances de recevoir une classification différente.
Robert Hogan, psychologue américain et autorité internationale en matière d'évaluation de la personnalité, de leadership et d'efficacité organisationnelle, et également reconnu pour ses innovations en matière de tests de personnalité, compare la fiabilité des résultats du test MBTI à celle des biscuits chinois. 🥠
⏸️ Souvent présenté comme un test qui s'appuie sur les travaux du psychiatre suisse Carl Jung, il a été en réalité crée par Katharine Cook Briggs, et sa fille Isabel Myers. Passionnées par Carl Yung, elles n'ont en revanche aucune formation en psychologie.
Il est évident que quand il s'agit de mesurer un attribut de la personnalité, le retest est plus complexe que quand il s'agit de peser un objet sur une balance.
💬 "C’est un peu plus compliqué parce qu'on ne mesure pas une température ou un poids, on mesure un trait de personnalité et donc c'est difficile parce que la personne que l'on va tester peut mémoriser ce qu'elle a fait les fois précédentes et peut essayer de s'entraîner, elle peut essayer de s'améliorer. Et là ça devient plus difficile de faire un test retest.
Par exemple pour un test de QI tout simple, si je teste la même personne 10 fois de suite avec exactement les mêmes questions, forcément elle va commencer à avoir des meilleurs résultats parce qu'elle va connaître les questions et les réponses à l'avance.
Mais les chercheurs ont des techniques. En particulier le fait qu'en général dans un test de personnalité d'un point de vue scientifique, les questions ou l'exercice qui va être soumis au candidat c'est juste une petite partie de toutes les questions qui existent sur ce test. Donc quand on veut tester la même personne, on va la retester sur le même test mais avec des questions différentes." Mehdi Moussaid
⚡ Mehdi complétera cette explication en donnant l'exemple du test de RAVEN qui mesure la fluidité du raisonnement et qui prévoit plusieurs sets : A,B,C,D,E.
Il suffit d'un seul set pour tester une personne.
Donc si par exemple vous avez un·e candidat·e, vous pouvez lui soumettre la version A. Si vous étiez amené·e à tester à nouveau cette même personne, vous lui soumettriez la version B. Ce ne sont pas les mêmes questions, mais ce sont des questions qui mesurent le même attribut.
C'est ainsi qu'on exclut l'effet d'apprentissage.
🕹️ Une autre manière de l'éviter est en mesurant un attribut par un système de cumul de points.
💬 "Une autre forme de parade pour ça ce sont les tests où le candidat doit cumuler des points. Par exemple le test du ballon : le test de BART qui mesure la prise de risque.
Ce sont des tests où on demande juste aux candidats de maximiser leur score. Il y a des personnes qui vont essayer de maximiser leur score avec prudence et il y a des gens qui vont essayer de maximiser leur score en prenant des risques. Donc on peut faire repasser le test encore et encore sans rien changer, on va toujours avoir ce trait de caractère qui va s'exprimer dans la façon dont cette personne va essayer de maximiser son score.
Pour maximiser le score avec prudence dans le test de BART, la personne va très peu gonfler le ballon à chaque fois en se disant -ok, j'ai mes 5 points par tour et à la fin je vais avoir un petit paquet de points et je vais être content-. Il y en a d'autres en revanche qui vont se dire - ok, je vais prendre le risque à chaque fois quitte à en rater 4, peut-être que le suivant va me rapporter d'un seul coup 40 points-.
Là il y a une re-faisabilité qui est tout à fait propre puisqu'à chaque fois c'est la façon dont on essaye de maximiser les points qui compte". Mehdi Moussaid
La validité
La validité est la capacité de l'outil à mesurer effectivement ce qu'on souhaite mesurer.
Reprenons l'exemple de la balance. Si on pèse plusieurs fois le même objet et que le résultat est le même, alors la fiabilité est prouvée, MAIS, comment on sait qu'elle mesure le poids et qu'elle ne mesure pas par exemple, la température de l'objet ? Si en réalité votre balance mesure la température au lieu du poids, alors l'instrument n'est pas valide.
Et pour les tests de personnalité ou psychologiques, c'est une erreur qui arrive très souvent. Qui plus est, la validité est spécialement complexe à prouver, ce qui fait que les scientifiques peuvent mettre des années à concevoir un test rigoureux.
💬 "Par exemple les tests de prise de risque prennent énormément de temps. Quand on conçoit un test, on le fait passer à des personnes et on observe qu'il y a des personnalités différentes : des personnes qui ont un score élevé et d'autres qui ont un score faible. Mais en fait il n'y a aucune preuve scientifiquement solide qui explique que la différence que l'on va observer selon les personnes est due à une différente personnalité ou à ce que l'on veut mesurer.
Peut-être que c'est une différence de motivation, ou une différence d'humeur, ou de culture ou de quelque chose d'autre. Donc on peut très bien voir une différence dans le test que l'on a conçu et se rendre compte que cette différence est associée à un autre trait de caractère que celui que l'on veut mesurer." Mehdi Moussaid
Mais alors comment prouver scientifiquement la validité d'un test ?
💬 "Quand on a un nouveau test, on prend un test existant qui mesure la même chose et que l'on connaît déjà et on fait une corrélation entre le nouveau test et le test existant. Si je veux mesurer la prise de risque (et il y a plusieurs façons de mesurer la prise de risque), je conçois un nouveau test et ensuite je vais regarder si les résultats que j'ai obtenus sont les mêmes que ceux qui sont prédits par un autre test qui est valide, ou que tout le monde sait qu'il a déjà été validé. Donc ça permet de comparer à un autre test et de se dire le mien marche aussi." Mehdi Moussaid
Et dans le cas où il n'y aurait pas de tests mesurant l'attribut souhaité :
💬 "Il faut bien une première fois, où il faut concevoir le test pour la première fois, en s'assurant qu'on mesure le trait de caractère qu'on vise. Et ça c'est un peu difficile effectivement. C'est difficile d'avoir la garantie.
Les chercheurs vont donc procéder par essai erreur. Ils vont concevoir un test, ils vont le tester sur une grande population, ils vont essayer de voir s'il y a des corrélations avec d'autres attributs et ils vont surtout essayer de voir s'il y a une influence sur les données comportementales." Mehdi Moussaid
Prenons encore le cas des tests de prise de risque et imaginons qu'il n'y a pas de tests valides antérieurs.
💬 "On essaye d'avoir un test rapide qui dure 10 à 15 minutes.
Comment peut-on savoir s'il mesure effectivement la prise de risque, s'il est valide ? Et bien on peut faire des observations sur des personnes qui ont passé le test concernant leurs modes de vie : est-ce qu'ils font des choses qui sont considérées comme risquées ? Quels sont leurs comportements ? Ce sont vraiment des choses qu'on a mesurées et qui sont objectivement là.
On regarde si le test a une corrélation avec les comportements qu'on a identifiés. Mais ça prend énormément de temps parce que sur tout l'échantillon que l'on a au début, il faut qu'on aille regarder comportementalement pendant une année ou deux années, s'ils font des choses risquées ou non et s'il y a un rapport avec le score qu'on a obtenu." Mehdi Moussaid
Un test mesure uniquement un attribut de la personnalité
💬 "Un bon test va mesurer vraiment un attribut très précis de la personnalité et je n'ai jusqu'à présent jamais croisé dans ma carrière académique de tests qui sont utilisés en conditions expérimentales, en conditions scientifiques, qui vont mesurer plein de choses à la fois." Mehdi Moussaid
Un test scientifiquement valide et fiable ne peut pas à la fois mesurer la pro sociabilité d'un candidat et sa capacité de raisonnement par exemple.
En recrutement, une fois que le besoin est bien identifié et que le profil de poste sera clairement défini, si vous choisissez d'utiliser le test de personnalité comme méthode d'évaluation, la science demanderait que vous sélectionniez un test pour chacun des attributs de la personnalité que vous souhaitez mesurer.
💬 "En science on combine les tests. Je vais passer plusieurs tests pour avoir un aperçu des différentes facettes de sa personnalité. Cela ne prend pas beaucoup de temps et ça me permet de savoir à qui j'ai affaire. Et comme je sais que ce sont des tests qui ont une fiabilité forte, si je fais un retest dans quelques mois, j'aurais les mêmes résultats, donc ça me permet de prédire comment va répondre ce candidat ou ce participant." Mehdi Moussaid
Par exemple vous recherchez quelqu'un qui soit empathique et qui n'ai pas peur de sortir des sentiers battus. Vous allez alors par exemple choisir le test S.V.O pour mesurer la pro sociabilité et le test de B.A.R.T pour la prise de risque.
Si vous administrez le même test pour tous les métiers que vous recrutez, même s'ils demandent des qualités différentes, vous n'obtiendriez pas des résultats concluants d'un point de vue scientifique.
💬 " On a un outil qui va être conçu et affiné pour mesurer vraiment un trait de caractère bien particulier et uniquement ce trait-là. Le test multi-usage c'est quelque chose que je ne connaissais pas avant de m'intéresser aux entretiens d'embauche où j'ai découvert des choses qui étaient un peu plus ouvertes.
En science on a jamais ça. Et d'ailleurs ça vient de la façon dont c'est conçu. Avant d'avoir un test on va identifier un attribut de la personnalité et ensuite on va essayer de construire un outil de mesure pour cet attribut-là." Mehdi Moussaid
Le résultat est donné par un nombre sur une échelle continue
💬 "Une particularité de ce que j'ai vu des tests utilisés en entreprise en recrutement c'est que le résultat est simplifié, à savoir qu'en général il va être donné sous forme d'étiquette ou de catégorie. En science en revanche, le résultat va être donné par un nombre qui est sur l'échelle continue. On n'est pas soit bleu, soit rouge. On est 0,65 entre bleu et rouge donc il y a une idée de continuité qui est simplifiée dans les tests utilisés en recrutement." Mehdi Moussaid
Ainsi, certains types de tests utilisés en entreprise, comme les tests projectifs, où on n'a pas de questionnaire, ni une façon de mesurer un comportement qui est quantifié et quantifiable, seront moins fiables car les résultats se prêteront à une interprétation subjective.
💬 "Le résultat va être dépendant de la personne qui fait passer le test, qui utilise l'outil. Et donc ça rajoute du bruit autour du résultat et en général, en tout cas dans le milieu académique je ne me suis jamais servi de tests projectifs et je n'ai jamais vu de collègues se servir de ce genre de tests. Dans un cadre expérimental ce n'est pas conventionnel." Mehdi Moussaid
Le plus populaire dans cette typologie de tests est celui de la tache d'encre, également connu sous le nom de test de Rorschach. Ce test consiste à présenter une série de planches graphiques avec des taches symétriques pour que la personne qui est soumise à l'évaluation les interprète. Une analyse permettant d'évaluer la personnalité sera ensuite faite à partir de ses réponses.
⏸️. Ce qui est particulièrement marquant est qu'il a été en réalité conçu pour détecter la schizophrénie 👀 . Et pourtant il est administré par certaines entreprises pour évaluer leurs candidats ...
Puis, il existe également une typologie de tests, qui eux ont un questionnaire où l'on va demander aux candidats·es de se projeter dans des actions pour en savoir plus sur leurs comportements ou leurs motivations.
💬 "Les tests où on va te poser une question sur ce que tu ferais dans x situation (est-ce tu ferais plutôt ça ou ça), sont des tests qui sont très facilement manipulables et que l'on utilise presque jamais en science.
Tout va dépendre de ce que la personne veut nous faire comprendre ou veut nous faire croire qu'elle est.
Ce n'est pas du tout le genre d'approche qu'on va utiliser en science. On va plutôt essayer d'avoir un ciblage qui est plus tranchant, plus précis sur le trait de personnalité que l'on veut mesurer et ensuite on va essayer de le mesurer en utilisant un jeu par exemple, un outil où la personne va essayer de maximiser les points avec différentes manières de faire pour y arriver. Et c'est la façon de faire qui est révélatrice de ce trait de personnalité." Mehdi Moussaid
Tests de personnalité et intelligence artificielle
Impossible de clôturer cet article sans aborder le sujet de l'intelligence artificielle dans l'évaluation et la sélection des candidats.
Le recrutement prédictif par exemple, connaît un grand succès et est largement adopté en France et à l'international (+240% en 2018) comme une alternative aux méthodes plus classiques en recrutement.
💬 "Tout dépend des données que l'algorithme va regarder. Inconsciemment on peut transférer des bais dans le système". Mehdi Moussaid
Il est donc important de veiller à ce que des notions fondamentales à la performance des entreprises comme la diversité et l'inclusion aient leur place ce type d'évaluation.
💬 "Il pourrait par exemple explorer des profils différents, tester des interactions entre deux profils différents qui marchent bien quand on les met ensemble.
Je ne suis pas du tout contre l'IA, j'aime beaucoup les technologies et les façons dont elles progressent mais je pense que dans ce contexte-là, elle doit être tournée vers l'ouverture, plutôt que vers une prise de risque réduite, basée sur une reproduction des profils que l'on a déjà." Mehdi Moussaid
🔚. C'est la fin de cet article. J'espère qu'il vous sera utile si vous êtes amené·e à utiliser le test de personnalité comme outil d'évaluation de vos potentiels futurs talents. Mehdi d'ailleurs partagé avec nous son intérêt pour le sujet. Si vous voulez le contacter dans le cadre de cette démarche, il est toute 👂.