Des citrons, des tests de ChatGPT et des femmes qui postulent plus que des hommes

L’orange, c’est mauvais pour la peau et c’est pas Trump qui le dit - Le sport est-il une forme d’automutilation ? - Des retours de ChatGPT pour l’enseignement … Et pour l’écriture d’abstract - Les femmes postulent-elles différemment aux postes que les hommes ?

Psycho Papers
6 min ⋅ 21/05/2025

L’orange, c’est mauvais pour la peau et c’est pas Trump qui le dit

Alors là j’ai appris un sacré truc. En anglais existe le terme « Margarita Burn » qui se traduit en français en phytophotodermatose parce qu’on n’a pas le droit d’avoir de noms marrants comme les Anglais.  Et qu’est-ce que c’est ? C’est une réaction qu'a la peau quand on renverse du jus de citron ou de l’orange dessus : elle devient très sensible au soleil et durant les mois d’été, ça amène plusieurs centaines de cas de brûlures graves de personnes qui se sont mis le citron vert de la margarita sur la peau. Marche aussi avec le jus d’orange, mais c’est surtout le citron vert dans le mojito ou la Corona.

Bref si vous voulez en savoir plus et voir des images assez impressionnantes, vous pouvez soit bronzer avec des citrons vert sur la peau, ou moins risqué visiter le lien suivant : Quand un cocktail au citron vert provoque rougeurs et cloques sur la peau exposée au soleil – Réalités Biomédicales (lemonde.fr)


Le sport est-il une forme d’automutilation ?

Mon avis est que oui. C’est aussi l’avis de Nicholas Fabiano, dans un article commentaire.

Selon Nicholas, L'exercice s'est avéré être un traitement efficace contre la dépression, une récente méta-analyse de 2023 d'essais contrôlés randomisés (ECR) concluant que l'exercice diminuait les symptômes dépressifs chez les participants souffrant de dépression.

Nous en avions parlé dans la newsletter 9, et malheureusement, on avait un peu « debunk » cette idée dans la newsletter 17. Si vous voulez les lire, elles sont toutes deux en accès libre sur Kessel.

En tout cas, selon Nicholas, il y aurait une relation entre dépression, automutilation et suicide. L’exercice réduit les automutilations et les risques suicidaires, mais rien dans la littérature scientifique n’indique que l’exercice réduirait l’idéation suicidaire. Et si, au lieu d'être un facteur de protection contre l'automutilation et les tentatives de suicide, l'exercice servait plutôt de méthode d'automutilation socialement acceptable ? On se fait mal, oui, mais pour la bonne cause, la santé physique.

Si c’est le cas, lorsque l'on discute de l'automutilation avec les patients, il est de la plus haute importance d'inclure l'exercice excessif ou intense comme une extension des méthodes d'automutilation traditionnellement considérées. De quoi repenser un petit peu les bénéfices pas si évidents de l’exercice physique sur la dépression.

Fabiano, N. (2024). Is exercise a form of self-harm? In Sports Psychiatry. Hogrefe Publishing Group. https://doi.org/10.1024/2674-0052/a000088


Des retours de ChatGPT pour l’enseignement…

Des chercheurs ont demandé à ChatGPT de faire 25 QCM pour les élèves, avec trois fausses et une bonne réponse. Les chercheurs ont également créé 25 QCM sans GPT. Avec chatGPT, les chercheurs ont mis une heure, 9 h sans. Chaque étudiant de pharmacologie répondait à 50 questions, 25 de chaque type, pour un total de 71 étudiants.

Les performances des étudiants sur les QCM générés par ChatGPT n'étaient pas significativement différentes de celles des questions faites par les chercheurs (note de 76,44 %, SD = 16,71 pour ChatGPT contre 82,52 %, SD = 10,90 pour les enseignants). Les étudiants ont mis en moyenne plus de temps à répondre aux questions générées par ChatGPT qu’aux questions générées par les chercheurs (71 secondes, SD = 22 pour ChatGPT contre 58 secondes, SD = 25 pour les enseignants), probablement en raison de la manière dont les questions étaient écrites.

Ainsi, ChatGPT peut générer efficacement des QCM de haute qualité, ce qui permet de gagner du temps, si un examen minutieux par des experts en contenu est fait pour garantir la qualité des questions, en particulier pour identifier et corriger les défauts de manière d’écrire les questions que l'on trouve couramment dans les éléments générés par ChatGPT.

Schneid, S. D., Armour, C., Evans, S., & Brandl, K. (2024). Alexa, write my exam: ChatGPT for MCQ creation. Medical Education. https://doi.org/10.1111/medu.15496


Et pour l’écriture d’abstract

ChatGPT peut-il générer de bons abstracts d’articles en psychiatrie ?

Les chercheurs ont fourni 30 articles de psychiatrie à ChatPDF (basé sur ChatGPT) en lui demandant de générer un résumé de style similaire, structuré ou non structuré. Ils ont également sélectionné 10 articles de Psychiatry Research comme comparaison (c’est un site proposant des résumés d’articles, un peu comme cette newsletter, quoi).

Cinq experts ont évalué la qualité des résumés en aveugle. Ils ont également identifié les résumés rédigés par les auteurs originaux et validé les conclusions produites par ChatPDF en les comparant. De leur expertise ressort que la similitude et le plagiat étaient relativement faibles (seulement 14,07 % de similitude et 8,34 %, de plagiat). En ce qui concerne la qualité des résumés, les résumés structurés générés ont été évalués de la même manière que les originaux, mais les résumés non structurés ont reçu des notes nettement inférieures. Les experts ont évalué la précision de 40 % pour les résumés structurés, de 73 % pour les résumés non structurés et de 77 % pour les comparateurs actifs. Cependant, 30 % des conclusions des résumés générées par l'IA étaient incorrectes. En conclusion, les capacités d'organisation des données des modèles de langage d'IA sont très intéressantes pour résumer l'information en psychiatrie clinique de manière structurée, mais pour l’instant, il est incapable de produire des conclusions sans erreurs et sans trop plagier.

Hsu, T.-W., Tseng, P.-T., Tsai, S.-J., Ko, C.-H., Thompson, T., Hsu, C.-W., Yang, F.-C., Tsai, C.-K., Tu, Y.-K., Yang, S.-N., Liang, C.-S., & Su, K.-P. (2024). Quality and correctness of AI-generated versus human-written abstracts in psychiatric research papers. Psychiatry Research, 341, 116145. https://doi.org/10.1016/j.psychres.2024.116145


Les femmes postulent-elles différemment aux postes que les hommes ?

Il y a une théorie qui dit que les femmes ne postulent aux offres d’emploi que quand elles ont un profil « parfait », qui correspond au mieux à l’emploi. Au contraire, les hommes postuleraient davantage aux emplois pour lesquels ils sont moins qualifiés. Une étude expérimentale et trois corrélationnelles indiquent que ça ne serait pas vraiment le cas. S’il semble y avoir une tendance, les femmes postulent généralement plus que les hommes, peu importe l’ajustement du profil au job.

On observe que les barres grises claires sont plus hautes que les barres grises foncées, indiquant que les filles postulent plus que les garçons, que cela soit quand elles correspondent parfaitement au poste (100%) ou pas (60%).

Ici, dans l’étude expérimentale, les femmes ont tendance à avoir plus l’intention de postuler que les hommes, peu importe l’ajustement de leur profil à l’emploi.

Cependant, dans les études corrélationnelles suivantes, on observe que les femmes se préparent plus aux entretiens, et sont plus stressées des entretiens que les hommes. Bref, elles sont plus sérieuses, quoi.

Salwender, M., & Stahlberg, D. (2024). Do women only apply when they are 100% qualified, whereas men already apply when they are 60% qualified? European Journal of Social Psychology, 54(7), 1545–1557. https://doi.org/10.1002/ejsp.3109


L’image qui fait réfléchir


La partie pour les abonnés : Le test de performance continu, le meilleur moyen de détecter le TDAH ?

C’est en tout cas ce que soutient cette étude publiée dans BMC pediatrics.

Ce test, un des plus utilisés ; mesure l’attention et l’impulsivité en demandant aux enfants d’observer un stimulus et d’appuyer sur la barre d’espace le plus vite possible quand une lettre apparait SAUF X. LE résultat, un mélange d’erreur des appuis quand il y avait X, de non-appui quand il y avait une lettre, et du temps moyen de réponse, pourrait indiquer un possible TDAH.

Dans cette étude, 30 étudiants avec un TDAH diagnostiqué et 30 étudiants sans TDAH de Taïwan ont passé ce test pour voir s’il était bien discriminant. Si la question du nombre de participants se pose, se pose aussi la question du seuil de significativité. Dans l’étude, les chercheurs indiquent “A P value less than 0.05 was considered statistically significant. Because of the small sample size in this study, P values less than or equal to 0.10 were considered to indicate trends.”

...

Psycho Papers

Par Adrien Fillon

Adrien Fillon est post-doctorant au CNRS, LAPSCO à Clermont-Ferrand. Ses champs de recherche sont la psychologie sociale appliquée à l’éducation, la méta-science et la détection d’erreur.

Les derniers articles publiés