//
vous lisez...
Entre nous, La vie en doctorat

Doctorantes, doctorants, directrices, directeurs de thèse, quelle répartition ?

La journée organisée le 21 janvier par Les Cartésiens à propos de la parité femmes / hommes dans l’enseignement supérieur a été l’occasion d’évoquer de nombreuses questions liées à la parité pendant le doctorat. La question de la préférence entre le choix d’une doctorante ou d’un doctorant, par un directeur ou une directrice de thèse, est restée en suspens en raison de l’absence de statistiques sur la question. Nous l’abordons à l’aide de la liste des thèses recensées sur theses.fr.

Récupération des données

Le moteur de recherche theses.fr de l’ABES, l’Agence Bibliographique de l’Enseignement Supérieur permet de télécharger de nombreuses données sur les thèses soutenues en France : titre, auteur, année de soutenance, nom du ou des directeurs de thèse, domaine de recherche, etc. Elles ont déjà été utilisées pour diverses analyses : la longueur des titres des thèses sur le blog Improbabilités, les thèmes de recherche et les co-directions de thèses en sociologie, ou dans d’autres disciplines, sur le blog de Baptiste Coulmont. Il est donc possible d’y récupérer l’ensemble des prénoms des docteurs, et de leur directeur ou directrice de thèse, et d’en déduire s’il s’agit d’hommes ou de femmes.

L’année 2009 est particulièrement intéressante en raison de la disponibilité de la proportion de femmes parmi les docteurs diplômés cette année-là : 43% selon la page 7 de ce document du ministère de l’enseignement supérieur et de la recherche.

Résultats

La stratégie d’identification du genre à partir de deux listes de plus de 1300 prénoms, respectivement féminins et masculins, en évitant les prénoms épicènes, fournit une réponse dans plus de 60% des cas sur le genre de chaque membre de la paire doctorant/directeur de thèse. Ceci correspond à 6824 doctorats pour l’année 2009.

Parmi ces 6824 docteurs, nous identifions 2973 femmes, soit 43,57% : un pourcentage proche du pourcentage officiel de 43% en 2009, mentionné ci-dessus.

Dans cet échantillon, parmi les 1514 docteurs dont la thèse a été dirigée par une femme, 811 étaient des femmes, c’est-à-dire plus de 53%. On constate également une majorité d’hommes parmi les 5310 docteurs dont le directeur de thèse était un homme : 59%, soit 3148 docteurs.

Doctorat-Repartition-femmes-hommes-2009

Ces proportions varient très peu les années suivantes : des pourcentages similaires, à un point près, sont obtenus chaque année de 2010 à 2012.

La sur-représentation des femmes parmi les docteurs dirigés par des femmes, et des hommes dirigés par des hommes, est statistiquement significative (voir détails ci-dessous, l’ensemble des données et des calculs est téléchargeable dans ce fichier OpenOffice).

On peut s’interroger sur les raisons de ces deux sur-représentations, du côté des directeurs de thèse ou des doctorants. La préférence pour un encadrant du même sexe est évoquée dans un entretien mené par Laetitia Gérard dans le cadre d’une enquête qualitative sur la relation entre les étudiants de master 2 et leurs directeurs de mémoire, décrite sur le blog Coopération universitaire. Ces hypothèses pourraient être complétées par des raisons similaires du côté des encadrants. En outre, du côté des directeurs hommes, les facteurs à l’origine déficit plus général de parité femmes/hommes dans l’enseignement supérieur pourraient également être envisagées. A l’inverse, les directrices femmes pourraient privilégier les doctorantes pour lutter contre ce déficit de parité. Enfin, des raisons liées à la relation entre doctorants et directeurs pendant le doctorat pourraient être envisagées, qui conduirait à des taux de soutenance, ou à des durées de thèses, différentes en fonction du sexe des doctorants et directeurs.

Détails méthodologiques

Les données de 2009 à 2012 ont été récupérées sur le site theses.fr, en utilisant le lien d’export des résultats au format texte, pour chaque année ciblée, par blocs de 1000. Elles ont alors été filtrées à partir de la colonne « date de soutenance », en gardant les lignes correspondant effectivement à l’année de soutenance, que le champ « statut » indique qu’il s’agit d’une thèse soutenue, ou en cours (ce qui semble le plus souvent être une erreur). Les données ont alors été agglomérées dans un même fichier CSV, puis chargées dans OpenOffice. Suite à un tri sur le nom des docteurs, et un repérage des noms de docteurs et de directeurs de thèse identiques, 78 doublons ont été détectés et supprimés.

Le fichier OpenOffice téléchargeable sur le site de Redoc fournit l’ensemble des données et formules nécessaires aux calculs :

  • la feuille ListePrenoms fournit l’ensemble des prénoms utilisés, ainsi que leur source ; la liste initiale a été complétée manuellement à partir d’une analyse des prénoms non reconnus parmi les prénoms de docteurs et de directeurs de thèse ;
  • la feuille Donnees fournit l’ensemble des données extraites et prétraitées comme indiqué ci-dessus ;
  • la feuille PrenomsGenre fournit les formules d’extraction des prénoms des docteurs et des directeurs de thèse (dans le cas d’une co-direction, seul le prénom du premier directeur de thèse a été conservé), ainsi que les formules permettant de déduire leur genre à partir des listes de référence de prénoms féminins et masculins ;
  • la feuille Resultats contient tous les résultats obtenus pour les années 2009 à 2012 ;
  • la feuille Figures contient les résultats les plus significatifs sélectionnés dans cet article.

Pour vérifier si les résultats obtenus sont statistiquement significatifs, un calcul d' »écart réduit » ou « z-score » a été effectué dans la feuille Resultats :

  • parmi les 1514 docteurs dont la thèse a été dirigée par une femme, 660 auraient dû être des femmes en théorie, si la proportion hommes/femmes des docteurs avait été respectée ;
  • l’écart-type est estimé à partir de la formule pour une loi binomiale ;
  • pour obtenir l’écart réduit, la différence entre nombre de femmes observé et nombre de femmes attendu est divisé par l’écart-type : ceci conduit à un écart réduit de +7.78 pour la (sur-)représentation des femmes parmi les docteurs encadrés par des femmes ;
  • en reproduisant les calculs pour les docteurs encadrés par des hommes, un écart réduit de +4.22 est obtenu pour la (sur-)représentation des hommes parmi les docteurs encadrés par des hommes.
Publicités

Discussion

2 réflexions sur “Doctorantes, doctorants, directrices, directeurs de thèse, quelle répartition ?

  1. A la demande générale (@TotoroInParis, @coulmont), la répartition des docteurs/directeurs femmes/hommes dans certains domaines de recherche, en faisant quelques agglomérations d’intitulés de disciplines que j’espère pas trop contestables :
    http://redoc-paris-est.fr/data/Doctorat-Repartition-femmes-hommes-disciplines-2009-2012.png
    – données sources sur http://redoc-paris-est.fr/data/PariteEncadrementDoctorat-Discipline.ods

    Si vous avez des outils plus puissants pour analyser ces données et tenter de passer à l’interprétation, ça m’intéresse. N’hésitez pas à réagir/critiquer en commentant directement en commentaires, ainsi ça pourra profiter aux autres lecteurs !

    Sur la méthodologie d’identification du sexe à partir du prénom, une alternative intéressante est proposée dans l’article Comment les docteurs deviennent-ils directeurs de thèse ? d’Olivier Godechot et Alexandra Louvet, et ses annexes.

    Publié par Philippe | 23 février 2014, 22 h 32 min
    • Nouvelle mise à jour à propos de ce travail :
      – j’ai pu travailler, à partir de données de la base ADUM, directement sur le genre des doctorants et des encadrants, pour obtenir certaines statistiques ciblées sur les doctorants et docteurs de certaines académies (voir cet article de Quoi d’neuf Doc’? de mai 2014), et constater le même type de biais en faveur de l’encadrement par une personne de même sexe ;
      – en utilisant ces mêmes données ADUM, qui faisaient apparaître le sexe et le prénom des directeurs, j’ai pu évaluer la qualité d’estimation du sexe à partir de prénom : pour 24409 directions de doctorat, dont 4528 par des femmes (taux réel de femmes : 18,55%), j’obtiens une précision de 0.982 et un rappel de 0.865 pour l’authentification des femmes, une précision de 0.998 et un rappel de 0.873 pour les hommes, ce qui conduit à un taux de femmes parmi les directeurs estimé à 18.64% : l’estimation de ce taux semble donc suffisamment précise.

      Publié par Philippe | 3 mai 2014, 23 h 05 min

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :