ENSAE ParisTech
Groupe de Statistique Appliquée
2013-2014
Les déterminants des
choix d’études
supérieures
Thibault PLUQUET...
1
Remerciements
Nous adressons nos sincères remerciements à notre encadrante : Meryam ZAIEM, qui a
contribué à l’élaborati...
2
Sommaire
Introduction .....................................................................................................
3
Introduction
Le choix de la filière d’enseignement supérieur est décisif pour le développement
académique et professionn...
4
Tunisie compte 198 établissements de l’enseignement supérieur dont 13 universités2
, 25
Instituts Supérieurs d’Études Te...
5
Première partie : Statistiques descriptives
1. Présentation des données
Une fois le baccalauréat obtenu, les élèves doiv...
6
La répartition des bacheliers entre le littoral et les régions intérieures est à peu près
identique. Pour mieux prendre ...
7
Graphe 2. La répartition socioprofessionnelle en Tunisie
2. La distance à l’établissement d’enseignement
Il serait intér...
8
la même pour les garçons et les filles. Sous l’hypothèse nulle, ces deux distributions
coïncident l’une avec l’autre.
Te...
9
La distance en tenant compte du gouvernorat (littoral ou intérieur)
Effectifs moyenne écart-type
Littoral 38591 60,46 94...
10
Test de Kolmogorov-Smirnov
Graphe 5. La densité de la variable distance pour les deux groupes
La p-valeur est nulle. La...
11
3. La moyenne au baccalauréat
La moyenne au baccalauréat par sexe
Effectifs Moyenne Ecart-type
Garçons 29191 -0,05 0,98...
12
Graphe 7. La densité de la variable moyenne en fonction du littoral/régions intérieures
La moyenne au baccalauréat par ...
13
Graphe 8. La densité de la variable moyenne pour les deux origines sociales
4. La durée des études
Cette variable durée...
14
Graphe 9. La densité de la variable durée pour le littoral/hors littoral
La durée des études en fonction du milieu soci...
15
Graphe 10. La densité de la variable durée selon le milieu social
La durée des études en fonction du sexe
Nombre d’obse...
16
La p-valeur est nulle. Nous rejetons l’hypothèse nulle au seuil standard : la distribution
de la variable durée pour le...
17
Deuxième partie : Les modèles à choix discret
Ce que nous cherchons à expliquer est le choix d’études supérieures des b...
18
faudrait que les deux probabilités diminuent dans une même proportion (afin que le ratio des
probabilités reste inchang...
19
Ces tableaux ci-dessous représentent les coefficients et les écart-types entre
parenthèses, que nous avons obtenus pour...
20
Nous remarquons que les signes des coefficients significatifs sont presque similaires
dans les deux régressions. Ainsi,...
21
Ingénierie
Sciences
sociales
Sciences
humaines
Santé
Sciences
fondamentales
Autre
Littoral
-0,018**
(0,008)
0,052***
(0...
22
bacheliers choisissant ce domaine ne vont probablement pas prendre en compte leur position
géographique.
En moyenne, un...
23
Voici les résultats :
Ingénierie
Sciences
humaines
Santé
Sciences
fondamentales
Autres
Littoral
-0,281***
(0,041)
-0,18...
24
Techniques
*fg
1,050***
(0,151)
0,345
(0,325)
0,743***
(0,192)
-0,112
(0,204)
0,316
(0,200)
Groupe Aisé
-0,141***
(0,03...
25
nous montre qu’il y a une différence entre l’intensité des effets dans les deux cas, mais les
conclusions générales sur...
26
Variable explicative Coefficient
Durée d’études
-1,974***
(0,025)
Chômage
-0,033***
(0,001)
Capacité
0,027***
(0,004)
T...
27
Nous remarquons qu’un prolongement de la durée d’études d’un groupe de domaine
fait diminuer la probabilité de choisir ...
28
l’ensemble des groupes de domaine (3,4 ans). Par contre, le groupe de la santé a un niveau de
chômage moyen ainsi qu’un...
29
Les interprétations des coefficients
Pour un élève habitant sur le littoral, la probabilité de faire des études longues...
30
 Nous supposons finalement que les ( ) i=1,…,74398 sont indépendantes et suivent une loi
logistique.
Nous obtenons les...
31
garçon va multiplier par 1,05 la chance de faire des études professionnelles par rapport aux
filles. Si l’élève est dan...
32
Conclusion
En expliquant le choix du domaine d’études par des caractéristiques individuelles
dans le premier modèle (lo...
33
Les gouvernements cherchent à améliorer le système éducatif, ce sujet est toujours
d’actualité. En France, cette année,...
34
Bibliographie
Agasisti, Tommaso and Dal Bianco, Antonio (2007) “Determinants of College Student
Migration in Italy: Emp...
35
Mixon and Hsing (1994b) “The determinants of out out-of-state enrollments in higher
education”, Economics of Education ...
36
Annexes
A1 - Carte de la Tunisie
37
A2 - Répartition des bacheliers en fonctions des gouvernorats
Partie Gouvernorat Fréquence Pourcentage
Littoral
TUNIS 8...
38
A3 - La répartition socioprofessionnelle sur le littoral et les régions intérieures
A4 - Effectif des bacheliers et moy...
39
A5 - La répartition des CSP des parents entre régions et en total ou en total et dans deux
sous partie de la Tunisie (l...
40
A6 - Répartition de la variable domaine selon le découpage géographique
Agroalimentaire
1%
Architecture
1%
Arts et méti...
41
A7 - Répartition des domaines selon le milieu social
Agroalimentaire
2% Architecture
1% Arts et métiers
1%
Autre
9%
Dro...
42
A8 - Répartition des domaines en fonction du sexe
Agroalimentaire
1%
Architecture
1%
Arts et métiers
0%
Autre
10%
Droit...
43
A9 - Répartition des domaines parmi les littéraires et les matheux
Agroalimentaire
0% Architecture
0%
Arts et métiers
1...
44
A10 - Vœu affecté- Le modèle logit multinomial avec interaction (garçons) : les
coefficients
Ingénierie
Sciences
humain...
45
Sciences Exp.
*fg
1,001***
(0,051)
1,276***
(0,089)
1,730***
(0,110)
-0,431***
(0,126)
0,775***
(0,080)
Techniques
*fg
...
46
A14 – Test de l’hypothèse d’indépendance des états non pertinents (I.I.A.) : test
d’Hausman-McFadden
Dans le premier mo...
47
FIN
Prochain SlideShare
Chargement dans…5
×

Les déterminants des choix d'études supérieures

136 vues

Publié le

Rapport du projet de Statistiques appliquées

Publié dans : Formation
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
136
Sur SlideShare
0
Issues des intégrations
0
Intégrations
3
Actions
Partages
0
Téléchargements
1
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Les déterminants des choix d'études supérieures

  1. 1. ENSAE ParisTech Groupe de Statistique Appliquée 2013-2014 Les déterminants des choix d’études supérieures Thibault PLUQUET Duc Hien VU Hengrui WAN Yasin ZORLU Sujet encadré par Meryam ZAIEM
  2. 2. 1 Remerciements Nous adressons nos sincères remerciements à notre encadrante : Meryam ZAIEM, qui a contribué à l’élaboration de notre mémoire. Sa disponibilité, son soutien, son encouragement et sa patience nous ont été précieux afin de bien mener notre travail.
  3. 3. 2 Sommaire Introduction .............................................................................................................................. 3 Première partie: Statistiques descriptives.............................................................................. 5 1. Présentation des données .................................................................................................. 5 2. La distance à l’établissement d’enseignement.................................................................. 7 3. La moyenne au baccalauréat........................................................................................... 11 4. La durée des études......................................................................................................... 13 5. La variable domaine ....................................................................................................... 16 Deuxième partie: Les modèles à choix discret..................................................................... 17 1. Premier modèle : expliquer le choix du domaine ........................................................... 17 1.1.L’hypothèse I.I.A...................................................................................................... 17 1.2.Le logit multinomial ................................................................................................. 18 1.3.Le logit conditionnel................................................................................................. 25 2. Deuxième modèle : expliquer la durée des études.......................................................... 28 3. Troisième modèle : expliquer la formation (académique/professionnelle) .................... 29 Conclusion............................................................................................................................... 32 Bibliographie........................................................................................................................... 34 Annexe..................................................................................................................................... 36
  4. 4. 3 Introduction Le choix de la filière d’enseignement supérieur est décisif pour le développement académique et professionnel d’un élève. Ce dernier, compte tenu des différentes informations dont il dispose, choisit l’option qui est apte à répondre au mieux à ses souhaits, c’est-à-dire celle qui maximise leur utilité. L’enjeu est également de taille pour les gouvernements qui, pour défendre la justice sociale et le droit à l’éducation des citoyens, essaient de proposer des formations adaptées au besoin de la population afin de soutenir une croissance économique durable. Comprendre les préférences des demandeurs de formations permet d’améliorer la qualité des offres de formations, ce qui est en faveur du bien être social. Les facteurs qui déterminent l'établissement et la filière d’étude souhaités des bacheliers sont sujets à de nombreuses études des économistes de différents pays : une abondante littérature porte sur les États-Unis (Mixon 1992a, 1992b, Mixon and Hsing 1994a ,1994b, Baryla and Dotterweich 2001), mais nous trouvons aussi des analyses sur des élèves allemands (Bruckmeier, Fisher, Wigger 2013), hollandais (Sa et al. 2004), canadiens (Boudarbat, Montmarquette 2007) ou encore italiens (Agasisti and Dal Bianco 2007). Les conclusions pourraient différer d’un pays à l’autre en raison des différences de culture ou du système éducatif et politique des pays. Parmi la littérature à laquelle nous nous sommes intéressés, deux genres de facteurs de choix d'études sont souvent évoqués : d’une part, les caractéristiques individuelles ou familiales des élèves, par exemple l’aide à l’orientation académique des élèves par leurs parents (Hoover-Dempsey et Sandler 1995, Ono 2001, Hastings, Kane et Staiger 2006), notamment dans certains pays comme le Japon où le financement des études dépend largement des parents. D’autre part, il y a un ensemble de facteurs divers qui sont indépendants de ceux évoqués plus haut (Kjellsttrom and Regner 1998, Ono 2001, Agasisti and Dal Bianco 2007, Beffy, Fougère et Maurel 2009) : ces facteurs dépendent soit des établissements de l’enseignement supérieur, par exemple la qualité du programme d’études proposé, le nombre de places offertes, la sélectivité, la taille de classe, les possibilités d’obtenir des bourses... soit de la localisation des établissements choisis : la distance entre l’établissement et le lieu de domicile de l’élève... soit des perspectives en terme d’emploi qu’offre la formation : taux de chômage après l’obtention du diplôme par exemple. Bien que les études des économistes sur cet aspect se heurtent parfois à la simplification que représentent des modèles, face à la complexité des comportements humains et des réalités sociales et politiques, certains consensus sont établis. La distance entre le lieu du domicile et celui de l’école semble être en corrélation négative avec la probabilité de choisir cet établissement. De plus, les élèves sont souvent attirés par les établissements d’une région où le loyer et les frais de scolarité des établissements sont moins élevés (Sa et al. 2004). Ils sont aussi soucieux de la qualité et du débouché des programmes d’études proposées par des établissements (Baryla and Dotterweich 2001). Le présent papier portera sur le cas de la Tunisie. En 2007, 138245 personnes ont passé la session principale du baccalauréat et 75256 d’entre elles ont réussi à le décrocher.1 La 1 Source : http://www.babnet.net/cadredetail-11017.asp. Il convient de souligner que seuls les lycéens ayant eu leur baccalauréat sont retenus pour notre analyse, car ils sont les seuls concernés par une affectation post- baccalauréat.
  5. 5. 4 Tunisie compte 198 établissements de l’enseignement supérieur dont 13 universités2 , 25 Instituts Supérieurs d’Études Technologiques (ISET) et 46 établissements privés. Toutes les universités proposent des formations similaires allant des sciences pures (mathématiques, physique) à des sciences humaines (littérature, langues étrangères) en passant par les sciences sociales (droit, économie, commerce) et la médecine. Nous remarquons que l’enseignement supérieur en ce pays est gratuit, il n’y a donc pas d’effet de frais de scolarité sur le choix de l’école. Ces spécificités rendent superflus l’étude de certains facteurs qui pourraient bien influencer les décisions d’orientation académique dans d’autres pays. Cependant, comme des étudiants d’autres pays, les élèves tunisiens pourraient prendre en compte des éléments moins dépendants des particularités culturelles des pays, comme la distance entre le lieu de domicile et le lieu de l’établissement, la perspective d’emploi à l’issue de la formation ou encore le conseil des parents. De plus, comme le gouvernement tunisien détermine le nombre de places disponibles en fonction de chaque formation dans chaque établissement, l’accessibilité à une formation dans la contrainte du nombre de places offertes pourrait être un facteur capital du choix des formations supérieures des bacheliers. L’objectif de notre étude est de tenter de trouver les déterminants de choix des formations supérieures. Notre étude est organisée comme suit : dans la première partie, des statistiques descriptives sont présentées pour donner un aperçu de la situation d’orientation académique post-baccalauréat en Tunisie. Dans la seconde partie, nous effectuons une analyse empirique à l’aide de modèles de choix discret. 2 Voir : http://www.universites.tn/francais/donnees_de_base/p_ensei_sup.htm
  6. 6. 5 Première partie : Statistiques descriptives 1. Présentation des données Une fois le baccalauréat obtenu, les élèves doivent effectuer leur choix d’études supérieures. A l’issue des résultats (1ère et 2ème session) du baccalauréat, les bacheliers sont classés par ordre de mérite au sein de leur spécialité. Pour établir cette classification, une formule générale (un score FG) leur est attribuée. Cette formule diffère d’un baccalauréat à un autre, elle va dépendre de la moyenne obtenue au baccalauréat (formule de base FB) et des matières principales de la spécialité (formule spécifique FS). Notre base contient les 74398 bacheliers orientés en 2007. Chaque bachelier peut faire au maximum 10 vœux pour son affectation. Certains n’en formulent pas 10. Pour établir sa liste de vœux, l’élève bénéficie d’informations sur la capacité d’accueil, ses résultats (moyenne au baccalauréat, classement selon la formule générale), classement à l’intérieur du type de baccalauréat et le score du dernier pris dans la filière les trois années précédentes, grâce à un guide d’orientation fourni systématiquement par le Ministère tunisien de l’enseignement supérieur. Il est important pour le bachelier d’étudier ses chances d’obtenir une filière. Nous disposons pour chaque bachelier de son premier choix et de son affectation finale. Nous supposons que le bachelier est rationnel. Son premier choix reflètera vraiment ses préférences sous contraintes. Nous considérerons ce premier choix pour la statistique descriptive et pour les différents modèles (sauf indication contraire). En moyenne les élèves obtiennent leurs 2,5ème choix. Graphe 1. La distribution du rang du vœu obtenu Dans notre base de données, il y a 45207 filles, soit 60,76% des bacheliers et les garçons sont au nombre de 29191.
  7. 7. 6 La répartition des bacheliers entre le littoral et les régions intérieures est à peu près identique. Pour mieux prendre en compte leur proximité avec le littoral, les 23 gouvernorats3 en Tunisie seront divisés en deux groupes : régions littorales et régions intérieures. Cette distinction pourrait être importante dans les choix des étudiants car ce sont des endroits différents, pour les régions du littoral : elles sont généralement développées économiquement et offrent de plus nombreuses opportunités d’emploi que les régions intérieures. Ainsi, le littoral est composé de 9 gouvernorats et les régions intérieures de 14 (voir Annexe A1). Bien qu’il y ait moins de gouvernorats sur le littoral, la répartition des bacheliers entre le littoral et les régions intérieures est quasi-équilibrée : environ 52% des bacheliers sont sur le littoral. Nous remarquons notamment qu’un dixième des bacheliers ont passé leur baccalauréat à Tunis (voir Annexe A2). Filles Garçons Part 60,76% 39,24% Moyenne au baccalauréat (écart-type) 0,03 (1,01) -0,05 (0,98) Part de parents ouvriers 41,52% 36,67% Part de parents cadres 21,11% 24,34% Part littoral 51,42% 52,57% Table 1. Quelques chiffres en fonction du sexe La moyenne considérée est celle qui est centrée et réduite d’où la possibilité d’avoir des valeurs négatives. Cette opération se fait au sein d’une même spécialité de baccalauréat. L’intérêt est de pouvoir comparer des élèves de spécialités différentes. Sans cette opération, par exemple, la comparaison de la moyenne d’un élève qui a fait un baccalauréat lettres et celle d’un élève ayant fait un baccalauréat mathématiques ne serait pas judicieuse. En effet, les notes entre ces deux spécialités ne se valent pas. Il est plus difficile d’avoir 20 en philosophie que d’avoir 20 en mathématiques. La catégorie socioprofessionnelle du père est un élément qui pourrait avoir son importance dans l’orientation des bacheliers. Environ 40% des bacheliers ont un père ouvrier. 22% des élèves ont des pères qui sont cadres. Il y a très peu d’instituteurs et de professeurs. Sur le littoral, il y a 36% d’ouvriers, ce nombre s’élève à 46% pour les régions intérieures. Les cadres représentent 26% de la population sur le littoral alors que dans les régions intérieures, ils sont de 18% (Voir Annexe A3). 3 Il y a 23 gouvernorats en Tunisie qui sont : Ariana, Beja, Ben Arous, Bizerte, Gabes, Gafsa, Jendouba, Kasserine, Kebili, Le Kef, Mahdia, Manouba, Mednine, Monastir, Nabeul, Sfax, Sidi Bouzid, Siliana, Sousse, Tataouine, Tozeur, Tunis et Zaghouane.
  8. 8. 7 Graphe 2. La répartition socioprofessionnelle en Tunisie 2. La distance à l’établissement d’enseignement Il serait intéressant d’étudier les distances entre la zone géographique d’origine de l’élève et les villes correspondantes aux filières choisies : la distance au premier vœu ou celle au vœu d’affectation. Pour la suite, nous ne considérons que la distance au premier vœu car les résultats sont assez proches pour les deux types. Cette distance pourrait influencer de manière significative la formulation des choix. Cette distance a été calculée approximativement4 en considérant la distance entre la capitale du gouvernorat de résidence du bachelier et la ville où se situe l’établissement d’enseignement. La distance par rapport au sexe Garçons Filles Moyenne 111,84 92,21 Ecart-type 128,35 115,34 Table 2. La variable distance en fonction du sexe En moyenne, les filles vont moins loin que les garçons. Nous pourrions supposer que les parents sont plus réticents à envoyer leurs filles loin d’eux. Nous faisons un test de Kolmogorov-Smirnov pour voir si les deux densités sont confondues, autrement dit, si la distribution associée à la variable distance au premier vœu est 4 Si celle-ci est petite, nous la mettons à zéro PROFESSEUR 3% INSTITUTEUR 2% OUVRIER QUALIFIE 11% OUVRIER NON QUALIFIE 29% PROFESSION LIBRE 5% P.M.CULTIVANT COMMERCANT 9% CADRE MOYEN NON INSTI 15% CADRE (NON PROF) 7% PÈRE DECEDE 5% RETRAITE 10% SANS EMPLOI 4% Répartition socioprofessionnelle en Tunisie
  9. 9. 8 la même pour les garçons et les filles. Sous l’hypothèse nulle, ces deux distributions coïncident l’une avec l’autre. Test de Kolmogorov-Smirnov Graphe 3. La densité de la variable distance pour les deux sexes Le résultat montre que la p-valeur est nulle. Donc pour un niveau standard5 , nous rejetons l’hypothèse nulle d’égalité des densités. Pour mesurer la « corrélation » entre la distance au premier vœu et le sexe, en contrôlant la moyenne, nous allons utiliser la régression suivante : où sexei vaut 1 si l’individu i est un garçon et 0 sinon. Les résultats de la régression sont les suivants : (écart-type) (0,57) (0,90) (0,44) Tous les coefficients sont significativement différents de 0 au seuil de 5%. La régression montre que pour une note de moyenne fixée, la distance moyenne au premier vœu est de 92,55 km environ pour les filles. Celle-ci augmente de 18,77 km pour les garçons. 5 1%, 5% ou 10%
  10. 10. 9 La distance en tenant compte du gouvernorat (littoral ou intérieur) Effectifs moyenne écart-type Littoral 38591 60,46 94,32 Régions intérieures 35807 142,43 131,70 Table 3. La variable distance en fonction du littoral/intérieur Test de Kolmogorov-Smirnov Graphe 4. Les densités de la variable distance pour le littoral/hors-littoral Dans ce cas, la p-valeur est nulle. Nous rejetons donc l’hypothèse nulle au seuil standard : la distribution de la distance pour le littoral et celle pour l’intérieur ne se ressemblent pas. Les bacheliers qui ont passé leurs baccalauréats sur le littoral vont, en moyenne générale, moins loin que les autres. En effet, les offres de formation sont plus nombreuses sur le littoral. La distance en tenant compte de la catégorie socioprofessionnelle (CSP) du père Les élèves sont scindés en deux groupes selon la profession du père : - Groupe 1 (plus aisé) : la catégorie socioprofessionnelle du père est parmi les cadres, les instituteurs et les professeurs. - Groupe 2 (plus défavorisé) : la catégorie socioprofessionnelle du père est parmi les ouvriers, les commerçants, les pères décédés, les retraités et les sans-emplois6 . Effectifs moyenne écart-type Groupe aisé 20459 86,57 116,85 Groupe défavorisé 50489 106,64 122,53 Table 4. La variable distance en fonction de la profession du père 6 Nous omettons le troisième groupe qui contient les professions libres.
  11. 11. 10 Test de Kolmogorov-Smirnov Graphe 5. La densité de la variable distance pour les deux groupes La p-valeur est nulle. La distribution de la distance n’est pas la même pour le groupe plus aisé et pour le groupe plus défavorisé. Pour le groupe plus aisé, le déplacement moyen est plus court que pour le groupe plus défavorisé. Les conditions de réussite pour les élèves du groupe plus défavorisé sont plus difficiles, le contexte familial ne favorise pas l’éducation. Ainsi, ces élèves ont des choix limités de par le niveau, ce qui conduit à des éloignements du domicile familial. Les écoles ont des places limitées, les bacheliers vont être affectés selon leur niveau. Les élèves du groupe défavorisé sont plus nombreux dans les régions intérieures (26811) que sur le littoral (23678). Cela contribue aussi à l’écart de distribution. Nous mesurons la « corrélation » entre la distance et le groupe de catégorie socioprofessionnelle, en contrôlant la moyenne au baccalauréat. Distancei = β0 + β1.Aiséi + β 2.Moyennei + , i=1,…, 70948 Aisé = 1 si l’individu i est dans le groupe plus aisé, 0 si l’individu est dans le groupe plus défavorisé. Nous obtenons le modèle estimé : Distancei = 105,76 - 17,40.Aiséi - 8,33.Moyennei + , i=1,…, 70948 (Ecart-type) (0,54) (1,01) (0,46) Tous les coefficients sont significativement différents de 0 au seuil de 5%. ̂ = -17,40 < 0. En contrôlant la moyenne obtenue au baccalauréat, la distance (par rapport au premier vœu) diminue de 17,40 km quand nous passons du groupe plus défavorisé au groupe plus aisé.
  12. 12. 11 3. La moyenne au baccalauréat La moyenne au baccalauréat par sexe Effectifs Moyenne Ecart-type Garçons 29191 -0,05 0,98 Filles 45207 0,03 1,01 Table 5. La moyenne au baccalauréat en fonction du sexe Test de Kolmogorov-Smirnov Graphe 6. La densité de la variable moyenne pour les deux sexes La p-valeur est nulle, les distributions des moyennes centrées réduites ne sont pas les mêmes pour les garçons et les filles. Les filles ont une moyenne plus grande que les garçons. La moyenne au baccalauréat par région Effectifs Moyenne Ecart-type Littoral 38591 0,11 1,04 Régions intérieures 35807 -0,12 0,93 Table 6. La moyenne au baccalauréat en fonction de la position géographique Les élèves du littoral ont une meilleure moyenne que les élèves vivant à l’intérieur du pays. Test de Kolmogorov-Smirnov Comme la p-valeur est nulle, nous rejetons l’hypothèse nulle, ce qui veut dire que la distribution de la moyenne au baccalauréat n’est pas la même sur le littoral que dans les régions intérieures.
  13. 13. 12 Graphe 7. La densité de la variable moyenne en fonction du littoral/régions intérieures La moyenne au baccalauréat par statut social du père Effectifs Moyenne Ecart-type Les plus aisés 20459 0,21 1,10 Les plus défavorisés 50489 -0,11 0,93 Table 7. La moyenne au baccalauréat en fonction du milieu social Nous constatons que les élèves qui sont dans un milieu aisé ont une meilleure moyenne que ceux qui sont dans un milieu défavorisé. Néanmoins ces élèves présentent des résultats plus volatils. L’écart-type est plus important pour les élèves issus du groupe 1 que celui pour les élèves du groupe 2. En effet, les enfants dont les parents sont enseignants auront la faculté de s’ouvrir plus facilement à la culture et d’être plus studieux. De plus, les parents aisés peuvent payer des cours particuliers à leurs enfants. D’ailleurs, nous pouvons supposer que des parents ouvriers donnent une place moins importante à l’éducation que des parents cadres. Ainsi, des élèves dont les parents sont ouvriers bénéficieraient d’un moins grand suivi qu’un enfant dont les parents sont enseignants. Test de Kolmogorov-Smirnov La p-valeur vaut zéro. La distribution de la moyenne au baccalauréat n’est pas la même entre les deux groupes.
  14. 14. 13 Graphe 8. La densité de la variable moyenne pour les deux origines sociales 4. La durée des études Cette variable durée peut susciter de nombreuses questions : quelle est la durée moyenne d’études sur le littoral ? Pour les élèves issus de milieux défavorisés ? Pour les filles ? En fonction du libellé du baccalauréat ? La durée des études en fonction du découpage littoral/régions intérieures Nombre d’observations Durée moyenne Ecart-type Littoral 38591 3,31 1,25 Régions intérieures 35807 3,16 1,05 Table 8. La durée moyenne des études en fonction de la répartition géographique La durée moyenne des études est plus longue sur le littoral avec un écart-type plus grand comparé aux villes intérieures. Test de Kolmogorov-Smirnov Nous avons une p-valeur qui est nulle. Nous rejetons donc l’hypothèse nulle au seuil standard : la distribution de la variable durée pour le littoral et la distribution de la variable durée hors du littoral ne se ressemblent pas.
  15. 15. 14 Graphe 9. La densité de la variable durée pour le littoral/hors littoral La durée des études en fonction du milieu social Nombre d’observations Durée moyenne Ecart-type Défavorisé 42871 3,10 1,01 Aisé 20459 3,50 1,36 Table 9. La durée moyenne des études selon le milieu social La durée moyenne des études est plus longue pour les élèves issus de familles aisées. En effet, les élèves auront probablement des loyers à payer et d’autres frais liés à leurs études. Les familles peu aisées ne peuvent pas offrir ces dépenses à leurs enfants. Les élèves issus de milieu défavorisé vont privilégier les études de courtes durées. Test de Kolmogorov-Smirnov La p-valeur est nulle. Nous rejetons l’hypothèse nulle au seuil standard : la distribution de la variable durée pour les bacheliers les plus aisés et la distribution de la variable durée pour les bacheliers les plus défavorisés ne sont pas identiques.
  16. 16. 15 Graphe 10. La densité de la variable durée selon le milieu social La durée des études en fonction du sexe Nombre d’observations Durée moyenne Ecart-type Garçons 29191 3,22 1,25 Filles 45207 3,25 1,10 Table 10. La durée moyenne des études en fonction du sexe Les filles font de plus longues études que les garçons cependant la différence de la durée moyenne n’est pas très remarquable. Test de Kolmogorov-Smirnov Graphe 11. La densité de la variable durée en fonction du sexe
  17. 17. 16 La p-valeur est nulle. Nous rejetons l’hypothèse nulle au seuil standard : la distribution de la variable durée pour les garçons et la distribution de la variable durée pour les filles ne se ressemblent pas. La durée des études en fonction du libellé du baccalauréat Nombre d’observations Durée moyenne Ecart-type Economie-Gestion 14232 2,83 0,72 Lettres 21964 3,16 0,65 Mathématiques 13937 3,60 1,35 Sciences exp. 15113 3,64 1,45 Techniques 9152 2,85 1,43 Table 11. La durée moyenne des études en fonction du libellé du baccalauréat Les bacheliers scientifiques (mathématiques et sciences expérimentales) font en moyenne des études plus longues que les autres élèves. Par contre, les écart-types sont élevés. Néanmoins, nous remarquons que les bacheliers en économie-gestion et en techniques enregistrent des durées moyennes d’études plus faibles. Pour la filière technique, nous pourrions penser qu’elle accorde une place plus importante au profil professionnel. Les élèves de cette filière veulent intégrer le milieu professionnel le plus rapidement possible. 5. La variable domaine Le but de ce projet est de donner des explications sur le choix des études supérieures. Ainsi, il faut nous intéresser aux formations. Cependant, il existe un très grand nombre de formations. Nous avons donc décidé de construire la variable domaine par soucis de simplicité. Cette variable « domaine » a été construite par recherche lexicographique. Nous nous sommes posé les questions suivantes : quels sont les domaines préférés par les garçons ? Quelle est la répartition des domaines sur le littoral ? Quelles sont les formations les plus fréquentées par les bacheliers les plus aisés ? Le domaine en fonction du littoral/hors-littoral : les bacheliers vivant en dehors du littoral font moins d’études de médecine que les bacheliers vivant sur le littoral. Cependant, nous pouvons voir que les bacheliers vivant à l’intérieur du pays font plus de formations linguistiques que les bacheliers vivant sur le littoral (voir Annexe A6). Le domaine en fonction de la CSP du père : les élèves vivant dans un milieu aisé font plus de médecine que ceux issus d’un milieu moins aisé. Pour ceux qui sont dans un milieu défavorisé, la part qui s’oriente vers les langues est plus importante que le milieu aisé (voir Annexe A7). Le domaine en fonction du sexe : les garçons s’orientent plus vers l’ingénierie et la physique que les filles. Les filles s’orientent plus vers les langues que les garçons (voir Annexe A8). Le domaine en fonction du baccalauréat mathématiques et lettres : la proportion des littéraires qui s’orientent vers les langues est très importante comparée aux matheux. Les matheux font plus d’ingénierie, de la physique, de l’informatique et des sciences fondamentales. Contrairement aux littéraires qui vont vers les domaines des sciences humaines (voir Annexe A9).
  18. 18. 17 Deuxième partie : Les modèles à choix discret Ce que nous cherchons à expliquer est le choix d’études supérieures des bacheliers. Ce choix peut être caractérisé par : les domaines, la durée des études (longue/courte durée) et le profil de la filière (cursus professionnalisant/académique). Ce sont des variables catégorielles, la régression linéaire n’est pas adaptée pour les traiter. 1. Premier modèle : expliquer le choix du domaine (en considérant le premier vœu) Nous allons utiliser plusieurs modèles polytomiques. Ces modèles seront non- ordonnés parce qu’il n’y a pas d’ordre pour les différentes filières d’études supérieures. Vu le nombre assez conséquent de formations proposées, interpréter les coefficients serait laborieux. C’est pour cette raison que nous avons décidé d’établir des groupes de domaines. Nous en dévoilons la composition ci-dessous : Domaine groupé Détails Ingénierie Agronomie, Ingénierie, Ingénierie et Technique apparenté, Arts et métiers, Architecture, Informatique et Physique/Informatique Sciences sociales Droit, Gestion, Commerce et Administration et Gestion, Economie et Finance Sciences humaines Langues et Sciences humaines Santé Médecine/Pharmacie et Santé et Services sociaux Sciences fondamentales Sciences fondamentales Autre Autres Table 12. La constitution des groupes de domaines 1.1. L’hypothèse I.I.A. Le modèle polytomique non-ordonné doit satisfaire l’hypothèse d’indépendance des alternatives non pertinentes (ou I.I.A. Independance of irrelevant alternative). Selon cette hypothèse, le rapport de deux probabilités associés à deux événements particuliers est indépendant des autres événements. Nos alternatives sont les domaines. Considérons deux modèles : le premier qui exclut le domaine des sciences fondamentales et le deuxième qui contient tous les domaines. Selon l’hypothèse I.I.A., le ratio « P(Ingénierie)/P(Sciences humaines) » du premier modèle doit être égal à « P(Ingénierie)/P(Sciences humaines) » du deuxième modèle. L’ajout d’une alternative n’influence pas ce ratio. Intuitivement, nous pourrions penser que dans le premier modèle, la probabilité de choisir le domaine de l’ingénierie est plus grande par rapport au deuxième modèle. En effet, entre ces deux modèles, il peut y avoir un changement d’orientation pour les élèves intéressés par les sciences fondamentales. En excluant les sciences fondamentales, les élèves intéressés par ce domaine ne vont probablement pas choisir les sciences sociales, ni les sciences humaines. Il reste le domaine de la santé et de l’ingénierie. Une part importante des élèves s’orienterait vers l’ingénierie. L’ajout du domaine des sciences fondamentales diminuera la probabilité de choisir l’ingénierie dans une proportion plus importante qu’il ne diminue la probabilité de choisir les sciences humaines. Or, pour que l’hypothèse I.I.A. soit respectée, il
  19. 19. 18 faudrait que les deux probabilités diminuent dans une même proportion (afin que le ratio des probabilités reste inchangé). Malgré la non-vérification de l’hypothèse I.I.A. dans notre cas, nous allons tout de même utiliser les modèles polytomiques non-ordonnés. Nous détaillons dans l’annexe A14 le test d’Hausman-McFadden que nous avons utilisé après les régressions pour montrer la non- validité de l’hypothèse I.I.A dans notre cas. 1.2. Le logit multinomial Tout d’abord, nous voulons expliquer le choix des domaines par rapport aux caractéristiques propres des individus. Ces variables sont les suivantes : -le score/ la formule générale (fg) : fg est une variable continue. Nous avons décidé de le centrer et réduire par type de baccalauréat. Comme pour la moyenne obtenue au baccalauréat, cela est plus pertinent en matière de comparaison. -le type de baccalauréat : économie-gestion, lettres, mathématiques, sciences expérimentales et techniques. -la position géographique : nous faisons la distinction entre les régions du littoral et les régions intérieures -le milieu social : groupe plus aisé, groupe plus défavorisé et groupe libre -le sexe Il serait judicieux d’utiliser le logit multinomial. Nous n’allons pas inclure la variable sexe dans le modèle comme les autres variables explicatives. Nous allons plutôt effectuer des régressions multinomiales séparément pour les filles et pour les garçons. Le modèle utilisé dans ces deux régressions est le suivant : Uij = + où  i est l’indice qui représente l’individu (i = 1,…, 74398) ; j correspond au groupe de domaine (j = 1,…,6)  Uij représente l’utilité du bachelier i s’il choisit le groupe de domaine j. L’individu i choisira l’alternative qui maximise son utilité. Uij s’interprète comme une variable latente dans notre modèle.  littorali est une variable binaire, baccalauréati et CSPi sont des vecteurs de variables binaires. baccalauréati = ( ) et = ( ) (Le baccalauréat économie-gestion est le baccalauréat de référence) CSPi = ( ) et = ( ) (Le groupe défavorisé est le groupe de référence)  Nous supposons finalement que les ( ) i=1,…,74398 sont indépendantes et suivent une loi de Gompertz.
  20. 20. 19 Ces tableaux ci-dessous représentent les coefficients et les écart-types entre parenthèses, que nous avons obtenus pour les deux régressions (chez les garçons et chez les filles). Le domaine de référence est celui des sciences sociales. Ingénierie Sciences humaines Santé Sciences fondamentales Autres Littoral -0,277*** (0,041) -0,188*** (0,055) -0,289*** (0,066) -0,631*** (0,058) -0,241*** (0,053) Lettres -0,591*** (0,085) 3,456*** (0,088) 1,722*** (0,385) 1,718*** (0,117) 3,015*** (0,075) Mathématiques 2,823*** (0,053) -0,407*** (0,133) 5,683*** (0,250) 3,404*** (0,106) 0,892*** (0,095) Sciences Expérimentales 2,692 *** (0,065) 0,384*** (0,194) 7,180*** (0.254) 3,642*** (0,114) 1,707*** (0,096) Techniques 4,267*** (0,074) 0,962*** (0,251) 4,711*** (0,268) 3,280*** (0,129) 2,564*** (0,101) fg 0,341*** (0,022) -0,824*** (0,034) 1,041*** (0,189) 0,239*** (0,032) -0,758*** (0,034) Groupe Aisé -0,288*** (0,044) 0,064 (0,064) -0,727*** (0,069) -0,881*** (0,068) -0,185*** (0,061) Groupe Libre -0,700*** (0,085) -0,434*** (0,154) -1,011*** (0,129) -1,289*** (0,149) -0,528*** (0,134) Table 13. Le modèle logit multinomial sans interaction (garçons) : les coefficients Ingénierie Sciences humaines Santé Sciences fondamentales Autres Littoral7 -0,200*** (0,032) -0,106*** (0,033) -0,181*** (0,042) -0,419*** (0,048) -0,268*** (0,036) Lettres -0,467*** (0,054) 3,009*** (0,044) 2,237*** (0,124) 1,800*** (0,128) 2,778*** (0,051) Mathématiques 2,305*** (0,045) -0,289*** (0,096) 5,155*** (0,123) 4,036*** (0,121) 1,089*** (0,076) Sciences Expérimentales 2,297*** (0,045) 0,656*** (0,069) 6 ,250*** (0,122) 4,424*** (0,119) 1,806*** (0,064) Techniques 3,704*** (0,094) 0,691*** (0,176) 4,293*** (0,183) 3,979*** (0,171) 2,807*** (0,117) fg 0,068*** (0,017) -0,410*** (0,018) 1,160*** (0,022) 0,001 (0,028) -0,516*** (0,021) Groupe Aisé -0,076*** (0,037) 0,310*** (0,041) -0,508*** (0,048) -0,322*** (0,055) 0,002 (0,044) Groupe Libre -0,293*** (0,072) 0,011 (0,087) -0,802*** (0,093) -0,740*** (0,122) -0,029*** (0,096) Table 14. Le modèle logit multinomial sans interaction (filles) : les coefficients *significatif au seuil de 10% **significatif au seuil de 5% ***significatif au seuil de 1%
  21. 21. 20 Nous remarquons que les signes des coefficients significatifs sont presque similaires dans les deux régressions. Ainsi, l’impact que pourraient exercer le score, le choix du type de baccalauréat et la catégorie socioprofessionnelle est similaire en termes d’effet (augmente ou diminue la probabilité de choisir tel domaine par rapport au domaine de référence) chez les garçons et chez les filles. Etre sur le littoral plutôt que les régions intérieures fait diminuer la probabilité de choisir chacun des autres domaines plutôt que les sciences sociales. Le fait d’avoir un baccalauréat en mathématiques plutôt qu’économie-gestion augmente la probabilité de choisir le domaine de l’ingénierie plutôt que le domaine des sciences sociales, toutes choses égales par ailleurs. Le fait d’avoir un baccalauréat lettres plutôt qu’économie-gestion diminue la probabilité de choisir l’ingénierie plutôt que les sciences sociales. Pour un bachelier en sciences expérimentales, la probabilité de choisir la santé plutôt que les sciences sociales augmente par rapport au bachelier en économie-gestion, toutes choses égales par ailleurs. Enfin, avoir un baccalauréat en techniques plutôt qu’économie-gestion augmente la probabilité de choisir tous les autres domaines plutôt que les sciences sociales. En général, une augmentation du score augmente la probabilité de choisir l’ingénierie et la santé et diminue la probabilité de choisir les sciences humaines (par rapport aux sciences sociales) pour les deux sexes, toutes choses égales par ailleurs. Pour les filles, l’impact du score sur le choix du domaine des sciences fondamentales par rapport au domaine des sciences sociales n’est pas significatif tandis que pour les garçons cet impact est positif. Etre dans le groupe plus aisé plutôt que le groupe plus défavorisé fait augmenter la probabilité de choisir les sciences humaines plutôt que les sciences sociales et fait diminuer la probabilité de choisir les autres domaines. Effets marginaux sur la prédiction après l’estimation Pour voir plus en détail ce que donne le résultat de régression, nous proposons d’étudier les effets marginaux. Ils nous permettent d’évaluer l’intensité des impacts des différentes variables explicatives sur le choix du domaine. Il est plus intéressant d’analyser les effets marginaux sur la probabilité prédite plutôt que les coefficients ou les odds-ratios. En effet, selon le choix de domaine de référence, nous obtiendrions des coefficients de régression (ainsi que les odds-ratios) différents, mais les effets marginaux ne changent pas. Nous pouvons donc étudier directement les effets marginaux sur les 6 groupes de domaine d’études. Il n’y a plus de domaine de référence. Les deux tableaux ci-dessous, qui représentent les effets marginaux et les écart-types entre parenthèses, se lisent de deux façons, soit verticalement, soit horizontalement. La lecture colonne par colonne nous donne l’impact des différentes variables explicatives sur le choix d’un domaine fixé. Si nous regardons les deux tableaux, lignes par lignes, nous pouvons étudier l’impact d’une variable explicative sur plusieurs choix de domaines. Nous fixons le seuil de 5% pour commenter les résultats.
  22. 22. 21 Ingénierie Sciences sociales Sciences humaines Santé Sciences fondamentales Autre Littoral -0,018** (0,008) 0,052*** (0,006) 0,003 (0,002) -0,001 (0,001) -0,036*** (0,004) 0,000 (0,004) Lettres -0.498*** (0,010) -0,145*** (0,005) 0,240*** (0,013) 0,015** (0,007) 0,063*** (0,012) 0,327*** (0,015) Mathématiques 0,166*** (0,021) -0,298*** (0,005) -0,072*** (0,003) 0,198*** (0,026) 0,096*** (0,012) -0,091*** (0,004) Sciences Expérimentales -0,169*** (0,029) -0,278*** (0,005) -0,054*** (0,003) 0,528*** (0,043) 0,047*** (0,014) -0,074*** (0,004) Techniques 0,473*** (0,011) -0,381*** (0,005) -0,061*** (0,003) 0,033*** (0,009) -0,010 (0,007) -0,054*** (0,004) fg 0,115*** (0,005) -0,027*** (0,003) -0,043*** (0,002) 0,027*** (0,002) 0,011*** (0,003) -0,083*** (0,003) Groupe Aisé -0,018** (0,009) 0,057*** (0,007) 0,015*** (0,003) -0,009*** (0,001) -0,052*** (0,004) 0,006 (0,005) Groupe Libre -0,087*** (0,018) 0,143*** (0,018) 0,004 (0,007) -0,008*** (0,002) -0,051*** (0,006) -0,001 (0,010) Table 15. Le modèle logit multinomial sans interaction (garçons) : les effets marginaux Ingénierie Sciences sociales Sciences humaines Santé Sciences fondamentales Autre Littoral -0,014*** (0,005) 0,046*** (0,006) 0,006 (0,004) -0,002 (0,002) -0,016*** (0,002) -0,021*** (0,004) Lettres -0,308*** (0,005) -0,308*** (0,005) 0,302*** (0,008) 0,040** (0,006) 0,022*** (0,006) 0,252*** (0,008) Mathématiques 0,012 (0,010) -0,336*** (0,004) -0,184*** (0,004) 0,445*** (0,023) 0,177*** (0,017) -0,114*** (0,005) Sciences Expérimentales -0,052*** (0,007) -0,401*** (0,004) -0,162*** (0,004) 0,559*** (0,019) 0,138*** (0,013) -0,082*** (0,005) Techniques 0,272*** (0,019) -0,333*** (0,004) -0,154*** (0,004) 0,131*** (0,022) 0,099*** (0,018) -0,014 (0,011) fg 0,036*** (0,003) 0,026*** (0,003) -0,054*** (0,002) 0,060*** (0,002) 0,005*** (0,001) -0,073*** (0,002) Groupe Aisé -0,017** (0,006) 0,001 (0,007) 0,055*** (0,006) -0,022*** (0,002) -0,017*** (0,002) 0,001 (0,005) Groupe Libre -0,027*** (0,011) 0,061*** (0,014) 0,033*** (0,012) -0,023*** (0,002) -0,025*** (0,004) -0,018 (0,011) Table 16. Le modèle logit multinomial sans interaction (filles) : les effets marginaux Etre dans le groupe plus aisé plutôt que le groupe plus défavorisé a un impact sur le choix de domaine d’études. Pour un garçon, le fait d’être issu d’un milieu aisé augmente de 5,7% la probabilité de faire des sciences sociales et diminue de 5,2% la probabilité de choisir les sciences fondamentales. Pour les filles, être issu d’un milieu aisé augmente la probabilité de 5,5% de faire des sciences humaines. Etre sur le littoral augmente de 4,6% la probabilité de choisir les sciences sociales pour les filles (ce nombre s’élève à 5,2% pour les garçons), diminue pour l’ingénierie et les sciences fondamentales. Les effets marginaux (liés au fait d’être sur le littoral) sont non- significatifs pour la santé et les sciences humaines, toutes choses égales par ailleurs. Le domaine de la santé est un cas particulier où les formations sont seulement sur le littoral. Les
  23. 23. 22 bacheliers choisissant ce domaine ne vont probablement pas prendre en compte leur position géographique. En moyenne, une augmentation du score, diminue la probabilité de choisir les sciences humaines pour les filles (les sciences humaines et sociales pour les garçons). Elle augmente, notamment, la probabilité de choisir la santé pour les filles et l’ingénierie pour les garçons. Par rapport aux autres variables explicatives, le type de baccalauréat obtenu influence beaucoup le choix de domaine d’études. Faire un baccalauréat lettres plutôt qu’économie-gestion augmente de 30,2% la probabilité de faire des sciences humaines pour les filles (24% pour les garçons) et diminue de 30,8% la probabilité de faire l’ingénierie pour les filles (49,8% pour les garçons). Le fait d’avoir un baccalauréat mathématiques plutôt qu’économie-gestion fait augmenter de 16,6% la probabilité de choisir l’ingénierie pour les garçons alors que pour les filles, ce n’est pas significatif. Les filles qui ont un baccalauréat mathématiques plutôt qu’économie-gestion s’orientent vers le domaine de la santé, la probabilité augmente de 44,5%, ce pourcentage est de 19,8% pour les garçons. Les bacheliers en sciences expérimentales plutôt qu’en économie-gestion voient leur probabilité de choisir santé augmenter de 55,9% pour les filles (52,8% pour les garçons). Faire un baccalauréat techniques plutôt qu’économie-gestion fait augmenter de 47,3% la probabilité de choisir l’ingénierie pour les garçons, ce pourcentage est de 27,2% pour les filles. Nous présentons ici quelques résultats principaux concernant les types de baccalauréat. Les littéraires, surtout les filles, préfèrent les sciences humaines. Pour les bacheliers en mathématiques, ils préfèrent l’ingénierie, les sciences fondamentales et la santé ; l’ingénierie attire un peu plus de garçons, la santé et les sciences fondamentales attirent plus de filles. Les bacheliers en sciences expérimentales préfèrent la santé et les sciences fondamentales, mais la préférence pour la santé est plus grande. Les bacheliers en techniques sont attirés par l’ingénierie et un peu la santé. Les résultats avec les interactions Nous soupçonnons qu’il puisse exister une interaction significative entre le score et le libellé du baccalauréat. Selon le type de baccalauréat, le score joue un rôle différent pour le choix des domaines d’études. Par exemple, prenons deux bacheliers avec un score faible, l’un étant littéraire voulant faire des études de langues, l’autre est un bachelier en sciences expérimentales souhaitant faire de la médecine. Intuitivement, le littéraire ne sera pas pénalisé de la même ampleur que celui qui souhaiterait faire de la médecine. La médecine est un domaine très sélectif. Nous proposons d’estimer un modèle qui prend en compte les interactions entre le score et le libellé du baccalauréat pour voir si nos interprétations changent : Uij = + Nous gardons toujours les sciences sociales comme domaine de référence.
  24. 24. 23 Voici les résultats : Ingénierie Sciences humaines Santé Sciences fondamentales Autres Littoral -0,281*** (0,041) -0,185*** (0,055) -0,310*** (0,066) -0,618*** (0,059) -0,237*** (0,053) Lettres -0,417*** (0,085) 3,578*** (0,088) 2,250*** (0,385) 1,828*** (0,152) 3,033*** (0,086) Mathématiques 2,889*** (0,056) -0,083 (0,186) 5,228*** (0,340) 3,834*** (0,135) 0,659*** (0,149) Sciences Expérimentales 2,928*** (0,079) 0,851*** (0,194) 6,942*** (0,341) 4,107*** (0,151) 2,029*** (0,135) Techniques 4,595*** (0,097) 0,923*** (0,251) 5,387*** (0,357) 4,063*** (0,165) 2,377*** (0,157) fg -0,278*** (0,041) -1,182*** (0,082) 1,041*** (0,189) 0,949*** (0,081) -0,940*** (0,081) Lettres*fg 0,113 (0,431) 0,513*** (0,093) -0,087 (0,220) -0,184* (0,105) 0,394*** (0,094) Mathématiques *fg 0,901*** (0,062) 0,711*** (0,198) 0,767*** (0,200) -0,813*** (0,102) -0,037* (0,153) Sciences Exp. *fg 1,108*** (0,094) 0,943*** (0,223) 0,977*** (0,201) -0,724*** (0,133) 0,732*** (0,156) Techniques *fg 1,445*** (0,119) 0,401 (0,280) 0,448* (0,232) -0,135 (0,153) 0,171** (0,180) Groupe Aisé -0,321*** (0,045) 0,040 (0,064) -0,788*** (0,072) -0,853*** (0,068) -0,208*** (0,061) Groupe Libre -0,739*** (0,088) -0,451*** (0,154) -1,129*** (0,136) -1,234*** (0,149) -0,542*** (0,134) Table 17. Le modèle logit multinomial avec interaction (garçons) : les coefficients Ingénierie Sciences humaines Santé Sciences fondamentales Autres Littoral -0,222*** (0,032) -0,107*** (0,029) -0,229*** (0,044) -0,406*** (0,048) -0,268*** (0,036) Lettres -0,430*** (0,055) 3,088*** (0,047) 2,296*** (0,146) 1,815*** (0,165) 2,835*** (0,056) Mathématiques 2,412*** (0,048) -0,168 (0,115) 4,529*** (0,142) 4,460*** (0,153) 1,055*** (0,098) Sciences Expérimentales 2,610*** (0,054) 1,052*** (0,086) 5,761*** (0,141) 4,999*** (0,154) 2,135*** (0,082) Techniques 3,911*** (0,117) 0,663*** (0,258) 4,209*** (0,207) 4,606*** (0,207) 2,770*** (0,158) fg -0,236*** (0,029) -0,756*** (0,046) 0,583*** (0,084) 0,691*** (0,083) -0,763*** (0,057) Lettres*fg -0,069 (0,057) 0,367*** (0,051) 0,038 (0,092) -0,119 (0,096) 0,295*** (0,062) Mathématiques *fg 0,786*** (0,053) 0,549*** (0,130) 1,007*** (0,099) -0,604*** (0,102) 0,261*** (0,109) Sciences Exp. *fg 1,015*** (0,064) 1,032*** (0,104) 1,564*** (0,103) -0,343*** (0,107) 0,857*** (0,097)
  25. 25. 24 Techniques *fg 1,050*** (0,151) 0,345 (0,325) 0,743*** (0,192) -0,112 (0,204) 0,316 (0,200) Groupe Aisé -0,141*** (0,037) 0,274*** (0,041) -0,627*** (0,507) -0,314*** (0,507) -0,028 (0,044) Groupe Libre -0,382*** (0,074) -0,032 (0,088) -0,973*** (0,101) -0,740*** (0,122) -0,328*** (0,096) Table 18. Le modèle logit multinomial avec interaction (filles) : les coefficients Par rapport au modèle sans interactions, les signes et les significativités des coefficients représentants le littoral et le milieu social ne diffèrent pas, ainsi, il en est de même pour les interprétations. Les signes des coefficients des types de baccalauréat sans interaction restent inchangés. La prise en compte de l’interaction avec le score apporte plus d’informations sur le choix d’études, sans contredire les résultats énoncés dans le modèle sans interactions. Le fait d’avoir fait un baccalauréat lettres plutôt qu’économie-gestion fait diminuer la probabilité de choisir l’ingénierie aux sciences humaines. La variation du score pour un bachelier littéraire n’affecte pas significativement cette diminution de probabilité. Faire un baccalauréat lettres plutôt qu’économie-gestion fait augmenter la probabilité de choisir les sciences humaines, cette augmentation est d’autant plus forte que le score augmente. Le fait d’avoir un baccalauréat mathématiques plutôt qu’économie-gestion augmente la probabilité de choisir le domaine de l’ingénierie et de la santé plutôt que le domaine des sciences sociales, toutes choses égales par ailleurs. Cet effet est d’autant plus grand que le score augmente. Avoir un baccalauréat mathématiques plutôt qu’économie-gestion augmente la probabilité de choisir les sciences fondamentales aux sciences sociales, cette augmentation s’atténue quand le score augmente. Faire un baccalauréat en sciences expérimentales plutôt qu’en économie-gestion augmente la probabilité de faire la santé au lieu des sciences sociales. Cette augmentation est d’autant plus forte que le score augmente. Avoir un baccalauréat techniques plutôt qu’économie-gestion fait augmenter la probabilité de choisir l’ingénierie, cette augmentation est d’autant plus forte que le score augmente. Les vœux affectés Nous travaillons maintenant avec les vœux affectés. Nous refaisons les mêmes régressions pour voir s’il y a une différence remarquable entre l’explication du premier choix de domaine (correspondant au premier vœu) et l’explication du domaine affecté (correspondant au choix de filière affectée)8 . Dans les deux cas : domaine du premier vœu et domaine affecté, presque tous les coefficients gardent leur significativité et leur signe. En effet, le premier vœu et le vœu affecté sont plus ou moins liés, ils sont dans la majorité des cas dans le même groupe de domaine. Le tableau des effets marginaux9 pour le vœu affecté (sans prendre en compte les interactions) 8 Voir Annexe A10 et A11 pour le tableau des coefficients 9 Voir Annexe A12 et A13 pour le tableau des effets marginaux
  26. 26. 25 nous montre qu’il y a une différence entre l’intensité des effets dans les deux cas, mais les conclusions générales sur le sens des effets (l’augmentation ou la diminution de la probabilité) de choisir un tel groupe de domaine restent quasiment inchangées. 1.3. Le logit conditionnel Nous expliquons maintenant le choix de domaine d’études (en utilisant le premier vœu) par la durée d’études, le taux de chômage et la capacité d’accueil. Le taux de chômage est issu d’une enquête sur les diplômés du supérieur (ce taux diffère avec le type du diplôme) trois ans après l’obtention du diplôme. Nos variables explicatives sont propres à chaque domaine. Le modèle logit multinomial ne répond plus à notre besoin. Nous utiliserons le modèle logit conditionnel qui nous permet de prendre en compte les variables explicatives alternatives spécifiques. Vu que nous avons regroupé les filières en domaines, ensuite les domaines en 6 groupes de domaines au total, nous proposons de considérer la durée moyenne d’études, le niveau de chômage moyen et la capacité moyenne. Plus précisément, pour chaque groupe de domaine, la variable durée d’études (resp. chômage) prend la valeur moyenne des durées d’études (resp. la moyenne du niveau de chômage) de toutes les filières comprises dans ce groupe de domaine ; la variable capacité prend la valeur moyenne des capacités d’accueil de tous les établissements pour les filières comprises dans ce groupe de domaine. Nous présentons ci-dessous les valeurs que prennent nos variables explicatives selon le groupe de domaine, ainsi que leurs moyennes et leurs écart-types : Groupe de domaine Durée d’études Chômage Capacité Ingénierie 2,80 28,60 51,31 Sciences sociales 2,85 38,00 59,45 Sciences humaines 3,32 41,00 83,70 Santé 3,40 35,48 64,88 Sciences fondamentales 3,00 34,00 45,00 Autre 2,98 38,62 55,65 Moyenne 3,058 35,950 53,958 (Ecart-type) (0,225) (3,977) (13,714) Table 19. La moyenne de la durée d’études, du taux de chômage et de la capacité Le modèle logit conditionnel que nous utilisons est le suivant : Uij = β.Xj + i , i=1,… , 74398 ; j = 1,...,3 Où β = (β1 β2 β3) et Xij = Xj = ( ) Uij s’interprète comme l’utilité de l’individu i s’il prend l’alternative j. L’individu choisit l’alternative j qui maximise son utilité. Toutes les p-valeurs sont nulles, les coefficients sont tous significatifs. En général, pour un domaine donné, plus la durée d’études et le niveau de chômage correspondants sont élevés plus l’utilité de l’individu qui choisit ce domaine diminue. Par contre, plus la capacité d’accueil augmente, plus l’utilité que donne ce domaine à l’individu augmente, plus sa probabilité de choisir ce domaine est forte.
  27. 27. 26 Variable explicative Coefficient Durée d’études -1,974*** (0,025) Chômage -0,033*** (0,001) Capacité 0,027*** (0,004) Table 20. Le modèle logit conditionnel : les coefficients Nous allons étudier les effets marginaux pour voir l’impact d’une variation de la durée d’études, du niveau de chômage et de la capacité de chacun des domaines groupés sur le comportement d’un bachelier face au choix de domaine d’études. Variable explicative Domaine Ingénierie Science sociales Sciences humaines Santé Sciences fondam. Autre Duréed’études Ingénierie -0,3881 (0,0053) 0,1172 (0,0022) 0,0804 (0,0012) 0,0498 (0,0004) 0,0899 (0,0013) 0,0508 (0,0007) Sciences sociales 0,1171 (0,0022) -0,3396 (0,0055) 0,0660 (0,0013) 0,0409 (0,0004) 0,0738 (0,0012) 0,0417 (0,0008) Sciences humaines 0,0804 (0,0012) 0,0660 (0,0013) -0,2538 (0,0035) 0,0281 (0,0003) 0,0507 (0,0007) 0,0286 (0,0004) Santé 0,0498 (0,0004) 0,0409 (0,0004) 0,0281 (0,0000) -0,1678 (0,0009) 0,0314 (0,0001) 0,0177 (0,0001) Sciences Fondamentales 0,0899 (0,0013) 0,0738 (0,0012) 0,0507 (0,0007) 0,0314 (0,0001) -0,2778 (0,0033) 0,0320 (0,0004) Autre 0,0508 (0,0007) 0,0417 (0,0008) 0,0286 (0,0004) 0,0177 (0,0001) 0,0320 (0,0004) -0,1708 (0,0022) Chômage Ingénierie -0,0065 (0,0002) 0,0020 (0,0001) 0,0014 (0,0000) 0,0008 (0,0000) 0,0015 (0,0001) 0,0009 (0,0000) Sciences sociales 0,0020 (0,0001) -0,0057 (0,0002) 0,0011 (0,0000) 0,0007 (0,0000) 0,0012 (0,0000) 0,0007 (0,0000) Sciences humaines 0,0014 (0,0000) 0,0011 (0,0000) -0,0043 (0,0001) 0,0005 (0,0000) 0,0009 (0,0000) 0,0005 (0,0000) Santé 0,0008 (0,000) 0,0007 (0,0000) 0,0005 (0,0000) -0,0028 (0,0001) 0,0005 (0,0000) 0,0003 (0,0000) Sciences Fondamentales 0,0015 (0,0001) 0,0012 (0,0000) 0,0009 (0,0000) 0,0005 (0,0000) -0,0047 (0,0001) 0,0005 (0,0000) Autre 0,0009 (0,0000) 0,0007 (0,0000) 0,0005 (0,0000) 0,0003 (0,0000) 0,0005 (0,0000) -0,0029 (0,0001) Capacité Ingénierie 0,0053 (0,0009) -0,0016 (0,0000) -0,0011 (0,0000) -0,0007 (0,0000) -0,0012 (0,0000) -0,0007 (0,0000) Sciences sociales -0,0016 (0,0001) 0,0046 (0,0001) -0,0009 (0,0000) -0,0006 (0,0000) -0,0010 (0,0000) -0,0006 (0,0000) Sciences humaines -0,0011 (0,0000) -0,0090 (0,0000) 0,0035 (0,0001) 0,0004 (0,0000) -0,0007 (0,0000) -0,0004 (0,0000) Santé -0,0007 (0,0000) -0,0056 (0,0000) -0,0004 (0,0000) 0,0023 (0,0000) -0,0004 (0,0000) -0,0002 (0,0000) Sciences Fondamentales -0,0012 (0,0000) -0,0010 (0,0000) -0,0007 (0,0000) -0,0004 (0,0000) 0,0038 (0,0001) -0,0004 (0,0000) Autre -0,0007 (0,0000) -0,0006 (0,0000) -0,0004 (0,0000) -0,0002 (0,0000) -0,0004 (0,0000) 0,0023 (0,0000) Table 21. Le modèle logit conditionnel : les effets marginaux Tous les résultats des effets marginaux sont significativement différents de 0 au seuil de 1%.
  28. 28. 27 Nous remarquons qu’un prolongement de la durée d’études d’un groupe de domaine fait diminuer la probabilité de choisir ce groupe de domaine et fait augmenter la probabilité de choisir chacun des autres groupes de domaines. Nous constatons le même type d’effet avec une hausse du taux de chômage. Par contre, quand la capacité moyenne d’accueil d’un groupe de domaine augmente, la probabilité pour un bachelier de choisir ce groupe de domaine augmente, la probabilité de choisir des autres groupes de domaines diminue. Nous constatons une baisse très forte de la probabilité de choisir l’ingénierie (38,81%) quand la durée d’études moyenne pour ce domaine groupé se prolonge d’un an, toutes choses égales par ailleurs. La probabilité de choisir chacun des autres groupes de domaines (à part Autre et la santé) augmente environ de 10%. Le prolongement d’un an de la durée d’études dans chacun des groupes de domaines parmi les sciences sociales, les sciences humaines, la santé, les sciences fondamentales n’a pas un effet très important sur la probabilité de choisir les groupes de domaines qui restent. Toutes choses égales par ailleurs, une hausse de 1% du taux de chômage pour n’importe quel groupe de domaine ne fait pas varier remarquablement la probabilité de choisir un autre groupe de domaines (une diminution de 0,3% à 0,6% pour ce même groupe de domaine et une augmentation de moins de 0,2% de la probabilité de choisir l’un des autres groupes). Toutes choses égales par ailleurs, une augmentation d’une place de la capacité moyenne d’accueil pour un groupe de domaine donné, fait augmenter la probabilité de choisir ce groupe de 0,23% à 0,53% et fait diminuer la probabilité de choisir chacun des autres groupes de domaine d’environ 0,1% ou moins. L’effet minime d’une augmentation d’une unité du taux de chômage ou de la capacité d’accueil par rapport à l’effet d’une augmentation d’une unité de la durée d’études est raisonnable. En effet, la durée d’études moyenne pour tous les domaines est d’environ 3 ans, une augmentation d’un an correspond à un prolongement de 33% de la durée d’études totale. Elle implique donc une variation très forte du choix du domaine d’études. Par contre, le niveau moyen de chômage est de 35,95 % et la capacité moyenne d’accueil est à peu près de 54 places, une variation de 1% du taux de chômage ou une variation d’une place de la capacité d’accueil ne modifie pas d’une manière importante la probabilité de choisir un tel groupe de domaine. L’effet sera plus net si nous considérons une variation de 5 à 10 unités du niveau de chômage ou de la capacité d’accueil. Si nous regardons l’effet d’une variation de la durée d’études ou du taux de chômage ou de la capacité d’un groupe de domaine sur la probabilité de choisir ce même groupe, nous pouvons voir que l’ingénierie est le groupe le plus sensible et la santé est le groupe qui l’est le moins. Le résultat observé pour l’ingénierie est plus naturel car parmi les groupes de domaine, l’ingénierie est caractérisé par la durée d’études la plus courte, le niveau de chômage le plus faible et une capacité d’accueil assez limitée. Ce qui est remarquable vient du groupe de domaine de la santé. Il paraît être le groupe le moins sensible. Un changement d’un an de la durée d’études sur la probabilité de choisir ce groupe de domaine a un effet plus faible par rapport aux autres groupes de domaine. C’est tout à fait normal parce que la durée présente pour les études de santé est la plus grande parmi
  29. 29. 28 l’ensemble des groupes de domaine (3,4 ans). Par contre, le groupe de la santé a un niveau de chômage moyen ainsi qu’une capacité d’accueil pas très élevée (elle est relativement faible par rapport à celle des sciences humaines et plus proches des autres domaines). Or l’effet direct d’un changement du niveau de chômage et de la capacité d’accueil sur la probabilité de choisir la santé est plus faible que celui sur la probabilité de choisir les autres groupes. Nous pouvons l’expliquer par la raison suivante : les élèves qui souhaitent faire médecine et plus généralement une formation axée sur le milieu de la santé ont des résultats élevés. Ainsi, ils sont donc moins sensibles au changement de capacité d’accueil et de taux de chômage que les autres élèves. 2. Deuxième modèle : expliquer la durée des études (en considérant le premier vœu) Il peut être pertinent d’expliquer le choix des études supérieures à travers la durée des études. En effet, l’éducation est un investissement. La durée de cet investissement va dépendre de sa « rentabilité » pour un individu rationnel. Nous verrons pourquoi certains élèves investissent moins que d’autres et nous essayerons de décrire ceux qui investissent le plus. Ainsi, nous proposons de régresser la durée des études sur le sexe, le littoral, le libellé du baccalauréat, le score et la CSP. La variable à expliquer est binaire, elle vaut 0 si la durée des études est inférieure ou égale à 3 ans et vaut 1 sinon. Voici le modèle : + où  , si , l’individu i va choisir des études de longues durées.  Ui représente l’utilité du bachelier i s’il choisit de faire de longues études. Ui s’interprète comme une variable latente dans notre modèle.  Nous supposons finalement que les ( ) i=1,…,74398 sont indépendantes et suivent une loi logistique. Odds-ratios Coefficients Littoral 0,970 (0,021) -0,030 (0,022) Lettres 7,764*** (0,359) 2,049*** (0,046) Mathématiques 10,366*** (0,491) 2,339*** (0,047) Sciences expérimentales 8,965*** (0,424) 2,193*** (0,047) Techniques 5,674*** (0,296) 1,736*** (0,052) Sexe 1,415*** (0,032) 0,347*** (0,023) Aisé 1,347*** (0,032) 0,298*** (0,024) Libre 1,438*** (0,068) 0,363*** (0,047) fg 2,941*** (0,001) 1,079*** (0,011) Table 22. Les odds-ratios et les coefficients lorsque la variable dépendante est la durée des études
  30. 30. 29 Les interprétations des coefficients Pour un élève habitant sur le littoral, la probabilité de faire des études longues diminue. Pour tous les autres types de baccalauréat, la probabilité de faire des études longues augmente par rapport au baccalauréat de référence (économie-gestion), toutes choses égales par ailleurs. Le fait que l’élève soit un garçon va augmenter la probabilité de faire des études longues. Si le score augmente, la probabilité que l’élève fasse des études longues va augmenter. Si l’élève est issu d’un milieu aisé, il a plus de chance de faire des études longues qu’un élève issu d’un milieu défavorisé. Les odds-ratios Nous définissons la chance par la formule suivante : P (longues études|X)/P(courtes études|X). L’odd-ratio est définit comme le rapport des chances. Pour l’obtenir, il suffit de mettre le coefficient à l’exponentiel. Pour la variable littorale, l’odd-ratio est de 0,97. Cela signifie, toutes choses égales par ailleurs, que nous multiplions la chance de faire des études longues par 0,97 en étant sur le littoral. Peu importe le type de baccalauréat, nous multiplions par un nombre supérieur à 5 la chance de faire de longues études par rapport à un élève qui fait un baccalauréat économie- gestion, toutes choses égales par ailleurs. Par exemple, un élève disposant d’un baccalauréat mathématiques plutôt qu’un baccalauréat économie-gestion multipliera sa chance de faire des études longues par 10,37. Nous pouvons voir également qu’un bachelier vivant dans un milieu assez aisé aura plus de chance de faire de longues études qu’un bachelier issu d’un milieu plus défavorisé. L’odd-ratio est de 1,347. Augmenter le score d’un point va « multiplier » la chance de faire de longues études de 2,94 environ, toutes choses égales par ailleurs. Le fait d’être un garçon plutôt qu’une fille va multiplier la chance de faire des études longues par 1,42 environ. En résumé, le fait d’être sur le littoral ne donne pas plus de chances au bachelier de faire des études longues. Le fait d'être titulaire d’un baccalauréat (lettres, mathématiques, sciences fondamentales et techniques) donne une plus grande chance de faire des études longues par rapport au baccalauréat de référence. Un garçon aura plus de chances de faire des études longues qu’une fille. Vivre dans un milieu aisé par rapport à un milieu considéré plus défavorisé augmente la chance de faire des études longues. 3. Troisième modèle : expliquer la formation (académique/professionnelle) Nous distinguons les formations selon qu’elles soient professionnelles ou académiques. Nous cherchons à expliquer les motivations d’orientations des bacheliers par cette distinction. De même que pour la variable domaine, la construction a été faite par recherche lexicographique. Le modèle que nous estimons est le suivant : + où  , si , l’individu i va choisir des études à orientation professionnelle.  Ui représente l’utilité du bachelier i s’il choisit de faire des études professionnelles. Ui s’interprète comme une variable latente dans notre modèle.
  31. 31. 30  Nous supposons finalement que les ( ) i=1,…,74398 sont indépendantes et suivent une loi logistique. Nous obtenons les coefficients suivants : Odds-ratios Coefficients Littoral 1,011 (0,017) 0,011 (0,016) Lettres 0,339*** (0,008) -1,083*** (0,024) Mathématiques 0,596*** (0,015) -0,518*** (0,025) Sciences expérimentales 0,612*** (0,015) -0,492*** (0,025) Techniques 1,446*** (0,041) 0,369*** (0,028) Sexe 1,049*** (0,018) 0,047*** (0,017) Aisé 0,820*** (0,015) -0,199*** (0,019) Libre 0,799*** (0,032) -0,225*** (0,040) fg 0,666*** (0,006) -0,407*** (0,009) Table 23. Les odds-ratios et les coefficients quand la variable dépendante est le type de la formation (pro./aca.) Les interprétations des coefficients Nous remarquons qu’au niveau standard de 1%, seul le coefficient devant la variable littoral n’est pas significatif. Donc, la variable littoral n’a pas d’impact sur le fait de choisir une formation plus professionnelle qu’académique. Le fait d’avoir un baccalauréat mathématiques ou sciences expérimentales ou lettres par rapport à l’économie-gestion diminue la probabilité de faire des études professionnelles. Le fait d’être titulaire d’un baccalauréat techniques plutôt qu’économie-gestion augmente la probabilité de faire des études professionnelles. Ce résultat nous paraît cohérent. Le fait d’être un garçon augmente la probabilité de faire des études professionnelles. Si le bachelier est issu d’un milieu aisé, sa probabilité de faire des études professionnelles diminuera. Enfin, en augmentant le score, nous diminuons la probabilité de faire des études professionnnelles. Les odds-ratios Pour commenter les résultats, nous fixons le seuil de 1%. Avoir obtenu un baccalauréat lettres plutôt qu’économie-gestion, multiplie par 0,34 la chance de poursuivre des études dans une filière professionnelle, toutes choses égales par ailleurs. Cette chance augmente petit à petit pour les mathématiques et les sciences expérimentales (l’odd-ratio est d’environ de 0,6 pour les deux baccalauréats), mais elle reste toujours faible par rapport à l’économie-gestion. Pour les bacheliers en techniques, la chance de faire des études professionnelles est multipliée par 1,45 par rapport à l’économie-gestion. Le fait d’être un
  32. 32. 31 garçon va multiplier par 1,05 la chance de faire des études professionnelles par rapport aux filles. Si l’élève est dans un milieu aisé, sa chance de faire des études professionnelles va être multipliée par 0,8 par rapport au milieu défavorisé. En augmentant le score, la chance de faire des études professionnelles est multipliée par 0,7. Pour résumé, la chance de faire des études professionnelles est plus faible pour les littéraires par rapport au baccalauréat économie-gestion. Elle augmente pour les bacheliers en techniques. Le bachelier diminue sa chance de poursuivre des études professionnelles, s’il est issu d’un milieu aisé. Une augmentation de son score va réduire sa chance de faire des études professionnelles.
  33. 33. 32 Conclusion En expliquant le choix du domaine d’études par des caractéristiques individuelles dans le premier modèle (logit multinomial), nous sommes arrivés aux résultats suivants. Le type de baccalauréat obtenu va avoir une influence sur le choix du domaine d’études, les bacheliers vont s’orienter vers des domaines qui sont compatibles avec le type de baccalauréat. La formule générale va également affecter le choix du domaine d’études. En augmentant son score, l’élève pourra se permettre de s’orienter vers des domaines qui exigent de résultats très élevés. La position géographique du bachelier est aussi un facteur influent le choix du domaine, en étant sur le littoral, l’élève s’intéressera plus aux sciences sociales. Ces deux premiers faits sont valables pour les filles et les garçons. La catégorie socioprofessionnelle du père joue un rôle dans le choix du domaine d’études de l’élève, selon que l’élève soit issu d’un milieu aisé ou pas, il va avoir des choix différents. Etre dans un milieu aisé conduira à un intérêt plus marquant pour les sciences sociales (pour les garçons) et les sciences humaines (pour les filles) comparé aux autres domaines. Nous pouvons aussi expliquer le choix du domaine d’études par des caractéristiques propres aux domaines (premier modèle : logit conditionnel). D’une manière générale, si le taux de chômage et la durée d’études pour un domaine augmente, les bacheliers seront moins attirés par celui-ci. Néanmoins, ce résultat n’est pas très valable pour un domaine assez particulier : la santé. En augmentant la capacité d’accueil d’un domaine, un engouement accentué naîtra de la part des bacheliers pour ce domaine. Cela apparaît comme une réduction de contraintes pour les bacheliers voyant dans le livret délivré par le ministère, la capacité d’accueil de la filière augmenter. Le choix des études supérieures peut aussi s’expliquer en considérant la durée des études (deuxième modèle). Une disparité apparaît entre les garçons et les filles, ces dernières ont moins de chance de faire des études longues. Un bachelier dont la catégorie socioprofessionnelle du père est parmi les métiers les mieux payés, pourra s’offrir des études de longues durées. Les bacheliers en économie-gestion sont destinés à faire des études de courtes durées. Enfin, un résultat assez naturel, les élèves ayant un bon score s’aventureront vers des études de longues durées. L’orientation des bacheliers peut se voir en confrontant les cursus académiques aux cursus professionnalisant. L’adéquation entre le type de baccalauréat et le profil du cursus choisi est conservée, les bacheliers en techniques vont s’orienter vers les cursus professionnels, ceux en mathématiques vont préférer des parcours moins professionnels. La catégorie socioprofessionnelle influence toujours le choix des étudiants, être dans un milieu aisé diminue les chances de faire des études professionnelles. Selon Beffy, Fougère et Maurel (2009), le revenu espéré après le diplôme n’est pas un facteur important pour les étudiants français dans leur choix de majeures. Les salaires attendus ne sont pas disponibles dans nos données, il aurait pu être intéressant de voir si ces derniers auraient eu un effet marquant sur le choix d’études supérieures dans le cas tunisien.
  34. 34. 33 Les gouvernements cherchent à améliorer le système éducatif, ce sujet est toujours d’actualité. En France, cette année, le site internet établi pour les inscriptions post- baccalauréat précisera pour chaque formation le taux de poursuite des études et le taux d’insertion professionnelle. Un numéro vert a été mis en place, par la secrétaire d’Etat à l’Enseignement supérieur Geneviève Fioraso, pour guider les bacheliers et les familles sur leur orientation.
  35. 35. 34 Bibliographie Agasisti, Tommaso and Dal Bianco, Antonio (2007) “Determinants of College Student Migration in Italy: Empirical Evidence from a Gravity Approach”. Available at SSRN:http://ssrn.com/abstract=1063481 or http://dx.doi.org/10.2139/ssrn.1063481 Ani Katchova (2013) “Multinomial Probit and Logit Models, Conditional Logit Model, Mixed Logit Model” https://sites.google.com/site/econometricsacademy/econometrics-models/multinomial-probit- and-logit-models Baryla, E. A., and D. Dotterweich. (2001) “Student migration: Do significant factors vary by region?” Education Economics 9(3):269-80 Beffy, Fougère et Maurel (2009) « L’impact du travail salarié des étudiants sur la réussite et la poursuite des études universitaires », Document de travail, INSEE Boudarbat, Montmarquette (2007) “Choice of Fields of Study of Canadian University Graduates: The Role of Gender and their Parents’ Education”, IZA Discussion Paper No. 2552 Bruckmeier, Kerstin, Georg-Benedikt Fischer and Berthold U. Wigger (2013) "Does Distance Matter? Tuition Fees and Enrollment of First-Year Students at German Public Universities", CESifo Working Paper No. 4258, May 2013. Christophe Hurlin (2003) Polycopié de Cours «Econométrie des Variables Qualitatives - Chapitre 2 : Modèles Multinomiaux – Modèle Logit Multinomiaux Ordonnées et non Ordonnés » http://www.univ-orleans.fr/deg/masters/ESA/CH/Qualitatif_Chapitre2.pdf Hastings, Justine S., Thomas J. Kane, and Douglas O. Staiger. (2006). “Gender and Performance: Evidence from School Assignment by Randomized Lottery,” American Economic Review Papers and Proceedings, 96(2):232-236. Hoover-Dempsey, K.V., & Sandler, H.M. (1995). “Parental involvement in children's education: Why does it make a difference?” Teachers College Record, 97, 310-331. Kjellstrom and Regner (1998) “Does distance to a university affect enrollment decisions? Evidence from data on three cohorts of Swedes”, Working paper 8/98, Institute for Social Research, Stockholm University, Stockholm Mixon (1992a) “Factors affecting college student migration across States”,International Journal of Manpower Mixon (1992b) “A public choice note on college student migration”,International Journal of Manpower Mixon and Hsing (1994a) “College student migration and human capital theory: a research note”,Education Economics
  36. 36. 35 Mixon and Hsing (1994b) “The determinants of out out-of-state enrollments in higher education”, Economics of Education Review Ono (2001) “Migration patterns among Japanese university students”, Discussion paper, Center for Economic Policy Research Conference of the European Network on the Japanese Economy, University of Oxford, UK Sa et al. (2004) “Determinants of the regional demand for higher education in the Netherlands: a gravity model approach”, Regional Studies Xavier D’Haultfœuille (2014) Polycopié Econométrie 2
  37. 37. 36 Annexes A1 - Carte de la Tunisie
  38. 38. 37 A2 - Répartition des bacheliers en fonctions des gouvernorats Partie Gouvernorat Fréquence Pourcentage Littoral TUNIS 8068 10,84% SOUSSE 3888 5,23% SFAX 6825 9,17% MONASTIR 3537 4,75% NABEUL 4317 5,80% BIZERTE 3577 4,81% MAHDIA 2354 3,16% GABES 2912 3,91% ARIANA 3113 4,18% Sous total Littoral 38519 51,87% Intérieur BEJA 1786 2,40% BEN AROUS 4015 5,40% GAFSA 3243 4,36% JENDOUBA 2758 3,71% KAIROUAN 3235 4,35% KASSERINE 2908 3,91% KEBILI 1612 2,17% LE KEF 2297 3,09% MANOUBA 2521 3,39% MEDNINE 3333 4,48% SIDI BOUZID 3214 4,32% SILIANA 1624 2,18% TATAOUINE 1335 1,79% TOZEUR 1007 1,35% ZAGHOUANE 919 1,24% Sous-total Intérieur 35807 48,13% Total 74398 100%
  39. 39. 38 A3 - La répartition socioprofessionnelle sur le littoral et les régions intérieures A4 - Effectif des bacheliers et moyenne au baccalauréat selon le type Type de Bac Effectif Moyenne Ecart-type ECONOMIE ET GESTION 14255 981,857 110,0891 LETTRES 22017 957,3282 100,0311 MATHEMATIQUES 13949 1199,415 234,1167 SC. EXPERIMENTALES 15129 1133,651 245,1683 TECHNIQUES 9160 1050,692 171,9309 PROFESSEUR 4% INSTITUTEUR 2% OUVRIER QUALIFIE 13% OUVRIER NON QUALIFIE 23% PROFESSION LIBRE 7% P.M.CULTIVANT COMMERCANT 7% CADRE MOYEN NON INSTI 17% CADRE (NON PROF) 9% PÈRE DECEDE 5% RETRTAITE 11% SANS EMPLOI 2% Répartition socioprofessionnelle sur le littoral PROFESSEUR 2% INSTITUTEUR 2% OUVRIER QUALIFIE 9% OUVRIER NON QUALIFIE 35% PROFESSION LIBRE 3% P.M.CULTIVANT COMMERCANT 11% CADRE MOYEN NON INSTI 13% CADRE (NON PROF) 5% PÈRE DECEDE 5% RETRTAITE 9% SANS EMPLOI 6% Répartition socioprofessionnelle hors du littoral
  40. 40. 39 A5 - La répartition des CSP des parents entre régions et en total ou en total et dans deux sous partie de la Tunisie (littoral/ intérieur) Littoral CSP Gouvernorat Cadres(non prof) Cadremoyen ouinstitut. Instituteur Ouvrier(non qualifié) Ouvrier qualifié Cultivateur, commerçant Pèredécédé professeur Profession libre retraité Sansemploi Total population parville TUNIS 1271 1867 101 928 891 361 366 234 714 1139 196 8068 GABES 187 396 66 1026 354 157 140 69 71 274 172 2912 SOUSSE 269 731 117 769 610 254 196 164 297 416 65 3888 SFAX 476 911 194 1856 1099 565 294 276 460 632 62 6825 MONASTIR 240 631 124 765 509 299 151 151 161 445 61 3537 NABEUL 218 700 119 1120 564 523 222 176 237 386 52 4317 BIZERTE 284 492 53 906 468 241 174 108 153 573 125 3577 MAHDIA 84 304 98 734 286 282 121 69 87 184 105 2354 ARIANA 572 494 42 622 318 153 110 113 332 336 21 3113 Total Littoral 3601 6526 914 8726 5099 2835 1774 1360 2512 4385 859 38591 Régions intérieurs CSP Gouvernorat Cadres(non prof) Cadremoyen ouinstitut. Instituteur Ouvrier(non qualifié) Ouvrier qualifié Cultivateur, commerçant Pèredécédé professeur Profession libre retraité Sansemploi Total population parville BEJA 75 249 45 715 157 170 87 44 43 127 74 1786 BEN AROUS 586 1039 73 427 502 209 133 124 202 602 118 4015 GAFSA 141 415 56 806 375 365 183 53 49 550 250 3243 JENDOUBA 99 298 46 1246 212 219 128 50 64 231 165 2758 KAIROUAN 114 389 111 1314 242 461 150 83 89 168 114 3235 KASSERINE 62 250 67 891 177 256 196 46 57 188 718 2908 KEBILI 31 125 32 950 69 101 112 25 21 99 47 1612 LE KEF 75 249 50 894 152 184 127 40 45 163 318 2297 MANOUBA 195 532 30 642 308 110 114 60 115 309 106 2521 MEDNINE 115 406 107 1326 404 296 154 80 108 287 50 3333 SIDI BOUZID 69 279 96 1190 183 979 168 37 34 139 40 3214 SILIANA 43 181 31 722 163 170 90 19 42 78 85 1624 TATAOUINE 30 113 32 636 125 105 81 29 17 109 58 1335 TOZEUR 43 122 21 293 124 109 70 10 23 107 85 1007 ZAGHOUANE 43 154 21 330 75 127 40 18 29 76 6 919 Total hors- littoral 1721 4801 818 12382 3268 3861 1833 718 938 3233 2234 35807
  41. 41. 40 A6 - Répartition de la variable domaine selon le découpage géographique Agroalimentaire 1% Architecture 1% Arts et métiers 1% Autre 10% Droit 3% Gestion,commerce administration 3% Gestion,économie finance 18% Informatique 4% Ingénierie 21% Langues 12% Médecine Pharmacie 5% Physique Informatique 6% Santé et services sociaux 7% Sciences Humaines 3% Sciences fondamentales 5% Répartition des domaines sur le littoral Agroalimentaire 1% Architecture 1% Arts et métiers 0% Autre 14% Droit 3% Gestion,commerce administration 4% Gestion,économie finance 13% Informatique 4% Ingénierie 19% Langues 17% Médecine Pharmacie 2% Physique Informatique 5% Santé et services sociaux 7% Sciences Humaines 3% Sciences fondamentales 7% Répartition des domaines hors littoral
  42. 42. 41 A7 - Répartition des domaines selon le milieu social Agroalimentaire 2% Architecture 1% Arts et métiers 1% Autre 9% Droit 3% Gestion, commerce administration 2% Gestion,économie finance 16% Informatique 4% Ingénierie 21% Langues 11% Médecine Pharmacie 7% Physique Informatique 8% Santé et services sociaux 7% Sciences Humaines 2% Sciences fondamentales 6% Répartition des domaines - milieu aisé Agroalimentaire 1% Architecture 0% Arts et métiers 0% Autre 14% Droit 4% Gestion,commerce administration 4% Gestion,économie finance 15% Informatique 4% Ingénierie 20% Langues 16% Médecine Pharmacie 2% Physique Informatique 4% Santé et services sociaux 7% Sciences Humaines 3% Sciences fondamentales 6% Répartition des domaines - milieu défavorisé
  43. 43. 42 A8 - Répartition des domaines en fonction du sexe Agroalimentaire 1% Architecture 1% Arts et métiers 0% Autre 10% Droit 2% Gestion,commerce administration 3% Gestion,économie finance 14% Informatique 5% Ingénierie 28% Langues 9% Médecine Pharmacie 3% Physique nformatique 10% Santé et services sociaux 4% Sciences Humaines 3% Sciences fondamentales 7% Répartition des domaines pour les garçons Agroalimentaire 1% Architecture 0% Arts et métiers 1% Autre 14% Droit 4% Gestion,commerce administration 4% Gestion,économie finance 16% Informatique 3% Ingénierie 15% Langues 18% Médecine Pharmacie 4% Physique Informatique 3% Santé et services sociaux 9% Sciences Humaines 3% Sciences fondamentales 6% Répartition des domaines pour les filles
  44. 44. 43 A9 - Répartition des domaines parmi les littéraires et les matheux Agroalimentaire 0% Architecture 0% Arts et métiers 1% Autre 27% Droit 9% Gestion,commerce administration 3% Gestion,économie finance 4% Informatique 1% Ingénierie 2% Langues 41% Médecine Pharmacie 0% Physique Informatique 0% Santé et services sociaux 3% Sciences Humaines 7% Sciences fondamentales 2% Répartition des domaines pour les littéraires Agroalimentaire 1% Architecture 1% Arts et métiers 0%Autre 4% Droit 0% Gestion,commerce administration 1% Gestion,économie finance 13% Informatique 9% Ingénierie 27% Langues 1% Médecine Pharmacie 6% Physique nformatique 16% Santé et services sociaux 9% Sciences Humaines 0% Sciences fondamentales 12% Répartition des domaines pour les matheux
  45. 45. 44 A10 - Vœu affecté- Le modèle logit multinomial avec interaction (garçons) : les coefficients Ingénierie Sciences humaines Santé Sciences fondamentales Autres Littoral -0,317*** (0,039) -0,155*** (0,054) -0,352*** (0,080) -0,677*** (0,058) -0,162*** (0,051) Lettres -0,239*** (0,088) 3,931*** (0,088) 1,958*** (0,580) 0,725** (0,309) 2,937*** (0,080) Mathématiques 2,704*** (0,053) -0,175 (0,170) 4,694*** (0,485) 4,790*** (0,195) 0,656*** (0,121) Sciences Expérimentales 2,509*** (0,060) 0,516*** (0,164) 6,453*** (0,479) 5,026*** (0,200) 1,575*** (0,111) Techniques 4,148*** (0,078) 0,345*** (0,250) 4,683*** (0,505) 4,782*** (0,209) 2,017*** (0,130) fg -0,077** (0,039) -1,265*** (0,078) 1,068*** (0,262) 1,136*** (0,108) -0,705*** (0,072) Lettres*fg -0,166* (0,087) 0,402*** (0,090) -0,157 (0,305) -0,263* (0,162) 0,082 (0,086) Mathématiques *fg 0,747*** (0,058) 0,780*** (0,180) 0,904*** (0,274) -0,762*** (0,121) -0,115 (0,128) Sciences Exp. *fg 0,891*** (0,076) 1,096*** (0,189) 0,806*** (0,273) -0,776*** (0,132) 0,405*** (0,129) Techniques *fg 0,917*** (0,119) 0,087 (0,276) 0,496* (0,292) -0,397 (0,150) -0,286* (0,151) Groupe Aisé -0,313*** (0,043) 0,115 (0,063) -0,901*** (0,087) -0,782*** (0,064) -0,135** (0,058) Groupe Libre -0,705*** (0,084) -0,340*** (0,149) -1,086*** (0,154) -1,224*** (0,141) -0,345*** (0,122) A11 - Vœu affecté- Le modèle logit multinomial avec interaction (filles) : les coefficients Ingénierie Sciences humaines Santé Sciences fondamentales Autres Littoral -0,253*** (0,031) -0,055*** (0,033) -0,352*** (0,056) -0,413*** (0,046) -0,204*** (0,035) Lettres -0,292*** (0,055) 3,332*** (0,048) 0,785*** (0,201) 0,915*** (0,330) 2,762*** (0,054) Mathématiques 2,317*** (0,045) -0,187* (0,101) 2,897*** (0,174) 5,638*** (0,250) 0,994*** (0,086) Sciences Expérimentales 2,266*** (0,045) 0,528*** (0,075) 4,342*** (0,154) 5,994*** (0,249) 1,721*** (0,069) Techniques 3,602*** (0,101) 0,139*** (0,271) 3,134*** (0,096) 5,736*** (0,277) 2,759*** (0,138) fg -0,064*** (0,028) -0,784*** (0,046) 0,550*** (0,096) 0,962*** (0,115) -0,661*** (0,052) Lettres*fg -0,267*** (0,053) 0,239*** (0,051) 0,253** (0,114) -0,161 (0,148) 0,098* (0,058) Mathématiques *fg 0,690*** (0,048) 0,663*** (0,115) 1,607*** (0,120) -0,634*** (0,126) 0,129 (0,095)
  46. 46. 45 Sciences Exp. *fg 1,001*** (0,051) 1,276*** (0,089) 1,730*** (0,110) -0,431*** (0,126) 0,775*** (0,080) Techniques *fg 1,752*** (0,129) 0,281 (0,344) 0,979*** (0,198) -0,404** (0,195) 0,101 (0,175) Groupe Aisé -0,239*** (0,036) 0,306*** (0,041) -0,645*** (0,062) -0,404*** (0,052) 0,016 (0,043) Groupe Libre -0,470*** (0,071) -0,037 (0,087) -0,950*** (0,119) -0,711*** (0,110) -0,177** (0,089) A12 - Vœu affecté- Le modèle logit multinomial sans interaction (garçons) : les effets marginaux Ingénierie Sciences sociales Sciences humaines Santé Sciences fondamentales Autre Littoral -0,038** (0,008) 0,056*** (0,007) 0,004* (0,002) -0,001 (0,001) -0,030*** (0,003) 0,008* (0,005) Lettres -0.481*** (0,010) -0,171*** (0,005) 0,314*** (0,014) 0,001 (0,003) -0,017** (0,008) 0,355*** (0,015) Mathématiques 0,222*** (0,019) -0,310*** (0,005) -0,078*** (0,003) 0,072*** (0,016) 0,193*** (0,018) -0,099*** (0,005) Sciences Expérimentales -0,052*** (0,030) -0,286*** (0,006) -0,060*** (0,003) 0,264*** (0,047) 0,212*** (0,026) -0,078*** (0,005) Techniques 0,467*** (0,012) -0,400*** (0,005) -0,071*** (0,003) 0,013*** (0,005) 0,053*** (0,011) -0,062*** (0,005) fg 0,151*** (0,005) -0,026*** (0,004) -0,051*** (0,002) 0,011*** (0,001) 0,009*** (0,002) -0,094*** (0,003) Groupe Aisé -0,040** (0,009) 0,050*** (0,008) 0,019*** (0,003) -0,005*** (0,001) -0,035*** (0,003) 0,010*** (0,005) Groupe Libre -0,105*** (0,018) 0,127*** (0,017) 0,006 (0,008) -0,004*** (0,002) -0,038*** (0,004) 0,013*** (0,012) A13 - Vœu affecté- Le modèle logit multinomial sans interaction (filles) : les effets marginaux Ingénierie Sciences sociales Sciences humaines Santé Sciences fondamentales Autre Littoral -0,027*** (0,005) 0,040*** (0,006) 0,012*** (0,004) -0,002*** (0,001) -0,009*** (0,001) -0,015*** (0,005) Lettres -0,305*** (0,005) -0,327*** (0,005) 0,377*** (0,008) -0,005*** (0,001) 0,006*** (0,004) 0,265*** (0,008) Mathématiques 0,151*** (0,017) -0,327*** (0,005) -0,178*** (0,004) 0,092*** (0,010) 0,345*** (0,029) -0,083*** (0,008) Sciences Expérimentales -0,082*** (0,011) -0,353*** (0,005) -0,164*** (0,005) 0,163*** (0,014) 0,308*** (0,024) -0,036*** (0,008) Techniques 0,301*** (0,022) -0,355*** (0,004) -0,167*** (0,004) 0,021*** (0,006) 0,199*** (0,028) 0,002 (0,013) fg 0,082*** (0,003) 0,038*** (0,003) -0,064*** (0,002) 0,016*** (0,001) 0,005*** (0,001) -0,077*** (0,003) Groupe Aisé -0,044*** (0,006) -0,006 (0,007) 0,061*** (0,006) -0,005*** (0,001) -0,108*** (0,002) 0,006 (0,006) Groupe Libre -0,057*** (0,010) 0,042*** (0,014) 0,038*** (0,013) -0,005*** (0,001) -0,013*** (0,002) -0,004 (0,012)
  47. 47. 46 A14 – Test de l’hypothèse d’indépendance des états non pertinents (I.I.A.) : test d’Hausman-McFadden Dans le premier modèle de choix discret où nous expliquons le choix des différents groupes de domaine d’études, nous avons soupçonné la non-vérification de l’hypothèse I.I.A dans notre cas. Cependant, nous avons utilisé tout de même le logit multinomial et le logit conditionnel. Nous proposons maintenant d’effectuer le test d’Hausman après les régressions pour tester la validité de l’hypothèse I.I.A L’idée du test d’Hausman est d’estimer le modèle en retirant une modalité et de comparer les nouveaux paramètres avec ceux du modèle complet. Si I.I.A. est valide, les paramètres ne changent pas significativement. Si I.I.A. n’est pas valide, les paramètres changent significativement. H0 : l’hypothèse I.I.A. est valide H1 : l’hypothèse I.I.A. n’est pas valide H = (̂ - ̂)’ [Var(̂) – Var(̂)]-1 (̂ - ̂) où ̂ est le vecteur des coefficients estimés dans le modèle dont une modalité a été retirée et ̂ le vecteur de ces coefficients estimés dans le modèle complet. Var(̂) et Var(̂) sont des matrices de variances-covariances estimées. Pour s’assurer l’inversibilité de [Var( ̂ ) – Var(̂)], il faut peut-être restreindre le nombre de composantes des vecteurs ̂ et ̂. Sous H0, la statistique H suit une distribution du χ2 à M degré de liberté (M étant le rang de de [Var(̂) – Var(̂)]). Test d’Hausman pour le modèle logit multinomial (premier vœu) sans interaction pour  pour les garçons : Groupe de domaine omis χ2 Df P-valeur Evidence Ingénierie 359,748 36 0 Contre H0 Sciences sociales -4,4.103 36 1 Pour H0 Sciences humaines 1280,260 27 0 Contre H0 Santé -3,9.103 27 1 Pour H0 Sciences fondamentales -3,5.103 27 1 Pour H0 Autre -5,4.103 27 1 Pour H0 Note : Df est le degré de liberté  pour les filles : Groupe de domaine omis χ2 Df P-valeur Evidence Ingénierie -188,837 36 1 Pour H0 Sciences sociales 410,515 36 0 Contre H0 Sciences humaines 407,039 36 0 Contre H0 Santé 973,412 36 0 Contre H0 Sciences fondamentales -283,353 36 1 Pour H0 Autre -162,832 36 1 Pour H0 Les résultats nous montrent que l’hypothèse I.I.A. n’est pas valide dans notre modèle.
  48. 48. 47 FIN

×