0	
  
Université Paris 1 – Panthéon Sorbonne
Année Scolaire 2014-2015
Projet de Techniques Quantitatives
« Les détermina...
Sommaire :
1. Objet de l’étude…………………………………………………………………………p.1
2. Présentation de la variable d’intérêt……………………………………………………...
  1	
  
1. Objet de l’étude
Selon les observations de l’INSEE1
, le taux de chômage en France s’est stabilisé
autour de 10...
 2	
  
sans emploi à la recherche d’un emploi » (PSERE)3
. Cette distinction exclut du champ de
l’étude des personnes ayan...
 3	
  
2.1.2. Variable « Chômagelt » dans la base de données finale (sans pondération)
Champ : 18.595 PSERE au sens du BIT...
 4	
  
sont des chômeurs de longue durée en puissance. La stabilité du taux de chômage de long
terme suggère toutefois que...
 5	
  
Remarque : la catégorie « Bac+2 » recouvre des formations relativement plus spécialisées que
« Etudes longues ». En...
 6	
  
Nous souhaitions enfin terminer le tableau environnemental en contrôlant de la taille
potentielle du bassin d’emplo...
 7	
  
manquantes s’expliquent par une durée de recherche supérieure à trois mois7
. Nonobstant, la
part de PSERE de longu...
 8	
  
4. Lien entre variable d’intérêt et variables mobilisées
4.1. Présentation du modèle
Les régressions logistiques s’...
 9	
  
On remarque une dichotomie assez nette entre les personnes ayant obtenu au moins un
Baccalauréat et les personnes s...
 10	
  
Une autre question de société importante est celle, comme mentionné en [3.1.2], de
l’emploi des jeunes et des seni...
 11	
  
urbaine comme approximation de la taille du bassin d’emploi est bien une variable de
contrôle : cet aspect-là de l...
 12	
  
variables ayant trait à l’identité de l’individu voit une augmentation de 43% (soit 20 points) de
la performance d...
 13	
  
La propension à chercher dans une gamme large d’emploi est décroissante du niveau
de diplôme quelle que soit la du...
 14	
  
4.3.2. Analyse des résultats du modèle dans la base de donnée finale
Variables Caractéristiques Estimate Std. erro...
 15	
  
constitutives de l’identité de l’individu sont bien, comme nous le pensions, des variables de
contrôle.
5. Conclus...
 16	
  
6. Bibliographie
SENAT – « Quelle efficacité des contrats aidés de la politique de l'emploi ».
<http://www.senat.f...
 17	
  
7. Annexes
7.1. Code SAS
7.1.1. Création de la base de données
libname BD "C:Usersambro_000DesktopBase de données"...
 18	
  
• BEP-CAP :
o CAP, BEP ou équivalents
• BAC regroupe 2 modalités qui sont:
o Baccalauréat général
o Baccalauréat t...
 19	
  
set BD.chomage;
AGEnum= input(AG, BEST.);
run;
7.1.3 Suppression ou recodage des données manquantes
/*Recodage de ...
 20	
  
/* Suppression des gens qui n'ont pas travaillé mais qui ont tout de même
un emploi */
data BD.chomage;
set BD.cho...
 21	
  
if ATRAV="2" then ATRAV2="2";
if ATRAV="3" then ATRAV2="3";
if ATRAV="4" then ATRAV2="4";
if ATRAV="5" then ATRAV2...
 22	
  
proc freq data= chomage;
tables OFFICC*CRE;
run;
proc freq data= chomage;
tables ACTOP*CRE*AAC;
run;
/* bilan: auc...
 23	
  
/* dans ACTEU6 on remarque que les observations manquantes sont d'autres
chômeurs que des personnes faisant parti ...
 24	
  
proc freq data=BD.chomage;
tables ATRAV2 /chisq;
weight EXTRI13;
run;
/* focus sur la variable TUR5 */
proc freq d...
 25	
  
proc freq data=BD.chomage;
tables chomagelt*classe_diplome*CHERC/chisq;
weight EXTRI13;
run;
/* classe_age avec ch...
 26	
  
/* proc means et univariate pour la variable age en sachant chomagelt et
diplome */
proc univariate data=BD.chomag...
 27	
  
class classe_diplome(ref="etudes_longues")TYPMEN5(ref='1') ATRAV2(ref="5")
classe_de(ref='fin_emploi_vo') TUR5(ref...
 28	
  
7.2. Annexes graphiques
7.2.1. Tris croisés
	
  	
   TUR5	
  
chomagelt	
   Comm.	
  rurale	
   <	
  20.000	
  	
 ...
 29	
  
	
  	
   ATRAV2	
  
cl_de	
   a	
  son	
  compte	
   aide-­‐familiale	
   salarié	
  Etat	
   autre	
  salarié	
  ...
Prochain SlideShare
Chargement dans…5
×

Les déterminants du chômage de longue durée

389 vues

Publié le

0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
389
Sur SlideShare
0
Issues des intégrations
0
Intégrations
3
Actions
Partages
0
Téléchargements
12
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Les déterminants du chômage de longue durée

  1. 1.   0   Université Paris 1 – Panthéon Sorbonne Année Scolaire 2014-2015 Projet de Techniques Quantitatives « Les déterminants du chômage de longue durée » Sous la direction de : Mme Julie VALENTIN Et Mme Corinne PERRAUDIN Par : Nicolas CASTEX Ambroise ROBICHON Pierre-Vincent SIMMLER-MICHEL
  2. 2. Sommaire : 1. Objet de l’étude…………………………………………………………………………p.1 2. Présentation de la variable d’intérêt…………………………………………………….p.2 2.1 Représentations graphiques p.2 2.2 Comparaison avec les données de la DARES p.3 3. Statistiques descriptives de la variable mobilisée………………………………………p.4 3.1 Variables ayant trait aux caractéristiques individuelles p.4 3.2 Variables ayant trait au passé en emploi p.6 3.3 Variables ayant trait à la nature de l’emploi recherché p.7 4. Lien entre variables d’intérêt et variables mobilisées…………………………………..p.8 4.1 Présentation du modèle p.8 4.2 Etude du lien entre « Chômagelt » et « classe_diplome » p.8 4.2.1 Lien simple p.8 4.2.2 Contrôle par SEXE et AGE p.9 4.2.3 Modèle restreint : bilan de l’identité individuelle p.10 4.3 Modèle étendu p.12 4.3.1 Introduction des autres facteurs explicatifs p.12 4.3.2 Analyse des résultats du modèle dans la base de donnée finale p.14 5. Conclusions……………………………………………………………………………..p.15 6. Bibliographie……………………………………………………………………………p.16 7. Annexes…………………………………………………………………………………p.17 7.1 Code SAS p.17 7.1.1 Création de la base de données p.17 7.1.2 Changements de modalités de certaines variables p.17 7.1.3 Suppression ou recodage des données manquantes p.19 7.1.4 Identification des données manquantes p.20 7.1.5 Etude des variables avec pondération p.23 7.1.6 Création du modèle p.26 7.2 Annexes graphiques p.28
  3. 3.   1   1. Objet de l’étude Selon les observations de l’INSEE1 , le taux de chômage en France s’est stabilisé autour de 10% de la population active (10,1% au 1er semestre ; 10,2% au second ; 9,7% en France Métropolitaine). L’importance de l’indicateur pour la sphère publique n’est plus à démontrer tant il est objet de débats et batailles souvent biaisées par les convictions partisanes. Force est de constater que ce seul chiffre concentre des réalités sociales, économiques et politiques diverses. Il convient dès lors d’ouvrir cette « boîte noire » afin d’affiner le sens qui lui est donné, selon sa définition et ses seuils, et des problématiques liées. Depuis les années 1960 et les travaux de Friedman et Phelps (citons, par exemple, « The role of monetary Policy », 1968) l’idée d’un taux de chômage naturel de long terme, tout choc conjoncturel mis à part, interroge la nature a priori dommageable du chômage : le taux de chômage traduit, entre autres, un choix de politique économique. Par ailleurs, témoin d’une souplesse du marché du travail il ne devient problématique que lorsque l’identité des populations concernées par le chômage reste constante durant une période de temps « trop » importante. Ainsi, au niveau individuel, un chômage transitoire peut apparaître comme facteur de dynamisme pour l’économie dans son ensemble – réduisant les problèmes de « matching », conduisant à de meilleurs appariements – quand un chômage pérenne, détériorant le capital humain, marginalise peu à peu les individus ou groupes sociaux concernés. L’objet de ce travail sera d’étudier les déterminants d’un chômage de longue durée et, plus précisément, les effets du diplômes sur sa probabilité d’occurrence. A l’heure où près de 40% de la population active au chômage l’est depuis plus d’un an2 , cette question semble d’autant plus pertinente qu’elle s’accompagne d’enjeux sociétaux forts, que ce soit ceux d’une discrimination à l’embauche, d’un manque de qualification de la main d’œuvre, ou, au contraire, d’une surqualification. L’Enquête Emploi de l’INSEE (2012) étant notre principale source, nous adopterons par souci de cohérence les définitions et seuils de l’INSEE – sauf spécification contraire. L’Enquête Emploi a pour objet l’étude des caractéristiques du marché du travail français. Elle s’effectue sur un échantillon aléatoire représentatif renouvelable par sixièmes tous les trimestres. La définition du chômage s’y fait au sens du Bureau International du Travail (BIT) Ainsi, l’ensemble des chômeurs – personnes sans travail disponibles sous quinze jours cherchant activement un emploi – est appelé à différer de l’ensemble des demandeurs d’emploi (personnes inscrites à Pôle Emploi). Nous mobilisons une distinction supplémentaire correspondant à la différence entre les chômeurs dits « involontaires » et les « populations                                                                                                                 1 Indicateurs de conjoncture, INSEE. 2 INSEE, Enquête Emploi 2012.
  4. 4.  2   sans emploi à la recherche d’un emploi » (PSERE)3 . Cette distinction exclut du champ de l’étude des personnes ayant pris des dispositions pour retrouver un emploi dans les trois mois et n’affecte donc pas la structure de la population au chômage de longue durée. En effet, nous appelons « chômeur de longue durée » toute personne au chômage au sens du BIT (PSERE) depuis plus d’un an. Nous ne faisons pas la distinction avec les « chômeurs de très longue durée » (plus de deux ans). Toutefois, nous avons été amenés à retrancher du champ initial de la variable d’intérêt ci-dessous présentée certaines observations dues à des contradictions au sein de l’Enquête Emploi aboutissant à des non observations sur des variables par ailleurs significatives (voir Annexes). Par ailleurs, l’INSEE évalue à 1,3 millions le nombre d’inactifs souhaitant trouver un emploi qui, parce que non comptabilisés dans les chiffres du chômage, créent un voile autour du marché du travail que nous ne pourront prendre en compte ici. Le champ de l’étude sera donc celui des actifs au chômage à la recherche d’un emploi âgés de 15 à 70 ans au moment de l’Enquête Emploi. 2. Présentation de la variable d’intérêt La variable de l’enquête emploi qui sert de base de travail est celle de l’Ancienneté de chômage (« ANCCHOM »). Notons que cette variable caractères présentait autant d’observation que la variable numérique, avec le mérite d’une dichotomie plus fine. Originellement séparée en 8 modalités, nous avons regroupé les quatre premières afin de créer une caractéristique « Chômage de courte durée » (moins d’un an) et une caractéristique « Chômage de longue durée » (plus d’un an). La variable d’intérêt est donc la variable nommée « Chômagelt » qui prend les deux caractéristiques susmentionnées. 2.1. Représentations graphiques 2.1.1. Variable « ANCCHOM » avant et après modification de la base de données Réduction de 21.400 à 18.595 observations dont 73,5% de moins d’un an.                                                                                                                 3 Définition « PSERE », INSEE. 813   3462   2638   3508   2948   1079   1934   2213   0   500   1000   1500   2000   2500   3000   3500   4000   4500   <  1   mois   1  à  3   mois   3  à  6   mois   6  à  12   mois   1  à  1,5   an   1,5  à  2   ans   2  à  3   ans   >  3  ans   Fréq  initiale   Freq  =inale  
  5. 5.  3   2.1.2. Variable « Chômagelt » dans la base de données finale (sans pondération) Champ : 18.595 PSERE au sens du BIT dont 8.174 depuis plus d’un an. 2.2. Comparaison avec les données de la DARES On retrouve les mêmes ordres de grandeur dans les données de la DARES extraites de « Emploi, chômage, population active : bilan de l’année 2012 » (DARES Analyses n°037 p9). Les différences observées proviennent de la modification du champ d’étude retenu4 pour se focaliser sur les populations sans emploi à la recherche d’un emploi (PSERE) ainsi que de l’absence de pondération. Plus encore, la part des chômeurs de longue durée semble stable. Cette stabilité est très importante. En effet, les données que nous observons montrent en statique une durée de chômage au moment de l’enquête. De fait, nous agrégeons sous le chômage de moins d’un an des personnes qui retrouveront effectivement du travail avant un an avec des personnes qui                                                                                                                 4 Justifications en Section 3 56,04%   43,96%   Courte  durée   Longue  Durée  
  6. 6.  4   sont des chômeurs de longue durée en puissance. La stabilité du taux de chômage de long terme suggère toutefois que les personnes observées en chômage de long terme sont une approximation satisfaisante des personnes effectivement au chômage de long terme. Le rapport de l’OCDE « Perspectives de l’emploi 2014 » abonde en ce sens. En outre, il s’alarme des chiffres du chômage de long terme. Notons toutefois que ce dernier est encore nettement supérieur en Allemagne (45%) quoiqu’il ait baissé de 12 points entre 2007 et 2013 et que la part de chômeurs longue durée au Royaume-Uni, pays connu pour prôner une flexibilité de l’emploi, a gagné 12,5 points dans la même période, de 23,7% à 36,3% (p. 285). Ces rapides comparaisons attestent de la qualité des données à disposition. 3. Statistiques descriptives des variables mobilisées Les variables mobilisées s’organisent autour de trois problématiques qui nous semblaient complémentaires. La première problématique est celle des caractéristiques individuelles des PSERE, la deuxième celle de leur passé en emploi, la troisième est celle de la nature de l’emploi recherché. Les statistiques descriptives s’effectuent avec pondération5 . 3.1. Variables ayant trait aux caractéristiques individuelles 3.1.1. DIP11, renommée « classe_diplome » Nous sommes partis du postulat que le niveau de diplôme était la principale variable explicative de la durée du chômage, notamment de long terme. Afin de tester cette hypothèse, nous avions besoin d’une variable à la classification fine mais synthétique. La variable « DIP11 » avait le mérite d’isoler l’effet générationnel de certains diplômes (exemple : DEUG contre BTS) ainsi que des qualifications spécifiques (Paramédical et social). Cependant, nous avons été amenés à la recoder afin de garder une significativité suffisante et plus homogène sur l’ensemble de ses modalités, adoptant une classification plus traditionnelle qui sépare des dynamiques d’études longues plus généralistes, d’études post bac courtes professionnalisant.                                                                                                                 5 EXTRI13 pour toutes les variables à pondérer (AGEnum exclut). 10,45%   8,54%   19,31%   23,75%   37,95%   DIP11  -­  "classe_diplome"   Etudes  longues   BAC+2   BAC  
  7. 7.  5   Remarque : la catégorie « Bac+2 » recouvre des formations relativement plus spécialisées que « Etudes longues ». En outre, la catégorie « Inférieur Brevet des Collèges » inclut les sans diplômes pour rendre compte d’une qualification moindre. 3.1.2. AGEnum L’âge semblait être une seconde variable explicative de la longue durée de la période de chômage, notamment autour de la question de l’emploi des « seniors ». Un recodage de la variable « AGQ » (âge quinquennal) nous donnait en effet une forte surreprésentation des personnes de plus de 55 ans au chômage depuis plus d’un an – et, réciproquement, une forte part des moins de 30 ans l’était depuis moins d’un an. Néanmoins, la nécessité d’intégrer une variable quantitative dans le modèle nous a contraint d’abandonner cette classification, l’âge étant la seule variable qui présentait une continuité des données numériques satisfaisante. Analysis Variable : AGEnum N Mean Lower Quartile Upper Quartile Std Dev Median 18595 36.8200592 25.0000000 47.0000000 12.5984558 36.0000000 A noter que seul un pour cent des personnes au chômage ont atteint l’âge légal de la retraite. 3.1.3. SEXE La variable « SEXE » sert de variable de contrôle d’une éventuelle discrimination homme femme dans les dynamiques de retour à l’emploi. L’échantillon représentatif se compose à 52% d’hommes (soit un poids de 1.240.102) pour 48% de femmes. 3.1.4. TYPMEN5 Il s’agissait ensuite de contrôler de la structure familiale la propension à rester sans emploi pour une longue durée. Cette variable est retenue comme représentative d’incitations du milieu au retour à l’emploi et sert à vérifier si le chômage de long terme tient plus de motivations intrinsèques de l’individu ou des réalités économiques du marché du travail. 3.1.5. TUR5 18,71%   16,52%   15,58%   44,43%   4,77%   TYPMEN5   Personne  seule   Monoparentales   Couples  sans   enfant   Couples  avec   enfant(s)  
  8. 8.  6   Nous souhaitions enfin terminer le tableau environnemental en contrôlant de la taille potentielle du bassin d’emploi. Pour cela nous avons retenu une variable donnant une approximation de celle-ci en la taille de la zone urbaine (TUR5, préférée à TUR15 pour des raisons de lisibilité). 3.2. Variables ayant trait au passé en emploi : 3.2.1. ATRAV, renommée « ATRAV2 » Outre la formation initiale, l’expérience professionnelle semblait également un facteur explicatif de la durée de chômage en ce qu’elle témoigne d’un pan complémentaire du capital humain. Dans un premier temps, la variable ATRAV caractérisait le type d’emploi antérieur. 3.063 observations manquantes s’expliquaient par le fait que l’individu n’avait jamais eu d’emploi régulier. Nous avons donc recodé ATRAV afin d’y rajouter la modalité « n’a jamais travaillé »6 . 3.2.2. CRE, renommée « classe_de » Par ailleurs, il nous semblait pertinent de nous intéresser aux circonstances de la déchéance de l’emploi. Pour des raisons statistiques nous avons été amenés à regrouper certaines catégories marginales (formation initiale, retraite), tout en gardant les logiques à l’œuvre (regroupement des modalités « quitté ou perdu… »). Certaines observations                                                                                                                 6 Description exhaustive des observations manquantes dans le script SAS en Annexe [7.1.3]. 17,20%   15,42%   21,89%   29,47%   16,02%   TUR5   Commune  rurale   <  20.000  habitants   20.000  à  200.000   habitants   <  200.000   habitants   Agglomération   parisienne   2,55%   0,21%   7,89%   5,83%   67,68%   15,84%   ATRAV  -­  "ATRAV2"   A  son  compte   Aide-­‐familial   Salarié  de   l'Etat   Autre  salarié   Salarié  d'une   entreprise   Jamais   travaillé  
  9. 9.  7   manquantes s’expliquent par une durée de recherche supérieure à trois mois7 . Nonobstant, la part de PSERE de longue durée dans la variable reste cohérente avec l’ensemble de l’étude. 3.3. Variables ayant trait à la nature de l’emploi recherché 3.3.1. CHERC Les critères de recherche d’emploi forment enfin le dernier volet de nos variables explicatives. En effet, plus un individu circoncit ses recherches à un type de contrat ou un domaine d’activité spécifique, plus il semble probable qu’il mette du temps à trouver un emploi correspondant. La variable CHERC correspond à ce second questionnement en s’intéressant à l’amplitude du type d’emploi recherché. Les observations manquantes de CHERC sont à l’origine du recodage de ANCCHOM (variable d’intérêt initiale) sous condition d’appartenir aux populations sans emploi à la recherche d’un emploi dans les chômeurs au sens du BIT – les observations manquantes étant toutes expliquées par la non appartenance à la catégorie PSERE. 3.3.2. ROCC, renommée « ROCC2 » Enfin, la variable ROCC permet de contrôler de la nature du contrat recherché (CDI/CDD, etc.) afin de témoigner de la flexibilité de l’offre de travail de l’actif au chômage. La confrontation avec la variable STCHE permet de recoder ROCC en intégrant 331 personnes appartenant à des observations manquantes qui souhaitent travailler à leur compte au sein d’une nouvelle modalité ad hoc.                                                                                                                 7 Ce critère était nécessaire pour que la question associée à la variable CRE soit posée. 20,75%   11,54%   23,73%   43,98%   CRE  -­  "classe_de"   Autre   Fin  emploi   volontaire   (Auto)Licencieme nt   Quitte  ou  perd   emploi   43,08%   21,09%   35,83%   CHERC   Profession   précise   Plusieurs   professions   Gamme  large   d'emploi  
  10. 10.  8   4. Lien entre variable d’intérêt et variables mobilisées 4.1. Présentation du modèle Les régressions logistiques s’appuieront sur le modèle Logit qui s’articule autour de la probabilité d’occurrence d’une variable binaire suivant une loi de Bernouilli de paramètre pi. Ici, il s’agit de la probabilité de se retrouver au chômage de longue durée. € logit(pi) = ln( pi 1− pi ) = βXi ou € pi = eβXi 1+ eβXi , Avec € β vecteur ligne des coefficients du modèle et € Xi vecteur colonne de l’ensemble des réponses de l’individu i. En outre, le coefficient de la modalité de référence de chaque variable explicative est nul. Nous préciserons les modalités de référence au fur et à mesure. Le modèle Logit présente un double avantage : il permet d’analyser une variable qualitative et donne l’odd ratio (rapport des chances relatives) des modalités étudiées. 4.2. Etude du lien entre « Chomagelt » et « classe_diplome » 4.2.1. Lien simple Dans un premier temps nous nous focalisons sur la variable « classe_diplome ». Nous garderons, et ce dans toutes les tables croisées, les pourcentages en colonnes afin de rendre compte de la surreprésentation ou de la sous représentation des PSERE de longue durée parmi les personnes de la modalité étudiée. Autrement dit, si les personnes de la modalité étudiée ont respectivement plus ou moins tendance à se retrouver au chômage de long terme. Tri croisé du chômage de long terme en fonction du diplôme le plus élevé obtenu classe_diplome chomagelt etudes_longues bac+2 bac bep_cap inf_bdc total Moins_1an 64,83% 69,72% 66,08% 55,54% 48,23% 56,98% Plus_1an 35,17% 30,28% 33,92% 44,46% 51,77% 43,02% total 249133,1 203550,8 460434 566217 904843 2384177,9 freq margi 10,45% 8,54% 19,31% 23,75% 37,95% 100,00% Lecture : Parmi les individus ayant un BAC+2, 30,28% sont au chômage depuis plus d’un an. 16,92%   75,59%   3,41%   2,34%   1,73%   ROCC  -­  "ROCC2"   CDI   CDD   Permanent  à   défaut   Durée  limitée   A  son  compte  
  11. 11.  9   On remarque une dichotomie assez nette entre les personnes ayant obtenu au moins un Baccalauréat et les personnes sans : ces dernières ont une propension plus forte à se retrouver au chômage de long terme – les chômeurs de long terme sont en effet surreprésentés parmi les PSERE ayant obtenu un BEP, CAP, ou tout diplôme inférieur au Brevet des Collèges. Cependant on observe que le lien n’est pas linéaire du nombre d’années d’études minimales nécessaires pour obtenir le diplôme le plus élevé. En effet, toutes choses égales par ailleurs, parmi les titulaires d’un Bac+2 (BTS, DUT...) au chômage seuls 30,28% le sont depuis plus d’un an contre 35,17% des titulaires d’au moins un Licence (étudiants d’Ecoles compris). Nous affinerons ce commentaire au fil des contrôles. MODELE LOGIT AVEC « CLASSE_DIPLOME » POUR SEULE VARIABLE EXPLICATIVE Variables Caractéristiques Estimate Std. error Pr > Khi-2 OR Intercept -0.5391 0.0484 <.0001 • bac -0.1037 0.0603 0.0852 0.901 • bac +2 -0.2995 0.0739 <.0001 0.741 • bep_cap 0.3479 0.0568 <.0001 1.416 Niveau de diplôme (ref: études supérieurs) • inférieur bdc 0.6338 0.0538 <.0001 1.885 Pourcentage concordant 46.0 Pourcentage discordant 28.0 Résultats Pourcentage lié 26.0 Lecture : Les personnes ayant un BEP/CAP ont 1,416 fois plus de risque d’être au chômage de long terme que les personnes ayant poursuivi des études longues quand les titulaires d’un BTS ont eux 25,9% de risque en moins. 4.2.2. Contrôle par SEXE et Âge Un des principaux enjeux sociétaux contemporains est celui de la ségrégation sexuée. Il est donc intéressant de contrôler les résultats précédant à sexe donné.     Controlling  for  SEXE=2  (FEMME)     classe_diplome   chomagelt   etudes_longues   bac+2   bac   bep_cap   inf_bdc   Total   43449,2   29371,1   85312   114279   207944   480355,3   plus_1an   33,50%   26,88%   33,95%   45,23%   51,84%   41,99%   Total   129688,3   109276,8   251320   252658   401132   1144075,1   freq  margi   11,34%   9,55%   21,97%   22,08%   35,06%   100,00%   On remarque que les femmes ont légèrement moins tendance à se retrouver au chômage de long terme (42% contre 43,97% pour les hommes). Même si les différences par diplômes sont dans l’ensemble très faibles (inférieures à 2 points pour 4 des 5 catégories), on notera une légère tendance à exagérer l’effet du diplôme (favorablement pour les diplômes les plus élevés, les femmes étant relativement un peu plus victimes de chômage de longue durée lorsque leurs qualifications sont moindres).
  12. 12.  10   Une autre question de société importante est celle, comme mentionné en [3.1.2], de l’emploi des jeunes et des seniors. Ici, on remarque tout d’abord que si les jeunes ont moins tendance à ne pas rester au chômage pour une longue durée, les individus s’approchant de l’âge légal de la retraite restent à la recherche d’un emploi beaucoup plus longtemps. On voit assez nettement que l’effet de l’âge sur la probabilité de se trouver en chômage de longue durée n’est pas linéaire. On s’attend d’ailleurs à ce qu’il soit atténué, de par la nature quantitative de la variable. 4.2.3. Modèle restreint : bilan de l’identité individuelle Nous appliquons les mêmes raisonnements aux autres variables tenant à l’identité du chômeur, aussi nous nous permettons de renvoyer aux tables correspondantes disponibles en annexes. Nous remarquons que les personnes en couple (avec enfant ou non) ont moins tendance à être au chômage de long terme (environ 39%). La présence d’un enfant ne semble pas jouer de rôle par ailleurs (48,4% pour une personne seule contre 48,96% pour une famille monoparentale)8 . Le conjoint peut ainsi être vu comme un facteur incitatif ou encore comme une source de réseau social complémentaire qui accroit la probabilité de retrouver un emploi dans de plus brefs délais9 . Cette deuxième hypothèse semble d’ailleurs plus robuste – la prise en charge d’un enfant représentant une contrainte économique incitative à la recherche active et intense d’un emploi, sans pouvoir fournir de relationnel supplémentaire. Par ailleurs, la taille de la zone urbaine ne semble pas jouer de rôle significatif. L’intuition consistant à voir dans une agglomération plus importante des possibilités plus grandes de trouver un emploi correspondant aux critères de recherche du chômeur semble empiriquement peu vérifiée ou, plus précisément, d’autres facteurs viennent-ils neutraliser ses effets. La taille de la zone                                                                                                                 8 Voir Annexe [7.2.1.] (p.28) pour des données plus détaillées. 9  Sur  la  force  des  liens  faibles,  voir  Granovetter,  Sociologie  économique,  1973.  
  13. 13.  11   urbaine comme approximation de la taille du bassin d’emploi est bien une variable de contrôle : cet aspect-là de l’identité de l’individu compte donc moins que son niveau de qualification, laissant à penser que le problème du chômage de long terme s’adresse bien au niveau national – et non urbain. Ceci nous permet d’aboutir à un premier modèle restreint, tentant d’expliquer l’occurrence du chômage de plus d’un an par les seules caractéristiques ayant trait à l’identité du demandeur d’emploi. MODELE RESTREINT AUX VARIABLES CARACTERISANT L’IDENTITE INDIVIDUELLE Variables Caractéristiques Estimate Std. error Pr > Khi-2 OR Intercept -2.0269 0.0921 <.0001 • bac -0.0140 0.0623 0.8227 0.986 • bac +2 -0.2804 0.0759 0.0002 0.755 • bep_cap 0.3246 0.0595 <.0001 1.384 Niveau diplôme (ref: études longues) • inf_bdc 0.5900 0.0562 <.0001 1.804 moins de 20 000 habitants 0.0752 0.0536 0.1601 1.078 20 000 à moins de 200 000 habitants 0.2571 0.0492 <.0001 1.293 200 000 habitants ou plus 0.1973 0.0476 <.0001 1.218 Taille urbaine (ref : commune rural) Paris 0.2614 0.0544 <.0001 1.299 Familles monoparentales 0.2861 0.0539 <.0001 1.331 Couples sans enfant -0.3181 0.0554 <.0001 0.728 Couples avec enfant(s) -0.0757 0.0450 0.0928 0.927 Type ménage (ref : une seule personne) Ménages complexes de > 1 personne 0.1157 0.0793 0.1447 1.123 Age Numérique 0.0377 0.00131 1.038 Sexe (ref : homme) femme -0.1007 0.0314 0.0013 0.904 Pourcentage concordant 66.0% Pourcentage discordant 33.6% Résultats Pourcentage lié 0.4% On remarque que peu de modalités ne sont pas significativement différentes de la modalité de référence au seuil de 10%. Les résultats sont en concordance avec les conclusions tirées de l’analyse bivariée effectuée tout au long de cette section. Deux résultats supplémentaires semblent se greffer : toute chose égale par ailleurs, avoir un enfant semble dans le modèle avoir une influence sur les Odd Ratios, augmentant la probabilité de rester au chômage de long terme (couple ou famille monoparentale), ce qui est d’autant plus problématique que Michel Duée a mis en évidence des liens entre chômage de longue durée des parents et échec scolaire10 . Par ailleurs, l’appartenance à une agglomération (> 15.000 habitants) semble avoir un effet négatif sur la probabilité de retour à l’emploi, contrairement à l’hypothèse de départ d’effet positif de la taille du bassin d’emploi11 . Enfin, le pourcentage concordant des cinq                                                                                                                 10 M. Duée, « Chômage parental de longue durée et échec scolaire », Données sociales : La société française, 2006 (p.157 et sqq). 11 Expliquer précisément cet effet nous dévierait de l’objectif principal de cette étude, aussi le laissons-nous comme ouverture possible dans une optique d’affinement du modèle.
  14. 14.  12   variables ayant trait à l’identité de l’individu voit une augmentation de 43% (soit 20 points) de la performance du modèle restreint au diplôme, notamment dû au démêlement d’effets liés. 4.3. Modèle étendu 4.3.1. Introduction des autres facteurs explicatifs Il s’agit maintenant d’affiner cette première analyse en introduisant des variables liées au passé en emploi de l’individu ainsi qu’à la nature de l’emploi qu’il recherche. En effet, on peut penser que l’individu se trouve sur un « chemin d’emploi » duquel il est relativement dépendant : le diplôme en est la source, les premiers emplois la continuation. L’analyse de la variable ATRAV, posant la question de la nature de l’emploi antérieur, permet de tracer quelques grandes lignes, quoique les différences entre catégories n’excèdent pas les 5 points (hormis les aides familiaux, personnes participant aux travaux d’une entreprise familiale sans être ni indépendants ni salariés12 , dont la part au chômage de long terme s’élève à 70%). Quoique légères, le sens de ces différences semble néanmoins assez logique : les salariés d’entreprises jouissant d’une protection de l’emploi moindre, leurs compétences ne sont pas a priori mises directement en question par la perte d’emploi – des politiques d’entreprises les expliquent largement. Les personnes ayant travaillé à leur compte retrouve moins vite un emploi, que ce soit une nouvelle opportunité personnelle ou un emploi salarié (44,94%). On remarque que les PSERE depuis plus d’un an sont surreprésentés parmi les salariés de l’Etat ainsi que les personnes n’ayant jamais travaillé (46%). Pour ces derniers on comprend aisément que le manque d’expérience professionnelle joue en leur défaveur à l’heure de chercher un emploi. Quant aux salariés de l’Etat, jouissant d’un statut de l’emploi très protégé leur déchéance pose la question du motif. Le croisement avec la raison de déchéance de l’emploi (« classe_de ») n’apporte toutefois pas d’éléments de réponse satisfaisants quant à l’explication d’une durée accrue de chômage13 . Plus que la nature de l’emploi antérieur, c’est bien le motif de déchéance de l’emploi qui semble apporter des éléments de réponse expliquant la différence de durée, et tout particulièrement la différence entre les individus ayant quitté ou perdu leur emploi (38,57% sont des PSERE de longue durée) et les individus ayant été licenciés, quel que soit le motif et la nature de leur emploi (52,53%). Aussi, quoique présent, l’effet de dépendance au « chemin d’emploi » semble un facteur explicatif moindre. Enfin, nous introduisons les variables ayant trait à la nature de l’emploi recherché. La première variable nous permet de contrôler de la spécificité de la recherche en terme de profession (CHERC). Nous croisons ensuite cette spécificité de recherche avec le niveau de diplôme, le tout sous contrôle d’un chômage de longue durée.                                                                                                                 12  INSEE,  Définitions.   13  Voir  Tables  en  Annexe  [7.2.1]  (p.29)  
  15. 15.  13   La propension à chercher dans une gamme large d’emploi est décroissante du niveau de diplôme quelle que soit la durée de chômage. Cette structure tend à se modifier légèrement en chômage de long terme. En effet, si les personnes titulaires de diplômes requérant de nombreuses années d’études restent très spécifiques dans leur recherche, les titulaires d’un diplôme de niveau BAC+2 professionnalisant tendent à se reconvertir plus aisément. La tendance générale étant de chercher dans une gamme plus large à mesure que la durée s’allonge. Ceci pose une question de sens de causalité : est-ce réellement parce que les personnes cherchent dans une large gamme d’emploi qu’ils restent plus au chômage – auquel cas ce serait vraisemblablement des variables cachées dans le toutes choses égales par ailleurs ayant trait aux caractéristiques autres des agents recherchant dans une vaste gamme d’emplois qui expliqueraient cela – ou est-ce plutôt parce que la période de chômage s’accroît que l’individu devient moins exigeant quant à la profession qu’il souhaite exercer pour retrouver un emploi ? Le modèle ainsi écrit ne nous permet pas de répondre de façon certaine à cette question, quoique l’on puisse penser que la seconde solution semble plus crédible. Enfin, la variable ROCC2 introduit le type de contrat recherché. Sans surprise les PSERE acceptant des contrats à durée limitée trouvent rapidement un emploi (seuls 15,53% sont au chômage de long terme). Les PSERE de longue durée sont légèrement surreprésentés parmi les personnes souhaitant travailler à leur compte (44,5%), chiffre en cohérence avec celui des personnes ayant déjà travaillé à leur compte (modalité de ATRAV2 : 44,94%). S’il en va de même pour les personnes cherchant un CDD uniquement (44,72%), la fréquence marginale associée à cette catégorie seule (75,6% des PSERE dans leur ensemble) est trop importante pour qu’elle soit homogène et donc interprétable. Notons, par ailleurs, que dans l’ensemble de la population le type de contrat le plus répandu est le CDI (76,8%). Il est donc intéressant de noter la différence entre les deux, attestant de la prise en compte par les agents d’une nécessaire flexibilité de leur offre d’emploi pour retrouver un emploi dans les plus brefs délais. Nous pouvons maintenant généraliser le modèle aux trois catégories de variables. Controlling for Chomagelt=1 CHERC CHERC classe_dipl. 1 2 3 total classe_dipl. 1 2 3 total Et. Lg 52,44% 26,55% 21,01% 249133,70 Et. Lg 48,10% 29,36% 22,54% 87622,20 Bac+2 52,20% 20,57% 27,22% 203550 Bac+2 45,10% 20,43% 34,47% 61628,8 Bac 43,72% 21,22% 35,06% 460423,9 Bac 41,88% 22,76% 35,36% 156171,7 BEP/CAP 44,90% 20,07% 35,03% 566216 BEP/CAP 41,84% 20,65% 37,51% 251752,7 Inf BDC 37,00% 20,27% 42,74% 904843 Inf BDC 33,74% 20,52% 45,74% 468468,7 Total 1027217 502738,8 854210,8 2384166,60 Total 398738,3 221999,6 404906,2 1025644,10 freq margi 43,08% 21,09% 35,83% freq margi 38,88% 21,64% 39,48%
  16. 16.  14   4.3.2. Analyse des résultats du modèle dans la base de donnée finale Variables Caractéristiques Estimate Std. error Pr > Khi-2 OR Intercept -2.4115 0.1117 <.0001 • bac -0.0370 0.0636 0.5609 0.964 • bac +2 -0.3036 0.0773 <.0001 0.738 • bep_cap 0.3348 0.0610 <.0001 1.398 Niveau diplôme (ref: études supérieur) • inf_bdc 0.5377 0.0579 <.0001 1.712 A son compte -0.2707 0.1027 0.0084 0.763 aide-familial 0.7285 0.3467 0.0356 2.072 salarié de l'Etat, des collectivités locales ou des hôpitaux publics 0.2824 0.0598 <.0001 1.326 autre salarié, pour un particulier -0.1374 0.0680 0.0433 0.872 Type d’emploi antérieur (ref : salarié d'une entreprise privée ou publique, d'une association) Jamais travaillé 0.8352 0.0597 <.0001 2.305 Autre -0.0962 0.0683 0.1592 0.908 Licenciement/ autolicenciement 0.1534 0.0573 0.0074 1.166 Déchéance de l’emploi (ref : fin d’emploi) Quitté ou perdu son emploi -0.2743 0.0537 <.0001 0.760 Plusieurs professions 0.1909 0.0424 <.0001 1.210Type de profession recherché (ref : Une profession précise) Dans une gamme large d'emploi 0.3599 0.0363 <.0001 1.433 CDI -0.1484 0.0433 0.0006 0.862 CDD mais à défaut permanent -0.2428 0.0889 0.0063 0.784 Un CDD uniquement -1.3751 0.1393 <.0001 0.253 Type d’emploi recherché (ref : Un emploi permanent, mais à défaut à durée limitée (CDD)) A son compte 0.0620 0.1269 0.6250 1.064 moins de 20 000 habitants 0.0659 0.0546 0.2278 1.068 20 000 à moins de 200 000 habitants 0.2532 0.0503 <.0001 1.288 200 000 habitants ou plus 0.1907 0.0485 <.0001 1.210 Taille urbaine (ref : commune rural) Paris 0.2754 0.0558 <.0001 1.317 Familles monoparentales 0.2006 0.0552 0.0003 1.222 Couples sans enfant -0.3627 0.0569 <.0001 0.696 Couples avec enfant(s) -0.1385 0.0462 0.0027 0.871 Type ménage (ref : une seule personne) Ménages complexes de plus d'une personne 0.0217 0.0810 0.7885 1.022 Age Numérique 0.0459 0.00155 <.0001 1.047 Sexe (ref :homme) femme -0.1050 0.0324 0.0012 0.900 Pourcentage concordant 69.1 Pourcentage discordant 30.6 Résultats Pourcentage lié 0.3 Très peu de modalités ne sont pas significativement différentes au seuil de 10% des modalités de référence ; toutes sont relativement marginales par rapport au cœur du propos. Dans l’ensemble le pourcentage concordant a encore augmenté pour atteindre 69,1%. Par ailleurs, l’utilisation d’un Logit ordonné nous permet de valider définitivement notre hypothèse initiale du diplôme comme principal facteur d’explication de la durée de chômage. Vient ensuite ce que nous appelions le « chemin d’emploi » (type d’emploi antérieur et raisons de déchéance de l’emploi), puis la nature de l’emploi recherché – dont nous avions montré que le sens de causalité n’était pas évident. Enfin, les autres variables
  17. 17.  15   constitutives de l’identité de l’individu sont bien, comme nous le pensions, des variables de contrôle. 5. Conclusion Quoique de plus en plus de chercheurs s’intéresse à elle, la question du chômage de long terme reste peu prise en compte dans les différents modèles (qu’ils soient théoriques ou empiriques). Ce travail se voulait être pour nous une première approche tentant d’en comprendre les déterminants. Nous sommes partis d’un postulat classique de détermination par le niveau de qualification de l’individu, que nous avons décomposé en donnant primauté à la formation initiale (plus haut niveau de diplôme) puis à ce que nous avons appelé le chemin d’emploi (nature de l’emploi précédent et raison de déchéance). Les résultats ont mis en évidence une dichotomie assez forte quant au diplôme, articulée autour du BAC. Rappelons que, le champ d’étude étant les PSERE, la structure sociale des personnes observée est biaisée par rapport à la population active dans son ensemble. Toutefois la plupart des catégories étaient suffisamment bien représentées pour que toutes soient significatives. Ainsi, les différences étaient robustes aux contrôles par les autres éléments d’identité, notamment le sexe et la taille de la ville de la personne sans emploi à la recherche d’un emploi. Une différence légère apparaissait entre les personnes seules et les personnes en couple que nous avons expliquée par des facteurs sociologiques. La robustesse de la distinction de formation initiale était également satisfaisante face à la nature de l’emploi recherchée (profession, type de contrat) quoique l’on ait pu mettre en évidence une légère altération des préférences chez les détenteurs d’un BAC+2 professionnalisant en fonction de la durée de chômage. Le sens de causalité probablement inversé quant à ce dernier jeu de variables (nature de l’emploi recherché) a pu biaiser légèrement le modèle quoiqu’il n’en remette pas en question le sens des résultats. Par ailleurs la variable AGEnum n’est que difficilement interprétable en quantitative et sans doute aurait-il été préférable d’en faire une variable qualitative au regard de la pertinence du modèle – passant d’un statut de variable de contrôle à un statut de variable explicative. En ouverture, il serait sans doute intéressant de pouvoir suivre les populations jusqu’à leur retour en emploi afin de prendre en compte des cycles aboutis de chômage. Quoique de telles données soient disponibles dans l’Enquête Emploi nous ne souhaitions pas les mélanger avec des données statiques mesurées au moment de l’enquête. La question des motivations financières via les indemnités chômages et perspectives de salaires serait également un développement pertinent non permis par les données à disposition.
  18. 18.  16   6. Bibliographie SENAT – « Quelle efficacité des contrats aidés de la politique de l'emploi ». <http://www.senat.fr/rap/r06-255/r06-25543.html> DARES Analyses, « Emploi, Chômage, Population Active: Bilan de l’année 2012 » (n°037, p.9) <http://travail-emploi.gouv.fr/IMG/pdf/2013-037_v2.pdf> INSEE – Indicateurs de conjoncture. <http://www.insee.fr/fr/themes/info-rapide.asp?id=14> INSEE Définitions – Population sans emploi à la recherche d'un emploi / PSERE. <http://www.insee.fr/fr/methodes/default.asp?page=definitions%2Fpop-sans-emp-a- larecherc-emp.htm> Economic and Development Review Committee of the OECD. « OECD Economic Surveys France. » (2013). <http://www.oecd.org/eco/surveys/Overview%20France%202013.pdf> T. A. DiPrete, D. Goux, E. Maurin, M. Tåhlin. « Institutional Determinants of Employment Chances. » European Sociological Review, Vol. 17 No. 3, 233-254. Oxford University Press (2001) <http://esr.oxfordjournals.org/content/17/3/233.full.pdf+html > A. C. D’Addio. « Unemployment Durations of French People: the Impact of Individual, Family and others Factors on the Hazard Rate. » Université Catholique de Louvain. (1998) <http://papers.tinbergen.nl/98069.pdf> « The Jobless Young: Left Behind. » The Economist, Print Edition. (2011). <http://www.economist.com/node/21528614> ICEF Monitor : « France Looks to Education to Help Solve Youth Unemployment Woes. » (2014). <http://monitor.icef.com/2014/02/france-looks-to-education-to-help-solve-youth- unemployment-woes/> M. Duée, « Chômage parental de longue durée et échec scolaire », Données sociales : La société française, 2006 (p.157 et sqq). <http://www.insee.fr/fr/ffc/docs_ffc/donsoc06q.pdf> M. Granovetter, Sociologie économique, University of Chicago Press (1973).
  19. 19.  17   7. Annexes 7.1. Code SAS 7.1.1. Création de la base de données libname BD "C:Usersambro_000DesktopBase de données" ;run; /*Création de la base de données finale avec suppression de toutes les données manquantes dans chaque variables utilisées */ /*Fusion des différentes bases de données en une base de données appelée donnée1 */ proc sort data=BD.BD1; by noi ident trim; run; proc sort data=BD.BD2; by noi ident trim; run; proc sort data=BD.BD3; by noi ident trim; run; data BD.donnee1; merge BD.BD1 BD.BD2 BD.BD3; by noi ident trim; run; /* Création de la base de donnée ne concernant que les chômeurs et création de la variable "chomagelt" qui permet de distinguer les différentes durées de chômage et suppression des non chômeurs */ data BD.chomage; set BD.donnee1 ; select; When ( 1<=ANCCHOM<=4 ) chomagelt="moins_1an" ; When ( 4<ANCCHOM<=8 ) chomagelt="plus_1an" ; Otherwise chomagelt = "other" ; end; run; data BD.chomage; set BD.chomage; if chomagelt = "other" then delete; run; 7.1.2. Changements de modalités de certaines variables /* La variable AGQ a été manipulé pour créer la variable "classes âge" en 4 modalités:[15-29 ans][30-44 ans][45-54 ans]et[55 ans et +]*/ data BD.chomage; set BD.chomage ; select; When ( 15<=AGQ<=25 ) classe_age="15_29" ; When ( 30<=AGQ<=40 ) classe_age="30_44" ; When ( 45<=AGQ<=50 ) classe_age="45_54" ; Otherwise classe_age = "55+" ; end; run; /*La variable diplôme est modifiée pour diminuer le nombre de caractéristiques afin d'optimiser l'analyse et de représenter les principaux diplômes qui sont présents au sein de notre société: • études longues: o regroupement de la modalité 10: licences, maitrise, master, DEA, DESS,Doctorat o et de la modalité 11 : écoles niveau licence et au delà • inférieur au brevet des collèges: o Brevet des collèges o Certificat d'Etudes Primaires o sans diplôme
  20. 20.  18   • BEP-CAP : o CAP, BEP ou équivalents • BAC regroupe 2 modalités qui sont: o Baccalauréat général o Baccalauréat technologique, bac professionnel ou équivalents • BAC+2 : o regroupement de la modalité 30: DEUG o et de la modalité 31 : BTS, DUT o et 33 : paramédical et social bac+2 */ data BD.chomage; set BD.chomage; select; when (10<= DIP11 <= 11) classe_diplome="etudes_longues"; When ( 60<=DIP11<=71) classe_diplome="inf_bdc"; When (41<= DIP11<=42) classe_diplome="bac"; When (DIP11=30) classe_diplome="bac+2"; When (DIP11=31) classe_diplome="bac+2"; When (DIP11=33) classe_diplome="bac+2"; when (DIP=50) classe_diplome= "bep_cap"; Otherwise classe_diplome=" "; end; run; /*La raison de déchéance de l'emploi est recodé afin d'obtenir une variable appelé "classe_de" qui est en 4 modalités à savoir: • Autre:regroupement des classes suivantes, o 1 - A terminé ses études o 2 - A terminé son service national o 3 - A terminé un stage o 11 - A pris sa retraite • "q_p_emploi": signifie quitté ou perdu son emploi, cette modalité regroupe: o 4 - A quitté ou perdu un emploi d'intérim o 5 - A quitté ou perdu un emploi à durée limitée o 6 - A quitté ou perdu un emploi occasionnel • "fin_emploi_vol": fin d'emploi volontaire regroupe 2 modalités qui sont: o 9 - A perdu son emploi : rupture conventionnelle du contrat de travail o 10 - A démissionné • "licenciement_autlicen": est la fusion de 3 modalités initialement présentent dans la variable CRE,elles sont: o 7 - A perdu son emploi : licenciement collectif ou suppression d'emploi o 8 - A perdu son emploi : licenciement individuel o 12 - A cessé son activité */ data BD.chomage; set BD.chomage; select; when (1<= CRE <=3) classe_de="autre"; When ( 4<=CRE<=6) classe_de="q_p_emploi"; When (9<= CRE<=10) classe_de="fin_emploi_vol"; When ( 13<=CRE<=14) classe_de="autre"; When (CRE=11) classe_de="autre"; When ( 7<=CRE<=8) classe_de="licenciement_autlicen"; When (CRE=12) classe_de="licenciement_autlicen"; Otherwise classe_de=" "; end; run; /*Recodage de la variable AG alphanumérique en variable numérique */ data BD.chomage;
  21. 21.  19   set BD.chomage; AGEnum= input(AG, BEST.); run; 7.1.3 Suppression ou recodage des données manquantes /*Recodage de ATRAV CRE & AAC afin de supprimer les données manquantes */ data BD.chomage; set BD.chomage ; if ATRAV=' ' then ATRAV="non_renseigne"; if CRE=' ' then CRE="non_renseigne"; if AAC=' ' then AAC="non_renseigne"; run; /*Création de la variable ATRAV 2 identifiant les personnes n'ayant jamais travaillé qui ont répondu 2 à la variable AAC: avez vous occupé un emploi de façon régulière */ data BD.chomage; set BD.chomage; if ATRAV="n" then ATRAV2="n"; if AAC="2" then ATRAV2="jamais_t"; if ATRAV="1" then ATRAV2="1"; if ATRAV="2" then ATRAV2="2"; if ATRAV="3" then ATRAV2="3"; if ATRAV="4" then ATRAV2="4"; if ATRAV="5" then ATRAV2="5"; run; /*Inclusion d'une recherche d'emploi à son compte dans ROCC + non renseigne*/ data BD.chomage; set BD.chomage; if ROCC=" " then ROCC2="non_renseigne "; if STCHE="2" then ROCC2="asoncompte"; if ROCC="1" then ROCC2="1"; if ROCC="2" then ROCC2="2"; if ROCC="3" then ROCC2="3"; if ROCC="4" then ROCC2="4"; run; /*Suppression de 31 valeurs manquantes de CRE car: Pas d'emploi régulier mais emploi nonobstant; contrôle par RABS (raison de non travail): en transition ou congé (cf. script) ; contrôle des variables pour l'identification de ces observations manquantes */ data BD.chomage; set BD.chomage; if CRE="no" and PASTRA="1" then delete ; run; /*On s'intéresse exclusivement à la population sans emploi à la recherche d'un emploi (PSERE) */ data BD.chomage; set BD.chomage; if ACTEU6="4" then delete; run; /* DREMC(durée de la recherche d'un emploi en 2ème interrogation)> 3 mois, car condition de réponse à CRE. 16000 et quelques personnes sont concernées par cette condition mais répondent pour la première fois */ data BD.chomage; set BD.chomage; if CRE="no" then delete; run;
  22. 22.  20   /* Suppression des gens qui n'ont pas travaillé mais qui ont tout de même un emploi */ data BD.chomage; set BD.chomage; if PASTRA="1" then delete; run; /*Suppression des gens qui sont retraités selon l’enquête (ayant pris ses droits à la retraite mais travaillant peut-être encore) */ data BD.chomage; set BD.chomage; if ATRAV2="n" and RETRAI="1" then delete; run; /* Suppression des données manquante pour ROCC2 car ne répond pas aux questions concernant les chômeurs*/ data BD.chomage; set BD.chomage; if ROCC2='non_renseigne' then delete; run; /* Optimisation de la base de donnée finale pour lancer les proc logit si nécessaire*/ data BD.bd_finale (keep= chomagelt classe_diplome ATRAV2 classe_de CHERC ROCC2 TUR5 TYPMEN5 AGEnum SEXE) ; set BD.chomage; run; 7.1.4. Identification des données manquantes /*tests appliqués en fonction de la logique du questionnaire */ /* ATRAV+CRE+AAC valeurs manquantes en non réponses --> 99% des personnes ont répondus NON à AAC */ data BD.chomage; set BD.chomage ; if ATRAV=' ' then ATRAV="non_renseigne"; if CRE=' ' then CRE="non_renseigne"; if AAC=' ' then AAC="non_renseigne"; run; /* ATRAV */ /* Identification des données manquantes et étapes d'analyses afin de comprendre d'où viennent les données manquantes de ATRAV 3500 et quelques personnes retrouvées, il manque 39 personnes à identifier */ proc freq data=BD.chomage; tables AAC*CRE*ATRAV/chisq; run; proc freq data=BD.chomage; tables AAC*CRE/chisq; run; proc freq data=BD.chomage; tables AAC*ATRAV/chisq; run; /* Bilan avec recodage et identification des personnes n'ayant jamais eu un emploi régulier (AAC=2) */ data BD.chomage; set BD.chomage; if ATRAV="non_renseigne" then ATRAV2="jamais_t"; if AAC="2" then ATRAV2="jamais_t"; if ATRAV="1" then ATRAV2="1";
  23. 23.  21   if ATRAV="2" then ATRAV2="2"; if ATRAV="3" then ATRAV2="3"; if ATRAV="4" then ATRAV2="4"; if ATRAV="5" then ATRAV2="5"; run; /* CRE */ /* On teste la variable DREMC afin de comprendre pourquoi il y a présence des personnes de plus de 3 mois dans la variable CRE*/ proc univariate data=BD.chomage; var DREMC; run; data chomage; set bd.chomage; select; when( DREMC<90) DREMC2="R_moins_3m"; otherwise DREMC2="R_plus_3m"; end; run; proc freq data=chomage; tables chomagelt*DREMC2*CRE; run; /* 862 personnes non renseignées lors du croisement entre AAC*CRE */ proc freq data=chomage; tables CRE*AAC; run; proc freq data= chomage; tables CRE*ECREC; run; proc freq data= chomage; tables PRES2*CRE*ECREC; run; /* identification des personnes à la recherche d'un emploi de plus de 3 mois qui n'auraient jamais eu d'emplois réguliers croisé avec la raison de déchéance de l'emploi initiale*/ proc freq data= chomage; tables DREMC2*CRE*AAC; run; /* test des autres conditions nécessaire à la création de CRE */ proc freq data= chomage; tables MREC; run; proc freq data= chomage; tables PRES2; run; proc freq data= chomage; tables NTCH; run; data chomage; set chomage; if OFFICC=" " then OFFICC="nn"; run;
  24. 24.  22   proc freq data= chomage; tables OFFICC*CRE; run; proc freq data= chomage; tables ACTOP*CRE*AAC; run; /* bilan: aucun résultat significatif; la seule explication valable aux observations manquantes est: DREMC<90 */ data BD.chomage; set BD.chomage; if CRE="no" then delete; run; /* ROCC */ data chomage; set chomage; if STCHE=" " then STCHE="nn"; if ROCC=" " then ROCC="nn" run; proc freq data= chomage; tables STCHE*ROCC; run; /* recodage pour ROCC car lorsque STCHE=2 ce sont des personnes cherchant un emploi à leurs comptes et nous permet d'expliquer 331 valeurs manquantes qui sont ainsi réintégrés dans la base de donnée */ data BD.chomage; set BD.chomage; if ROCC=" " then ROCC2="non_renseigne "; if STCHE="2" then ROCC2="asoncompte"; if ROCC="1" then ROCC2="1"; if ROCC="2" then ROCC2="2"; if ROCC="3" then ROCC2="3"; if ROCC="4" then ROCC2="4"; run; /* 331 valeurs manquantes provenant de la modalité 2 de STCHE =2 car il doit l'être pour répondre à la question ROCC */ /* focus sur les observations manquantes de CRE */ proc freq data=BD.chomage; tables PASTRA*RABS*CRE; run; data BD.chomage; set BD.chomage; if CRE="non_renseigne" and PASTRA="1" then delete ; run; /*Bilan: suppression de 31 valeurs manquantes de CRE car: pas d'emplois régulier mais emplois nonobstant; contrôle par RABS(raison de non travail): en transition ou congé */ /* CHERC */ proc freq data= chomage; tables ACTEU6*CHERC; run;
  25. 25.  23   /* dans ACTEU6 on remarque que les observations manquantes sont d'autres chômeurs que des personnes faisant parti de la catégorie « Population sans Emploi à la Recherche d'un Emploi » il y a les 235 personnes */ /* les 235 valeurs manquantes détecté dans la variables cherc sont les personnes étant considéré comme autres chômeurs au sens du bit voir tableau de contingence ci-dessous avec ACTEU6 en modalité numéro 4 */ proc freq data= chomage; tables ACTEU6*CHERC*ROCC2; run; /* recodage de la variable ACTEU6 avec suppression de ACTEU6 modalité 4 pour détecter les autres observations manquantes de ROCC */ data chomage; set chomage; if CHERC=" " then CHERC="nn"; run; data chomage; set chomage; if CHERC=" " then CHERC="nn"; run; data BD.chomage; set chomage; if ACTEU6="4" then delete; run; /* contrôle des résultats après recodage de la variable */ proc freq data= chomage; tables ACTEU6PR*CRE*CHERC; run; 7.1.5. Etude des variables avec pondération libname BD "C:Usersambro_000DesktopBase de données" ;run; /* focus sur la variable classe diplome */ proc freq data=BD.chomage; tables chomagelt/chisq; weight EXTRI13; run; /* focus sur la variable classe_de */ proc freq data= BD.chomage; tables classe_de/chisq; weight EXTRI13; run; /*focus sur la variable ROCC */ proc freq data= BD.chomage; tables ROCC2 /chisq; weight EXTRI13; run; /*focus sur la variable CHERC */ proc freq data= BD.chomage; tables CHERC /chisq; weight EXTRI13; run; /*focus sur la variable ATRAV */
  26. 26.  24   proc freq data=BD.chomage; tables ATRAV2 /chisq; weight EXTRI13; run; /* focus sur la variable TUR5 */ proc freq data=BD.chomage; tables TUR5 /chisq; weight EXTRI13; run; /*focus sur la variable TYPMEN5 */ proc freq data=BD.chomage; tables TYPMEN5 /chisq; weight EXTRI13; run; /*focus sur la variable SEXE */ proc freq data=BD.chomage; tables SEXE /chisq; weight EXTRI13; run; /* focus sur la variable AGENUM */ proc means data=BD.CHOMAGE n mean q1 q3 std median; var AGEnum; weight EXTRI13; run; proc univariate data=BD.chomage; var AGEnum; weight EXTRI13; run; proc univariate data=BD.chomage; var AGEnum; class chomagelt; weight EXTRI13; run; proc univariate data=BD.chomage; var AGEnum; class classe_diplome; weight EXTRI13; run; /* ATRAV & classe de */ proc freq data=BD.chomage; tables classe_de*ATRAV2 /chisq; weight EXTRI13; run; proc freq data=BD.chomage; tables chomagelt*classe_de*ATRAV2 /chisq; weight EXTRI13; run; /* Cherc* classe diplome*/ proc freq data=BD.chomage; tables classe_diplome*CHERC/chisq; weight EXTRI13; run;
  27. 27.  25   proc freq data=BD.chomage; tables chomagelt*classe_diplome*CHERC/chisq; weight EXTRI13; run; /* classe_age avec chomage lt */ proc freq data=BD.chomage; tables chomagelt*classe_age /chisq; weight EXTRI13; run; /* test de dépendance khi² entre la variable de chômage de long terme et le niveau de diplôme dans différentes conditions */ /* test de procédure pour la variable SEXE */ proc freq data=BD.chomage; tables SEXE*chomagelt*classe_diplome/chisq; weight EXTRI13; run; /* test de procédure pour la variable age */ proc freq data=BD.chomage; tables classe_age*chomagelt*classe_diplome/chisq; weight EXTRI13; run; /* ATRAV type d'emplois antérieur */ proc freq data=BD.chomage; tables ATRAV*chomagelt*classe_diplome/chisq; weight EXTRI13; run; /*classe déchéance emplois*/ proc freq data=BD.chomage; tables classe_de*chomagelt*classe_diplome/chisq ; weight EXTRI13; run; /* type de profession recherché */ proc freq data=BD.chomage; tables CHERC*chomagelt*classe_diplome/chisq; weight EXTRI13; run; /* type d'emploi recherché */ proc freq data=BD.chomage; tables ROCC*chomagelt*classe_diplome/chisq; weight EXTRI13; run; /* taille zone urbaine */ proc freq data=BD.chomage; tables TUR5*chomagelt*classe_diplome/chisq; weight EXTRI13; run; /* type de ménage en 5 catégorie */ proc freq data=BD.chomage; tables TYPMEN5*chomagelt*classe_diplome/chisq; weight EXTRI13; run;
  28. 28.  26   /* proc means et univariate pour la variable age en sachant chomagelt et diplome */ proc univariate data=BD.chomage; var AGEnum; class chomagelt classe_diplome; weight EXTRI13; run; proc means data=BD.chomage n mean q1 q3 std median; var AGEnum; class chomagelt classe_diplome; weight EXTRI13; run; /* age en numérique TTEST procedure pour chomagelt */ proc ttest data=BD.chomage; var AGEnum; class chomagelt; weight EXTRI13; run; 7.1.6. Création du modèle libname BD "C:Usersambro_000DesktopBase de données" ;run; /*test de modele logit avec age en continu*/ proc logistic data=BD.chomage; class classe_diplome(ref="etudes_longues")TYPMEN5(ref='1') ATRAV2(ref="5") classe_de(ref='fin_emploi_vo') TUR5(ref='1') CHERC(ref='1') ROCC2(ref='2') SEXE (ref='1')/param=ref ; model chomagelt(ref='moins_1an') = classe_diplome ATRAV2 classe_de CHERC ROCC2 TUR5 TYPMEN5 AGEnum SEXE / selection=S ; run; /* test modele logit avec classe diplome */ proc logistic data=BD.chomage; class classe_diplome(ref="etudes_longues")TYPMEN5(ref='1') ATRAV2(ref="5") classe_de(ref='fin_emploi_vo') TUR5(ref='1') CHERC(ref='1') ROCC2(ref='2') SEXE (ref='1')/param=ref ; model chomagelt(ref='moins_1an') = classe_diplome ; run; /* test modele logit avec uniquement classe_de */ proc logistic data=BD.chomage; class classe_diplome(ref="etudes_longues")TYPMEN5(ref='1') ATRAV2(ref="5") classe_de(ref='fin_emploi_vo') TUR5(ref='1') CHERC(ref='1') ROCC2(ref='2') SEXE (ref='1')/param=ref ; model chomagelt(ref='moins_1an') = classe_de / selection=S ; run; /* test modele logit avec uniquement ATRAV */ proc logistic data=BD.chomage; class classe_diplome(ref="etudes_longues")TYPMEN5(ref='1') ATRAV2(ref="5") classe_de(ref='fin_emploi_vo') TUR5(ref='1') CHERC(ref='1') ROCC2(ref='2') SEXE (ref='1')/param=ref ; model chomagelt(ref='moins_1an') = ATRAV2 / selection=S ; run; /* test modele logit avec uniquement CHERC */ proc logistic data=BD.chomage;
  29. 29.  27   class classe_diplome(ref="etudes_longues")TYPMEN5(ref='1') ATRAV2(ref="5") classe_de(ref='fin_emploi_vo') TUR5(ref='1') CHERC(ref='1') ROCC2(ref='2') SEXE (ref='1')/param=ref ; model chomagelt(ref='moins_1an') = CHERC ;run; /* test modele logit avec uniquement ROCC */ proc logistic data=BD.chomage; class classe_diplome(ref="etudes_longues")TYPMEN5(ref='1') ATRAV2(ref="5") classe_de(ref='fin_emploi_vo') TUR5(ref='1') CHERC(ref='1') ROCC2(ref='2') SEXE (ref='1')/param=ref ; model chomagelt(ref='moins_1an') = ROCC2 ; run; /* test modele logit avec uniquement age */ proc logistic data=BD.chomage; class classe_diplome(ref="etudes_longues")TYPMEN5(ref='1') ATRAV2(ref="5") classe_de(ref='fin_emploi_vo') TUR5(ref='1') CHERC(ref='1') ROCC2(ref='2') SEXE (ref='1')/param=ref ; model chomagelt(ref='moins_1an') =AGEnum ; run; /* test modele logit avec uniquement SEXE */ proc logistic data=BD.chomage; class classe_diplome(ref="etudes_longues")TYPMEN5(ref='1') ATRAV2(ref="5") classe_de(ref='fin_emploi_vo') TUR5(ref='1') CHERC(ref='1') ROCC2(ref='2') SEXE (ref='1')/param=ref ; model chomagelt(ref='moins_1an') = SEXE ; run; /* test modele logit avec uniquement zone urbaine*/ proc logistic data=BD.chomage; class classe_diplome(ref="etudes_longues")TYPMEN5(ref='1') ATRAV2(ref="5") classe_de(ref='fin_emploi_vo') TUR5(ref='1') CHERC(ref='1') ROCC2(ref='2') SEXE (ref='1')/param=ref ; model chomagelt(ref='moins_1an') =TUR5 ; run; /* test modele logit avec uniquement la composition du ménage */ proc logistic data=BD.chomage; class classe_diplome(ref="etudes_longues")TYPMEN5(ref='1') ATRAV2(ref="5") classe_de(ref='fin_emploi_vo') TUR5(ref='1') CHERC(ref='1') ROCC2(ref='2') SEXE (ref='1')/param=ref ; model chomagelt(ref='moins_1an') = TYPMEN5 ; run; /* identité Indiv : diplome age sexe TUR5 TYPMEN5 */ proc logistic data=BD.chomage; class classe_diplome(ref="etudes_longues")TYPMEN5(ref='1') ATRAV2(ref="5") classe_de(ref='fin_emploi_vo') TUR5(ref='1') CHERC(ref='1') ROCC2(ref='2') SEXE (ref='1')/param=ref ; model chomagelt(ref='moins_1an') = classe_diplome TUR5 TYPMEN5 AGEnum SEXE / selection=S ; run;  
  30. 30.  28   7.2. Annexes graphiques 7.2.1. Tris croisés     TUR5   chomagelt   Comm.  rurale   <  20.000     20.00  à  200.000     >  200.000     agglo.  parisienne   total   plus_1an   39,84%   40,43%   46,65%   41,96%   45,90%   43,02%   total   410038   367726   521852   702704   381857   2384177   freq  margi   17,20%   15,42%   21,89%   29,47%   16,02%   100,00%       ATRAV2   chomagelt   a  son  compte   aide-­‐familiale   salarié  Etat   autre  salarié   salarié  entrep.   jamais  tr.   total   Plus_1an   44,94%   70,82%   46,39%   42,68%   41,76%   46,16%   43,02%   total   60691,7   5015,1   188209,2   139047,5   1613639   377575   2384177,5   freq  margi   2,55%   0,21%   7,89%   5,83%   67,68%   15,84%   100,00%   classe_de chomagelt Autre fin_emploi_vo licenciement q_p_emploi total plus_1an 42,36% 41,60% 52,53% 38,57% 43,02% total 494747 275147 565713 1048571 2384178 freq margi 20,75% 11,54% 23,73% 43,98% 100,00%     CHERC   chomagelt   prof.   précise   plusieurs   prof.   gamme  large  d’emploi   total   plus_1an   38,82%   44,16%   47,40%   43,02%   total   1027218   502748   854211   2384177   freq  margi   43,08%   21,09%   35,83%   100,00%       ROCC2   chomagelt   CDI   CDD   adefaut_permanent   duree_limitee_u   asoncompte   total   moins_1an   60,01%   55,28%   61,50%   84,47%   55,54%   56,98%   plus_1an   39,99%   44,72%   38,50%   15,53%   44,46%   43,02%   total   403474   1802234   81346,5   55768,21   41355,4   2384178,11   freq  margi   16,92%   75,59%   3,41%   2,34%   1,73%   100,00%       TYPMEN5   chomagelt   Seul   monoparentales   couple  sans  enf.   couple  +  enf(s)   ménages  complexes   total   Moins_1an   51,60%   51,04%   60,94%   60,39%   53,94%   56,98%   Plus_1an   48,40%   48,96%   39,06%   39,61%   46,06%   43,02%   total   446099   393799   371442   1059199   113638,9   2384177,9   freq  margi   18,71%   16,52%   15,58%   44,43%   4,77%   100,00%  
  31. 31.  29       ATRAV2   cl_de   a  son  compte   aide-­‐familiale   salarié  Etat   autre  salarié   sal.  entrep.   jamais  t.   total   Autre  (L.)   1,70%   0,38%   4,68%   3,02%   28,57%   61,65%       Autre  (C.)   13,88%   37,26%   12,31%   10,74%   8,76%   80,78%   20,75%   Fin  vol  (L.)   0,60%   0,20%   4,39%   7,19%   85,61%   2,01%       Fin  vol  (C.)   2,74%   11,05%   6,42%   14,22%   14,60%   1,47%   11,54%   Licenc.  (L.)   7,93%   0,27%   2,17%   7,74%   80,55%   1,34%       Licenc.  (C.)   73,87%   30,91%   6,54%   31,49%   28,24%   2,00%   23,73%   Q/P  (L.)   0,55%   0,10%   13,41%   5,78%   74,49%   5,67%       Q/P  (C.)   9,50%   20,79%   74,73%   43,55%   48,41%   15,75%   43,98%   Total   60691,73   5015,103   188209,2   139047,4   1613639   377575,16   2384177,593   freq  margi.   2,55%   0,21%   7,89%   5,83%   67,68%   15,84%           Controlling  for  Chomagelt=1     ATRAV2   cl_de   a  son  compte   aide-­‐familiale   salarié  Etat   autre  salarié   sal.  entrep.   jamais  t.   total   Autre  (L.)   1,50%   0,81%   4,61%   3,08%   25,73%   64,28%       Autre  (C.)   11,50%   47,71%   11,07%   10,86%   8,00%   77,28%   20,43%   Fin  vol  (L.)   0,66%   0,22%   6,06%   7,81%   83,10%   2,14%       Fin  vol  (C.)   2,77%   7,24%   7,94%   15,07%   14,12%   1,41%   11,16%   Licenc.  (L.)   7,21%   0,35%   2,22%   6,91%   82,01%   1,31%       Licenc.  (C.)   78,52%   29,19%   7,55%   34,59%   36,17%   2,23%   28,97%   Q/P  (L.)   0,49%   0,14%   15,85%   5,79%   69,51%   8,22%       Q/P  (C.)   7,21%   15,87%   73,43%   39,48%   41,72%   19,08%   39,43%   Total   27273,432   3551,658   87312,22   59345,61   673859   174300,72   1025642,64   freq  margi.   2,66%   0,35%   8,51%   5,79%   65,70%   16,99%      

×