SlideShare une entreprise Scribd logo
1  sur  40
Télécharger pour lire hors ligne
 
	
  
UNIVERSITÉ LAVAL
FACULTÉ DES SCIENCES DE L’ADMINISTRATION
ÉCONOMIE URBAINE ET MARCHÉS IMMOBILIERS
GUI-4100/6100
Évolution de la mise en chantier résidentiel depuis 1980 à 2013 dans la
RMR de Québec
Travail de session remis à M. François Des rosiers
Par Florian POIX
florian.poix.1@ulaval.ca
# 111 099 739
Michael LEFEBVRE
michael.lefebvre.1@ulaval.ca
# 903 178 548
Katerine GIRARD
katerine.girard.1@ulaval.ca
# 910 052 569
Automne 2014
Table	
  des	
  matières	
  
Introduction	
  .................................................................................................................................................................	
  2	
  
Méthodologie	
  ...............................................................................................................................................................	
  3	
  
Analyse	
  et	
  interprétation	
  .......................................................................................................................................	
  7	
  
-­‐Analyse	
  de	
  la	
  base	
  de	
  données……………………………………………………………………………….…………………………7	
  
-­‐Tests	
  de	
  normalité………………………………………………………………………………………………………………………....11	
  
-­‐Analyse	
  de	
  corrélation………………………………………………………………….....................................................................13	
  
-­‐Tests	
  de	
  colinéarité…………………………………………………………………………………………………………………..…...16	
  
-­‐Interprétation	
  de	
  la	
  qualité	
  du	
  modèle	
  de	
  régression…………..…………………………………………………………..20	
  
-­‐Interprétation	
  de	
  l'ajustement	
  du	
  modèle	
  de	
  régression…………………………………………………………….……21	
  
-­‐Évaluation	
  et	
  interprétation	
  des	
  paramètres	
  du	
  modèle………………………………………………………………….23	
  
Conclusion	
  et	
  Interpretation	
  globale	
  .............................................................................................................	
  27	
  
Bibliographie	
  ..............................................................................................................................................................	
  28	
  
ANNEXE	
  1	
  :	
  Carte	
  de	
  la	
  RMR	
  de	
  Québec	
  .......................................................................................................	
  30	
  
ANNEXE	
  2	
  :	
  Base	
  de	
  données	
  .............................................................................................................................	
  31	
  
ANNEXE	
  3	
  :	
  Histogramme	
  et	
  nuage	
  de	
  points	
  du	
  modèle	
  de	
  régression	
  ........................................	
  33	
  
ANNEXE	
  4	
  :	
  Histogrammes	
  et	
  Normogrammes	
  Q-­‐Q	
  du	
  test	
  de	
  normalité	
  .....................................	
  34	
  
ANNEXE	
  5	
  :	
  Test	
  de	
  normalité	
  sur	
  les	
  variables	
  retenues	
  ....................................................................	
  39	
  
	
  
Table	
  des	
  figures	
  
Figure	
  1	
  :	
  Mise	
  en	
  chantier	
  et	
  variables	
  connexes	
  .......................................................................................	
  7	
  
Figure	
  2:	
  relations	
  entre	
  les	
  données	
  économiques	
  ...................................................................................	
  8	
  
Figure	
  3	
  :	
  évolution	
  des	
  facteurs	
  démographiques	
  .....................................................................................	
  9	
  
Figure	
  4	
  :	
  évolution	
  des	
  facteurs	
  économiques	
  ............................................................................................	
  9	
  
Figure	
  5	
  :	
  Évolution	
  des	
  facteurs	
  socioéconomiques	
  ..............................................................................	
  10	
  
Figure	
  6	
  :	
  nuages	
  de	
  dispersion	
  des	
  variables	
  indépendantes	
  retenues	
  ........................................	
  26	
  
	
  
Table	
  des	
  tableaux	
  
Tableau 1 : Liste des données primaires à l'étude	
  .............................................................................................	
  4	
  
Tableau	
  2	
  :	
  test	
  de	
  normalité	
  sur	
  l’ensemble	
  des	
  données	
  à	
  l’étude	
  ................................................	
  11	
  
Tableau	
  3	
  :	
  Test	
  de	
  normalité	
  sur	
  les	
  données	
  transformées	
  ..............................................................	
  12	
  
Tableau	
  4	
  :	
  Analyse	
  de	
  corrélation	
  ..................................................................................................................	
  13	
  
Tableau	
  5	
  :	
  Statistiques	
  de	
  colinéarité	
  ...........................................................................................................	
  16	
  
Tableau	
  6	
  :	
  analyse	
  de	
  régression	
  avec	
  des	
  variables	
  log	
  .....................................................................	
  17	
  
Tableau	
  7	
  :	
  analyse	
  intégrant	
  différentes	
  variables	
  .................................................................................	
  18	
  
Tableau	
  8	
  :	
  analyse	
  intégrant	
  différentes	
  variables	
  .................................................................................	
  18	
  
Tableau	
  9	
  :	
  analyse	
  intégrant	
  d'autres	
  variables	
  ......................................................................................	
  19	
  
Tableau	
  10:	
  Analyse	
  de	
  variances	
  ...................................................................................................................	
  21	
  
Tableau	
  11	
  :	
  Analyse	
  de	
  régression	
  ................................................................................................................	
  21	
  
Tableau	
  12	
  :	
  Coefficients	
  du	
  modèle	
  ...............................................................................................................	
  23	
  
Tableau	
  13	
  :	
  Équation	
  de	
  régression	
  pour	
  prédir	
  une	
  valeur	
  de	
  "y"	
  ................................................	
  25	
  
2	
  
	
  
	
  
Introduction	
  	
  
	
  
La situation économique et démographique du Québec évolue sans cesse. Il en est de même pour
le marché résidentiel. Partout, on remarque un développement relativement constant d’immeubles
à condominiums et à appartements, des maisons individuelles et jumelées qui prennent forme
dans les paysages urbains pour répondre aux besoins d’une population changeante. Après une
période d’effervescence à la fin des années 1970 qui a conduit vers un boom immobilier de 1985
à 1989, la demande dans le marché du logement tend à ralentir, bien que le marché reste encore
très actif. Depuis 2000, le marché du logement maintient une certaine vigueur qui semble vouloir
perdurer. Les faibles taux d’intérêt sont en grandes parties responsables de la prospérité du
marché. Plusieurs recherches démontrent que le marché de la propriété tout comme le marché
locatif représentent des très bons potentiels de développement futur. C’est un secteur actif qui
évolue constamment. À titre d’exemple, on compte 386 mises en chantier résidentiel pour la
période de janvier à mars 2014 sur le territoire de Québec et une prédiction de 4125 pour l’année
2014 contre un total de 6652 pour l’année 2010. (Société canadienne d’hypothèques et de
logement).
Plusieurs études sur le marché résidentiel sont menées régulièrement. Une étude de la FCIQ a
notamment permis de créer un modèle pour mieux comprendre l’impact de ces facteurs sur
l’évolution des prix. En parallèle, on peut se poser la question, à savoir quels sont les facteurs qui
influencent cette fois la mise en chantier ? Le marché du logement et les constructions de
logements neufs sont des facteurs importants de l’économie nationale et régionale c’est pourquoi
il sera question de tenter de mesurer les impacts de différentes variables sur ce phénomène.
Le thème de la recherche portera sur l’évolution de la mise en chantier résidentiel dans la région
métropolitaine de Québec depuis 1980 à 2013. Pour tenter de mesurer ce phénomène, plusieurs
données de type économique, socio-économique et démographique seront analysées.
3	
  
	
  
L’outil d’analyse utilisée sera l’analyse de régression, qui permettra de comprendre comment
évolue la mise en chantier résidentiel depuis 1980 jusqu'à 2013. En d’autres termes, l’analyse de
régression servira d’outils de mesure pour mieux connaître l’influence des facteurs externes sur le
nombre de mise en chantier résidentiel. Notre variable dépendante, à savoir la mise en chantier
résidentiel, sera mise en relation avec les variables issues des données économiques, socio-
économiques et démographiques qui seront abordées dans la prochaine section. Il s’agira de faire
corréler les variables les plus importantes pour évaluer leur degré de signification grâce au
coefficient (R²) et ainsi pouvoir mieux comprendre quelles sont les variables qui influencent de
façon significative la variable dépendante. Un modèle essentiellement empirique sera élaboré afin
de mieux comprendre le phénomène. Le contenu du travail comprendra d’une part la
méthodologie, l’analyse détaillée des variables grâce à des graphiques inter reliés, des figures et
des tableaux, l’interprétation des résultats obtenus et finalement, la conclusion du travail et la
partie bibliographique.
Méthodologie	
  	
  
	
  
Pour effectuer ce travail, il fut question tout d’abord de rechercher des données sur différentes
variables. Des données ont été compilées à partir du coeur du sujet, donc sur le nombre de mise
en chantier des maisons individuelles et des jumelés ainsi que la mise en chantier des
appartements dans la RMR de Québec. Ces informations ont été compilées sous la forme d’une
seule variable, sois la mise en chantier globale. D’autres données ont été récoltées tel que les taux
hypothécaires réels sur 5 ans, les données sur les prix moyens du logement, l’indice du prix du
neuf, la quantité d’unités écoulées sur le marché et les taux d’inoccupation.
Un certain nombre de variables socio-économiques ont également été compilées, telles que la
population active chez les femmes, la population active totale, les revenus moyens par ménages et
la taille des ménages. La taille des ménages fut regroupée en deux variables, sois les ménages de
1 et 2 personnes et les ménages de 3 personnes et plus. D’autres données de types
démographiques ont été compilées, telles que le taux de natalité, la population totale
d’immigrants et les différentes tranches d’âges de la population. Les recherches se sont
concentrées sur la tranche d’âge de 15 à 54 ans. Les deux tranches d’âge de 15 à 34 ans et de 35 à
54 ont été regroupées afin de contenir les tranches d’âge de 15 à 54 ans.
Ces données ont été récoltées pour la population de la RMR de Québec de 1980 à 2013 tel que
mentionné plus haut. Les données sur la population de 15 à 54 ans, la taille des ménages, la
population active chez les femmes et la population active totale proviennent du recensement de
4	
  
	
  
Statistique Canada. Les données sur l’immigration, le revenu moyen par ménages, la population
active, le taux hypothécaire, le taux d’inoccupation et l’indice des prix du neuf proviennent de la
banque de données CANSIM. Les données sur le loyer moyen proviennent de la société
canadienne d’hypothèque et du logement. Le nombre d’unités écoulées proviennent des données
de la Société canadienne de l’hypothèque et de logement. Bien qu’elle ait été compilée, cette
dernière variable n’a pas été utilisée dans le modèle, car une sélection des variables fut nécessaire
afin de ne pas surcharger l’analyse.
Pour la majorité des variables, les données les plus récentes dataient de 2011. Des procédures
d’extrapolation et d’interpolation ont été effectuées pour aller chercher les données manquantes
pour 2012 et 2013, mais aussi pour certaines données manquantes jusqu’en 1980. Pour les
variables disponibles aux 5 ans dans les recensements et celles tout simplement absentes pour
certaines années, une série d’interpolation a été effectuée.
Au départ, une quinzaine de variables ont été récoltées. Avant d’entamer le processus d’analyse,
celles-ci ont été revues afin d’effectuer une présélection. Après consultation, 13 variables
seulement ont été retenues (Tableau 1).
Tableau 1 : Liste des données primaires à l'étude
DONNÉES À L’ÉTUDE SOURCE
Population âgée de 15 à 54 ans Statistique Canada – Recensement
Ménages de 1 à 2 personnes Statistique Canada- Recensement
Ménages de 3 personnes et plus Statistique Canada – Recensement
Immigration Statistique Canada – Cansim
Revenu moyen par ménages Statistique Canada - Cansim
La population active Statistique Canada - Cansim
La population active chez les femmes Statistique Canada - Recensement
La population totale Statistique Canada - Recensement
Le Taux hypothécaire réel Statistique Canada – Cansim
Taux d’inoccupation Statistique Canada - CANSIM
Indice des prix du neuf Statistique Canada - CANSIM
Loyer moyen Société Canadienne d’hypothèque et du logement
5	
  
	
  
Avant l’utilisation de SPSS, 4 graphiques et un histogramme ont été élaborés avec Excel, afin de
pouvoir mieux saisir la relation entre les différentes variables. Cela a notamment permis de faire
la sélection des variables du premier modèle étudié. Une analyse sommaire a été effectuée.
Pour chaque variable, la forme de la distribution a été mesurée pour s’assurer que le modèle de
régression suive une distribution normale. Un test de normalité de Kolmogorov-Smirnov et de
Shapiro-Wilks a été effectué. Toutefois, une attention plus particulière a été accordée au test de
Shapiro-Wilks en raison de sa meilleure fiabilité en général. Une analyse sommaire des
coefficients d’asymétrie et d’aplatissement a également été effectuée grâce aux tableaux générés
par SPSS. Ces tableaux ne figurent toutefois pas dans l’analyse afin de ne pas alourdir le travail.
Sur ces 13 variables, 7 ont révélé une distribution anormale. La variable dépendante, soit la mise
en chantier résidentiel présentait une distribution normale. Pour les variables indépendantes
anormales, une transformation logarithmique a été effectuée à l’aide de la fonction arithmétique
Lg10. Seules 2 variables présentaient alors une distribution normale. Une autre transformation a
donc été faite, mais cette fois, en grossissant nos variables, c’est-à-dire en ajoutant +1 à chaque
transformation de variable. Par la suite, les variables qui présentaient toujours une distribution
anormale ont été mises de côté.
Une analyse de corrélation a également été effectuée en intégrant tous les variables à l’étude. Par
la suite, l’analyse de régression linéaire via la méthode « Enter » ainsi qu’un diagnostic de
colinéarité ont été effectués avec les variables qui présentaient toutes une distribution normale. Il
s’est alors avéré qu’il existait une très forte multi colinéarité entre les variables ce qui venait
fausser le modèle. Après plusieurs tentatives, en retirant des variables en alternance, seules deux
variables présentaient un VIF de 10.00, qui étaient la valeur minimum. Cette valeur n’était pas
satisfaisante. Toutes les variables dites normales présentaient une forte colinéarité. Une
alternative à ce problème fut d’introduire certaines variables à distribution anormale
préalablement rejetées. Ces variables furent introduites au modèle de régression linéaire par
essais et erreur, en alternance, afin de déterminer celles qui présentaient les plus faibles indices de
colinéarité. Les nombreux tests effectués incluaient parfois un mélange de données à distribution
normale et anormale.
Suite à cette série d’analyses et d’épuration, il s’est avéré que seules les variables suivantes
détenaient un VIF dans la mesure de l’acceptable : Le taux hypothécaire moyen, le taux
d’inoccupation, le revenu moyen par ménages et la population âgée de 15 à 54 ans. Les autres
variables ont été rejeté car elles détenaient un VIF supérieur ou égal à 10,00, ou elles
intervenaient de façon à faire augmenter la multi-colinéarité autres variables. L’immigration
6	
  
	
  
présentait parfois un vif acceptable, mais il prenait ensuite une ampleur significative lorsque mis
en relation avec le revenu moyen par ménages. Il fallait donc faire un choix entre les deux
variables. Au final, le choix s’est arrêté sur ces 4 variables indépendantes énumérées ci-haut. Ces
variables ont été conservées dans le modèle de régression.
Plusieurs analyses de régression ont été effectuées en intégrant ces 4 variables. La première
analyse s’est effectuée avec les variables ayant subi une transformation logarithmique de base. La
deuxième s’est effectuée avec les variables ayant subi une transformation logarithmique exagérée
de +1. La troisième analyse comprenait les variables n’ayant pas subi de transformation
logarithmique. C’est cette troisième et dernière analyse qui a été retenue en raison des résultats
obtenus dans le modèle. Les variables avant subies une transformation log + 1 n’ont pas été
retenus, car les résultats générés par la transformation n’étaient pas significatifs.
Finalement, une évaluation de la qualité du modèle de régression par une analyse de variance, une
évaluation de l’ajustement du modèle de régression aux données et une évaluation des paramètres
du modèle a été complétée.
7	
  
	
  
Analyse	
  et	
  interprétation	
  	
  
Analyse	
  de	
  la	
  base	
  de	
  données	
  	
  
Afin de mieux définir les variables indépendantes à utiliser face à la variable dépendante, il fut
question d’analyser préalablement l’interrelation et les tendances des données par le biais de
graphiques en courbes et un histogramme.
La figure 1 présente un graphique qui met en relation les mises en chantier de différents types de
propriétés (individuels, jumelés et appartements) face au loyer moyen, aux unités écoulées et
celles achevées, mais non écoulées sur le marché de la RMR de Québec. Après analyse, il a été
décidé de conserver la variable « mise en chantier » et de revoir celle-ci de façon globale afin
qu’elle comprenne tous les types de propriétés.
Figure	
  1	
  :	
  Mise	
  en	
  chantier	
  et	
  variables	
  connexes	
  
La figure 2 permet de comprendre la relation entre plusieurs données économiques tels les taux
hypothécaires moyens, taux de chômage, taux d’inoccupation et les prix moyens des propriétés
résidentielles. Ces variables ont toutes été approfondies afin d’être utilisées dans l’étude, compte
tenu de leur importance à première vue.
400	
  
450	
  
500	
  
550	
  
600	
  
650	
  
700	
  
750	
  
0	
  
250	
  
500	
  
750	
  
1000	
  
1250	
  
1500	
  
1750	
  
2000	
  
2250	
  
2500	
  
2750	
  
3000	
  
3250	
  
3500	
  
3750	
  
4000	
  
4250	
  
4500	
  
4750	
  
1990	
   1993	
   1996	
   1999	
   2002	
   2005	
   2008	
   2011	
   2014	
  
Mises	
  
	
  en	
  chan?er	
  
Période	
  
Mises en chantier vs. unités achevés mais non écoulés
Achevés	
  mais	
  non	
  écoulés	
   Unités	
  écoulés	
  sur	
  le	
  marché	
  
Mises	
  en	
  chan>er	
  (individuels	
  et	
  jumelés)	
   Mises	
  en	
  chan>er	
  (appartements)	
  
Loyers	
  moyens	
  
8	
  
	
  
Figure	
  2:	
  relations	
  entre	
  les	
  données	
  économiques	
  
L’histogramme de la figure 3 a été élaboré afin de pouvoir visualiser les tendances
démographiques de la RMR de Québec selon différentes tranches d’âge ou spécificités (ex. :
natalité).
0	
  
15000	
  
30000	
  
45000	
  
60000	
  
75000	
  
90000	
  
105000	
  
120000	
  
135000	
  
150000	
  
165000	
  
180000	
  
195000	
  
210000	
  
225000	
  
240000	
  
255000	
  
270000	
  
285000	
  
300000	
  
315000	
  
330000	
  
0.00	
  
1.00	
  
2.00	
  
3.00	
  
4.00	
  
5.00	
  
6.00	
  
7.00	
  
8.00	
  
9.00	
  
10.00	
  
11.00	
  
12.00	
  
13.00	
  
14.00	
  
15.00	
  
1990	
   1993	
   1996	
   1999	
   2002	
   2005	
   2008	
   2011	
   2014	
  
prix	
  	
  
Taux	
  
Période	
  
Taux d'intérêt vs. prix moyens vs. taux de chômage
Taux	
  hyp.	
  moyen	
  annoncé	
  5	
  ans	
   Taux	
  de	
  chômage	
  
Taux	
  d'inoccupa>on	
  (logement)	
   Prix	
  moyens	
  
Enreg.	
  (Taux	
  hyp.	
  moyen	
  annoncé	
  5	
  ans)	
   Enreg.	
  (Taux	
  de	
  chômage)	
  
Enreg.	
  (Taux	
  d'inoccupa>on	
  (logement))	
   Enreg.	
  (Prix	
  moyens)	
  
9	
  
	
  
Figure	
  3	
  :	
  évolution	
  des	
  facteurs	
  démographiques	
  
	
  
Figure	
  4	
  :	
  évolution	
  des	
  facteurs	
  économiques	
  
0	
  
10000	
  
20000	
  
30000	
  
40000	
  
50000	
  
60000	
  
70000	
  
80000	
  
90000	
  
100000	
  
110000	
  
120000	
  
130000	
  
140000	
  
150000	
  
160000	
  
170000	
  
180000	
  
190000	
  
200000	
  
210000	
  
220000	
  
230000	
  
240000	
  
250000	
  
1986	
   1991	
   1996	
   2001	
   2006	
   2011	
  
Nombre	
  de	
  personnes	
  
Années	
  
Évolution des facteurs démographiques
natalité	
  (Capitale-­‐Na>onale)	
   pop.	
  totale	
  d'imigrants	
   popula>on	
  0-­‐14	
  ans	
   popula>on	
  15-­‐34	
  ans	
  
popula>on	
  35-­‐54	
  ans	
   popula>on	
  55-­‐64	
  ans	
   popula>on	
  65	
  ans	
  et	
  +	
  
126660	
  
158595	
  
163225	
  
175835	
  
194065	
  
32873	
  
42164	
   43737	
  
50230	
  
60884	
  
69504	
  
64.5	
  
67.28	
  
64.4	
  
65.6	
  
67.4	
   67.4	
  
60	
  
65	
  
70	
  
0	
  
20000	
  
40000	
  
60000	
  
80000	
  
100000	
  
120000	
  
140000	
  
160000	
  
180000	
  
200000	
  
1981	
   1986	
   1991	
   1996	
   2001	
   2006	
   2011	
  
Pourcentage(%)
Population(Nombredepersonnes)
Évolution des facteurs économiques
pop.	
  active	
  chez	
  les	
  femmes	
   revenus	
  moyens	
  par	
  menage	
  
taux	
  d'activité	
   Enreg.	
  (pop.	
  active	
  chez	
  les	
  femmes)	
  
Enreg.	
  (revenus	
  moyens	
  par	
  menage)	
   Enreg.	
  (taux	
  d'activité)	
  
10	
  
	
  
La figure 4 a permis d’entrevoir l’évolution de trois facteurs liés au contexte économique de la
RMR de Québec.
Les facteurs tels la composition des ménages et le nombre de divorcés qui sont présentés à la
figure 5, permettent de présenter les certaines tendances de l’évolution socioéconomique pour la
RMR de Québec.
Sur la base des données économiques, démographiques et socioéconomiques travaillées et
analysées à travers ces différents graphiques des figures 1 à 5, une première analyse de régression
linéaire pouvait voir le jour en intégrant les variables indépendantes suivantes : taux hypothécaire
5 ans, taux d’inoccupation, indice du logement neuf, revenu moyen, loyer moyen, population de
15 à 54 ans, population active, population active chez les femmes, ménage de 2 personnes et
moins, ménage de 3 personnes et plus et finalement les immigrants.
17740	
  
36860	
  
49750	
  
58510	
  
39405	
  
43880	
  
0	
  
10000	
  
20000	
  
30000	
  
40000	
  
50000	
  
60000	
  
70000	
  
0	
  
20000	
  
40000	
  
60000	
  
80000	
  
100000	
  
120000	
  
140000	
  
160000	
  
180000	
  
200000	
  
220000	
  
240000	
  
1986	
   1991	
   1996	
   2001	
   2006	
   2011	
  
Divorcés
Nombredeménage
Année	
  
Évolution	
  des	
  facteurs	
  socioéconomiques	
  
1	
  à	
  2	
  personnes	
   3	
  personnes	
   4	
  personnes	
  et	
  +	
   divorcés	
  
Enreg.	
  (1	
  à	
  2	
  personnes)	
   Enreg.	
  (3	
  personnes)	
   Enreg.	
  (4	
  personnes	
  et	
  +)	
   Enreg.	
  (divorcés)	
  
Figure	
  5	
  :	
  Évolution	
  des	
  facteurs	
  socioéconomiques
11	
  
	
  
Test	
  de	
  normalité	
  
	
  
Afin de s’assurer d’une meilleure performance de notre modèle, un test de normalité a été
effectué sur la totalité des variables à l’étude.
Tableau	
  2	
  :	
  test	
  de	
  normalité	
  sur	
  l’ensemble	
  des	
  données	
  à	
  l’étude	
  
Suivant le test Shapiro-Wilk, on considère qu’une variable est normale quand la valeur de la
signification est supérieure à 0,05.
Afin de pouvoir poursuivre l’analyse, une attention particulière fut portée sur la variable
dépendante, afin de s’assurer qu’elle soit supérieure à cette valeur.
Variable « Mise en chantier » = 0.127 > 0.05 avec un échantillon de 34 observations,	
  ce qui
amène à conclure au non-rejet de l’hypothèse nulle. De ce fait, rien n’indique que la distribution
n’est pas normale.
12	
  
	
  
Par la suite, en appliquant la même analyse, il est possible de faire ressortir les variables
indépendantes ayant une distribution considérée comme normale (signification > 0.05) :
-­‐ Loyer moyen : signification = 0.215
-­‐ Population totale : signification = 0.058
-­‐ Ménages de 1 & 2 personnes : signification = 0,157
-­‐ Population active des femmes : signification = 0.182
-­‐ Population active : signification = 0.168
Voir les histogrammes en annexe #4.
Afin d’obtenir un maximum de variables dans le modèle, celles qui étaient considérées comme
non normales ont été transformées à l’aide d’un modèle mathématique. Le tableau suivant intègre
des données transformées.
Tableau	
  3	
  :	
  Test	
  de	
  normalité	
  sur	
  les	
  données	
  transformées	
  
Dans le tableau ci-dessus, les variables ayant une distribution initialement non normales on subit
une transformation logarithmique.
Le tableau #3 permet de retenir comme variables normalement distribuées :
-­‐ log prix des logements neufs avec une signification de ,134
-­‐ log des immigrants avec une signification de ,068
La variable de la population de 15 à 54 ans étant importante pour l’analyse, elle sera conservée
dans le modèle étant donné que la normalité n’est pas un critère indispensable pour les variables
indépendantes.
13	
  
	
  
Analyse	
  de	
  corrélation	
  
Tableau	
  4	
  :	
  Analyse	
  de	
  corrélation	
  
14	
  
	
  
En analysant le contenu du tableau 4, il apparaît que les variables indépendantes ont une faible
corrélation avec la variable dépendante : « mise en chantiers de logements », avec une corrélation
de Pearson ne dépassant pas les 0,229. Certaines variables présentent même une corrélation
négative telles que les ménages de 3 personnes et plus avec une valeur de - 0,42 ou encore la
population de 15 à 54 ans avec une valeur de -0,194. Cela nous amène à supposer que les
variables indépendantes ont un faible pouvoir explicatif envers la variable dépendante « mise en
chantier »
Des données sont néanmoins intéressantes à retenir. En effet, les prix des logements neufs ainsi
que les loyers moyens présentent une forte corrélation avec les variables indépendantes étudiées.
Il apparaît notamment une corrélation positive avec :
-­‐ L’immigration :
o corrélation de Pearson prix des logements neufs = 0,949
o corrélation de Pearson loyers moyens = 0,964
-­‐ Le revenu moyen :
o corrélation de Pearson prix des logements neufs = 0,817
o corrélation de Pearson loyers moyens = 0,840
-­‐ Le Loyer moyen :
o corrélation de Pearson prix des logements neufs = 0,995
-­‐ Le prix des logements neufs :
o corrélation de Pearson loyers moyens = 0,995
-­‐ La population de 15 à 54 ans :
o corrélation de Pearson prix des logements neufs = 0,863
o corrélation de Pearson loyers moyens = 0,866
-­‐ La population totale :
o corrélation de Pearson prix des logements neufs = 0,971
o corrélation de Pearson loyers moyens = 0,988
-­‐ Les ménages de 1 et 2 personnes :
o corrélation de Pearson prix des logements neufs = 0,969
o corrélation de Pearson loyers moyens = 0,995
-­‐ La population active :
o corrélation de Pearson prix des logements neufs = 0,989
o corrélation de Pearson loyers moyens = 0,994
15	
  
	
  
-­‐ La population active chez les femmes :
o corrélation de Pearson prix des logements neufs = 0,983
o corrélation de Pearson loyers moyens = 0,992
La similitude entre la corrélation des variables « prix des logements neufs » et « loyers moyens et
les autres variables est flagrante. Ces 2 variables ont sensiblement la même relation avec les
autres variables indépendantes.
Certaines variables ont également une corrélation négative, cela signifie qu’il existe une relation
linéaire négative entre le prix des logements neufs et :
-­‐ Taux d’inoccupation :
o corrélation de Pearson prix des logements neufs = -0,367
o corrélation de Pearson loyers moyens = -0,427
-­‐ Les ménages de 3 personnes et plus :
o corrélation de Pearson prix des logements neufs = -0,348
o corrélation de Pearson loyers moyens = -0,431
La valeur absolue des coefficients n’étant cependant pas extrêmement forte, la corrélation est
donc moins significative que pour les variables précédentes.
16	
  
	
  
Tests	
  de	
  colinéarité	
  	
  	
  
Cette analyse de régression a été effectuée en incluant toutes les variables du modèle à
distribution normale ainsi que la population de 15 à 54 ans.
Tableau	
  5	
  :	
  Statistiques	
  de	
  colinéarité
17	
  
	
  
Afin de se prémunir de risques de multi-colinéarité des données, le coefficient VIF (ou facteur
d’inflation de la variance) doit être inférieur à 10. Comme le démontre le contenu du tableau 5, il
y a une forte multi-colinéarité des données ce qui vient fausser l’analyse. Il est possible de
constater que plus il y a de variables, plus la multi-colinéarité est importante. Cela est d’autant
plus marquant pour la population active avec un VIF de 1965,989 et la population active chez les
femmes où le VIF est de 1563,447. Les chances sont donc très fortes pour que les deux variables
d’expliquent mutuellement.
Il a donc été décidé de refaire un modèle en supprimant les variables les plus colinéaires telles
que la population active et la population active chez les femmes.
Parmi les tests, il fut question de les remplacer les données brutes par des données transformées
par un log. Compte tenu de la présence importante de multi-colinéarité, il est accepté que le
modèle ne contienne pas que de variables normales.
Tableau	
  6	
  :	
  analyse	
  de	
  régression	
  avec	
  des	
  variables	
  log	
  
Il est possible de constater dans le tableau 6 un VIF acceptable pour les variables suivantes :
-­‐ Log de la population de 14 à 54 ans : 6.001 < 10
-­‐ Log des taux hypothécaires : 1.603 < 10
-­‐ Log des logements inoccupés : 3.758 < 10
Concernant le log « ménagetrois » (ménage de 3 personnes et plus), le VIF est de 9,574 donc
également inférieurs à 10, mais s’en rapproche très fortement, ce qui n’est pas idéal.
18	
  
	
  
Afin d’avoir un modèle plus significatif, avec une multi colinéarité moindre, plusieurs tests ont
été fait avec l’ensemble des données du modèle.
Voici quelques exemples d’autres tests qui ont été effectués.
Test 1 :
Tableau	
  7	
  :	
  analyse	
  intégrant	
  différentes	
  variables	
  
Dans le tableau 7, il apparaît que le log des immigrants et la population de 15 à 54 ans respecte
les tolérances de colinéarité. Le problème se révèle lorsque l’on ajoute la variable loyer moyen.
Dans ce cas, le VIF des immigrants passe à 16,302 et le loyer moyen à 24,793.
Test 2 :
Tableau	
  8	
  :	
  analyse	
  intégrant	
  différentes	
  variables	
  
19	
  
	
  
Le tableau 8, met en évidence que le problème de multi corrélation du modèle dans le tableau 7
était lié à la variable "immigrant" qui présentait une forte colinéarité avec le loyer moyen. Dans le
cas présent le modèle ne contient que 2 variables, mais le VIF est acceptable.
Test 3 :
Tableau	
  9	
  :	
  analyse	
  intégrant	
  d'autres	
  variables	
  
Ce test semble pertinent, néanmoins, il apparaît un coefficient VIF pour la variable immigrants
important (>10) ce qui amène un fort risque de multi-colinéarité. Il a donc été décidé de
reproduire un modèle sans cette variable. Ce qui a généré le modèle final qui suit dans la
prochaine section .
20	
  
	
  
	
  
Interprétation de la qualité du modèle de régression
L’interprétation débute en évaluant la qualité du modèle. On vérifie si la première étape du
modèle explique significativement plus de variabilité qu’un modèle sans prédicteur. Ensuite, il
s'agit de s'assurer que toutes les variables introduites contribuent à améliorer significativement la
variabilité expliquée par le modèle final.
Analyse de variance : L’objectif de l’analyse de la variance est de décomposer la variabilité
existante dans la variable dépendante en deux sources de variation : une attribuable aux diverses
modalités des facteurs considérés et une autre attribuable à toute autre source de variation non
prise en considération. Pour tester l’influence du facteur a du tableau 10, la démarche du test de
Fisher a été utilisée.
1. Hypothèses statistiques :
• Hypothèse nulle : H0 = µ1 = µ2 = … µK (les moyennes sont toutes égales)
• Contre-hypothèse : H1 = les µj ne sont toutes égales.
2. Seuil de signification : α = 0,05
3. Conditions d’application du test : On suppose que les observations constituent des échantillons prélevés au
hasard et indépendamment de k populations normales de variance identiques σ2
.
4. La statistique qui convient pour le test est le rapport des carrés moyens. En supposant H0 vrai et selon les
conditions d’application, la quantité F= CMA/CM RES est distribuée selon la loi de Fisher avec (k-1) et (n-k)
degré de liberté.
5. Règle de décision. Au seuil α, la valeur critique F de fisher est Fα ;(k-1),(n-k). Donc F0,05 ;(4),(29) = 2,70 selon les
valeurs de la distribution F.
6. Calcul du quotient des carrés moyens : F= CMA/CM RES = 3,463
7. Décision et conclusion : Étant que F est supérieur à la valeur critique (3,462 > 2,70), H0 est rejeté et H1
favorisé. Une influence significative du facteur a est donc présente.
L’essentiel de l’analyse de variance se résume au tableau 10 qui permet d’obtenir les deux carrés
moyens (les variances) pour tester l’hypothèse nulle.
Le tableau 10 reproduit les résultats de l’analyse de variance permettant de vérifier si l’ensemble
des variables indépendantes expliquent globalement «Y» de façon significative. Comme il est
possible de le constater, le F calculé est de 3,463, ce qui excède la valeur critique de 2,70. La
probabilité que ce résultat soit dû au hasard est, en fait, inférieure à 0,05 (colonne Sig).
L’hypothèse nulle H0 est donc exclue et, on peut interpréter que l’ensemble des variables
indépendantes du modèle explique l’évolution de la mise en chantier de façon significative.
21	
  
	
  
ANOVAb
33136356 4 8284088,967 3,463 ,020a
69366730 29 2391956,192
102503085 33
Régression
Résidu
Total
Modèle
1
Somme
des carrés ddl Carré moyen F Signification
Valeurs prédites : (constantes), TREND(Pop15_54_1), Taux_innoccupation, Taux_
hyp5ans, TREND(Revenu_moyen)
a.
Variable dépendante : Misenchantierb.
Interprétation	
  de	
  l'ajustement	
  du	
  modèle	
  de	
  régression	
  aux	
  données	
  
Maintenant que l’on sait que le modèle est significatif, le tableau récapitulatif du modèle permet
de déterminer la contribution de bloc de variables.
Récapitulatif du modèle(b)
Tableau	
  11	
  :	
  Analyse	
  de	
  régression	
  
Modèle R R2
R2
ajusté
Erreur
standard de
l'estimation
1a ,569(a) ,323 ,230 1546,59503
2b ,103(b) ,011 -,053 1808,72951
3c ,231(c) ,053 -,008 1769,37600
4d ,250(d) ,062 ,002 1760,80363
5e
,194(e) ,038 -,024 1783,77475
6f ,229(f) ,053 -,009 1769,96418
7g ,448(g) ,201 ,121 1652,44039
8h ,231(h) ,053 -,041 1798,56580
a. Valeurs prédites : (constantes), TREND(Pop15_54_1), Taux_innoccupation, Taux_hyp5ans,
TREND(Revenu_moyen)
b. Valeurs prédites : (constantes), Taux_innoccupation, Taux_hyp5ans
c. Valeurs prédites : (constantes), TREND(Pop15_54_1), Taux_innoccupation
d. Valeurs prédites : (constantes), Taux_innoccupation, TREND(Revenu_moyen)
e. Valeurs prédites : (constantes), Taux_hyp5ans, TREND(Pop15_54_1)
f. Valeurs prédites : (constantes), TREND(Revenu_moyen), Taux_hyp5ans)
g. Valeurs prédites : (constantes), TREND(Pop15_54_1), Taux_hyp5ans, TREND(Revenu_moyen)
h. Valeurs prédites : (constantes), Taux_innoccupation, Taux_hyp5ans, TREND(Pop15_54_1)
b Variable dépendante : Misenchantier
Tableau	
  10:	
  Analyse	
  de	
  variances
22	
  
	
  
Corrélation multiple R : La valeur de la corrélation multiple R est un indice standardisé, variant
entre -1 et +1, de la force de la relation entre l'ensemble des variables indépendantes et la variable
dépendante. C'est la corrélation entre les valeurs prédites et les valeurs réelles. Une valeur de
0,569 pour le modèle 1 suggère que les données sont ajustées au modèle et qu’il existe une
relation entre l’ensemble des variables indépendantes et l’évolution des mises en chantier. Quand
R > ,75 on peut affirmer qu’il existe une forte relation entre l'ensemble des variables, ce qui n’est
pas le cas pour le modèle 1. Les variables suivantes permettent au modèle 1 d’obtenir la meilleure
relation entre les variables indépendantes et la variable dépendante :
• Population de 15-54 ans ;
• Taux d’inoccupation ;
• Taux hypothécaire 5 ans ;
• Revenu moyen.
Corrélation multiple (R2)
: Le coefficient de détermination est un indicateur de la performance
explicative du modèle. Il représente la proportion de la variation totale de la variable dépendante
expliquée par l’ensemble des variables explicatives de l’échantillon. Ainsi, on dira que la
combinaison des variables population de 15-54 ans, taux d’inoccupation, taux hypothécaire 5
ans et revenu moyen expliquent seulement 32,3% de la variance de l’évolution des mises en
chantier.	
  
Le R² ajusté : Les variables explicatives dans l’équation de régression ont pour effet de faire
augmenter le (R²) de façon non proportionnelle au (R²) ajusté. Le coefficient (R²) ajusté
expliquerait donc plus précisément le pouvoir explicatif du modèle.
L’erreur standard de l’estimation est l’indicateur de la performance prédictive du modèle de
régression. Exprimé en nombre dans la forme linéaire du modèle, cet indicateur représente
l’erreur commise dans l’estimation des mises en chantiers par le modèle.
23	
  
	
  
Coefficientsa
-629,338 5525,759 -,114 ,910
-6,901 17,071 -,063 -,404 ,689 ,969 1,032
470,293 205,316 ,607 2,291 ,029 ,333 3,005
,359 ,105 1,076 3,402 ,002 ,233 4,285
-,050 ,015 -,723 -3,340 ,002 ,498 2,006
(constante)
Taux_hyp5ans
Taux_innoccupation
TREND(Revenu_moyen)
TREND(Pop15_54_1)
Modèle
1
B
Erreur
standard
Coefficients non
standardisés
Bêta
Coefficients
standardisés
t Signification Tolérance VIF
Statistiques de
colinéarité
Variable dépendante : Misenchantiera.
Évaluation	
  et	
  interprétation	
  des	
  paramètres	
  du	
  modèle	
  	
  
Il a été vérifié que le modèle est significatif et que le modèle 1 est celui qui explique le plus de
variance même si le pouvoir explicatif reste faible. Il est tout de même possible de construire
l’équation de régression pour prédire une valeur de Y. L’équation de base est la suivante :
Yi : (b0 + b1X1 + b2X2 + … + bnXn) + εi
En remplaçant maintenant les b par les coefficients fournis dans le tableau ci-dessus :
Yprédit = (-629,34 - 6,90taux_hyp5ans + 470,29Taux_innoccupation +
0.36TREND(Revenu_moyen) - 0,05TREND(Pop15_54_1))
Pour 2013, un nombre de mises en chantier prédit de :
Yprédit = (-629,34 – 6,90*0,04 +470,29*0,02 + 0,36*73808,30 – 0,05*435770,87)
Yprédit = 4162.24 = 4162 mises en chantier en 2013
Le signe du coefficient indique le sens de la relation. Il est à noter que plus le revenu moyen et le
taux d’inoccupation augmente, plus le nombre de mise en chantier augmente. On interprète aussi
avec l’équation de régression que quand les taux hypothécaires et la population de 15-54 ans
diminue, la mise en chantier augmente.
Tableau	
  12	
  :	
  Coefficients	
  du	
  modèle
24	
  
	
  
De plus, le coefficient Beta nous informe également sur le degré auquel les variables
indépendantes influencent la variable dépendante si elles sont toutes constantes. Par exemple, le
nombre de mises en chantier est diminué de 629 annuellement. Ensuite, la valeur de t nous
indique si le coefficient est significatif. Alors que le tableau sur le récapitulatif du modèle
confirmait si le modèle était significatif, la signification de t nous permet de répondre si chaque
variable contribue significativement au modèle. Plus la valeur de t est élevée, plus la variable
contribue au modèle. On constate donc que trois variables sur quatre sont significatives et que la
variabilité expliquée par le revenu moyen et la population 15-54 ans sont plus importantes que
celle expliquée par le taux d’inoccupation.
Finalement, la valeur VIF des variables indépendantes tend vers 1 et est en déca de 5. Une valeur
VIF de 10 est problématique au niveau de la multi-colinéarité.
En observant le tableau 13 construit à partir de l’équation de régression pour prédire une valeur
de Y, on peut constater de faibles et de grandes différences entre le Yprédit et la valeur réelle de la
variable dépendante mise en chantier. Les variables indépendantes revenu moyen des ménages et
la population 15-54 ans font varier fortement à la hausse ou à la baisse l’évolution de la mise en
chantier de la RMR de Québec.
25	
  
	
  
Tableau	
  13	
  :	
  Équation	
  de	
  régression	
  pour	
  prédire	
  une	
  valeur	
  de	
  "y"	
  
26	
  
	
  
Figure	
  6	
  :	
  nuages	
  de	
  dispersion	
  des	
  variables	
  indépendantes	
  retenues
	
  
Les graphiques ci dessus permettent d’illustrer les relations entre la variable dépendante et les
variables indépendantes. En analysant ces graphiques, il n’apparaît pas de relation claire entre la
variable dépendante et chaque variable prise individuellement.
	
  
27	
  
	
  
Conclusion	
  et	
  interprétation	
  globale	
  
Les résultats ont montré que le revenu moyen des ménages et la population 15-54 ans
sont des variables significative pour le modèle présenté. Par contre, le modèle mis de
l’avant par notre étude ne permet pas d’affirmer qu’il est prédicteur de l’évolution de la
mise en chantier de la RMR de Québec car il n’explique pas de façon significative la
compréhension de la situation. En fait, l’étude effectuée ne démontre pas suffisamment la
pertinence de faire intervenir les valeurs de notre modèle dans l'explication. Parmi les
valeurs qui pourraient expliquer de façon plus probante l’évolution de la mise en chantier,
l'importance accordée au vieillissement de la population et l’activité économique propre
de la RMR apparaîtrait comme les plus importantes.
Les limites ayant empêché de rendre le modèle plus pertinent ont tout d’abord été
l’obligation d’interpoler et extrapoler les données afin de les obtenir par années de 1980 à
2013 pour chacune des variables. La distribution normale était respectée que pour une
faible partie de l’ensemble des variables de l’étude. Et le problème majeur provient de la
multi-colinéarité des variables ce qui a obligé de réduire le modèle à simplement 4
variables indépendantes.
De plus il est à noter que l’évolution de la mise en chantier est une question peu
documentée par les chercheurs qui se sont penchés sur divers sujets connexes comme le
besoin en logements ou le prix de ventes des propriétés pour la RMR de Québec. On
retrouve davantage de données provinciales que de données reliées à la RMR de Québec. 	
  
	
  
En conclusion, l'analyse des données indique clairement que l'hypothèse de cette
recherche, selon laquelle l’évolution de la mise en chantier est expliqué par le revenu
moyen des ménages, du nombre de personnes composant la population des 15-54 ans, des
taux hypothécaire 5 ans et du taux d’inoccupation n’est pas confirmée.
	
  
	
  
28	
  
	
  
Bibliographie
Statistique Canada : CANSIM
Construction résidentielle : [en ligne]
http://www5.statcan.gc.ca/cansim/a33?RT=TABLE&themeID=2166&spMode=tables&la
ng=fra (page consultée le 20 novembre 2014)
Divorces et séparation : [en ligne]
http://www5.statcan.gc.ca/cansim/a33?RT=TABLE&themeID=40001&spMode=tables&
lang=fra (Page consultée le 21 novembre 2014)
Emploi et chômage : [en ligne]
http://www5.statcan.gc.ca/cansim/a33?RT=TABLE&themeID=1803&spMode=tables&lang=fra
(page consultée le 21 novembre 2014)
Immigration : [en ligne]
http://www5.statcan.gc.ca/cansim/a33?lang=fra&spMode=master&themeID=30000&RT=TABL
E (Page consultée le 13 novembre)
Bibliothèque de l’Université Laval, données Recensement
Statistique Canada, Dictionnaire du recensement 1981 [en ligne] http://ariane.ulaval.ca/cgi-
bin/recherche.cgi?qu=01-1116321 (page consultée le 3 novembre 2014)
Statistique Canada, Dictionnaire du recensement1986 [en ligne] http://ariane.ulaval.ca/cgi-
bin/recherche.cgi?qu=01-1356834 (Page consultée le 3 novembre 2014)
Statistique Canada, Dictionnaire du recensement 1991 [en ligne] http://ariane.ulaval.ca/cgi-
bin/recherche.cgi?qu=01-0061667 (Page consultée le 3 novembre 2014)
Statistique Canada, Dictionnaire du recensement 1996 [en ligne] http://ariane.ulaval.ca/cgi-
bin/recherche.cgi?qu=01-0521272 (Page consultée le 4 novembre 2014)
Statistique Canada, Dictionnaire du recensement 2001 [en ligne] http://ariane.ulaval.ca/cgi-
bin/recherche.cgi?qu=01-0641765 (Page consultée le 4 novembre 2014)
Statistique Canada, Dictionnaire du recensement 2006 [en ligne] http://ariane.ulaval.ca/cgi-
bin/recherche.cgi?qu=a1591874 (Page consultée le 3 novembre 2014)
Université Laval. Bibliothèque. Données statistiques en ligne
http://www.bibl.ulaval.ca/web/economique/donnees-statistiques (Page consultée le 1 novembre
2014)
29	
  
	
  
Autres sites internet
Université de Sherbrooke, SPSS17 [en ligne] : http://spss.espaceweb.usherbrooke.ca/pages/stat-
inferentielles/regression-multiple.php (Page consultée le 25 novembre 2014)
Université de Montréal, Département de sociologie, L’analyse de régression multiple [en ligne]
https://www.webdepot.umontreal.ca/Enseignement/SOCIO/Intranet/SOL6210/public/notesdecour
s/REGRES.pdf (document PDF consultée le 25 novembre 2014)
Société canadienne d’hypothèque et du logement [en ligne] https://www.cmhc-
schl.gc.ca/fr/index.cfm (page consultée le 31 octobre 2014)
Société canadienne d’hypothèque et de logement, Perspectives du marché de l’habitation, RMR
de Québec [en ligne] http://www.cmhc-
schl.gc.ca/odpub/esub/64281/64281_2014_B02.pdf?fr=1417909487534 (document PDF
consultée le 6 décembre 2014)
Magazine FORCES - Le marché immobilier au Québec [en ligne]
http://www.magazineforces.com/quebec/le-marche-immobilier-au-quebec-atterr (Page consultée
le 3 décembre 2014)
UQAM, Table B.3b 5% Critical Values of the F Distribution [en ligne]
http://www.er.uqam.ca/nobel/k23546/eco8600/tables/FisherCValues-0.05.png (Page consultée au
2014-12-05)
Université LAVAL – Gestion urbaine et immobilière, La modélisation statistique en analyse et
évaluation immobilières, Guide méthodologique par François DES ROSIERS (document PDF)
Gaston Quirion, M.S.I. (Conseiller à la documentation, Information statistique)
30	
  
	
  
ANNEXE	
  1	
  :	
  Carte	
  de	
  la	
  RMR	
  de	
  Québec	
   	
  
31	
  
	
  
Années Taux hypotécaire Taux d'innocupation Indice du prix du neuf Mise en chantier résidentiel Revenu moyen par menages Loyer moyen
1980 14,32 2,8 35,05 3545 63700 315,92
1981 18,15 1,8 38,23 3746 63100 327,41
1982 17,89 4,8 40,48 3071 61600 338,9
1983 13,29 5,2 43,19 4622 60200 350,39
1984 13,61 1,9 45,32 3719 60300 361,88
1985 12,18 1,5 47,7 6140 61700 373,37
1986 11,22 3,2 50,97 7734 62600 384,86
1987 11,14 5,6 55,5 8646 63200 396,35
1988 11,6 5,2 60,33 6133 64400 407,84
1989 12,05 4,6 64,52 6300 66000 419,33
1990 13,24 6,1 66,65 5972 64100 455
1991 11,16 5,7 68,53 6523 61700 479
1992 9,52 6,7 69,06 6300 61400 485
1993 8,7 6,2 68,83 4699 59800 493
1994 9,34 7,1 68,49 4677 60500 491
1995 9,22 6,2 68,98 2405 60800 493
1996 7,94 6,4 68,04 2208 61000 491
1997 7,07 6,5 67,75 2233 61400 493
1998 6,9 5,1 68,14 1845 64200 496
1999 7,39 3,4 69,31 1814 65900 497
2000 8,2 1,5 70,78 2275 67800 505
2001 7,18 0,7 72,56 2555 68900 523
2002 6,7 0,4 75,69 4282 68900 536
2003 6,04 0,4 82,63 5599 68500 555
2004 5,8 1,1 87,61 6186 69700 581
2005 5,48 1,5 91,44 5835 70300 600
2006 100 1,5 96,2 5176 72100 619
2007 6,36 1,4 100 5284 74300 620
2008 6,41 0,6 105,3 5457 75200 631
2009 5,05 0,5 112,64 5513 74500 655
2010 4,82 1,1 116,25 6652 74900 675
2011 4,57 1,6 117,93 5445 75000 699
2012 4,24 2,1 121,38 6416 73354,44 712
2013 4,17 2,4 122,68 4680 73808,3 727
ANNEXE	
  2	
  :	
  Base	
  de	
  données	
  
	
  
	
  
	
  
	
   	
  
32	
  
	
  
Population de 15 à 54 ans Population totale Ménages de 1 à 2 pers. Ménages de 3 et plus Nombre d' immigrants Population active totale Population active chezles femmes
352454 569291,6 88943 100349 8607,39 282575,5 111815
358085 576075 93890 101575 12270 280960 116620
356970 577355 97734 102322 12544 286161 118628
355855 578635 101578 103069 12818 291362 120636
354740 579915 105422 103816 13092 296563 122644
353625 581195 109266 104563 13366 301764 124652
352510 582475 113110 105310 13640 306965 126660
361981 595090 119818 105591 13706 315204 133047
371452 607705 126526 105872 13772 323443 139434
380923 620320 133234 106153 13838 331682 145821
390394 632935 139942 106434 13904 339921 152208
399865 645550 146650 106715 13970 348160 158595
403196 650815 150989 106889 14657,2 348845 159521
406527 656080 155328 107063 15344,4 349530 160447
409858 661345 159667 107237 16031,6 350215 161373
413189 666610 164006 107411 16718,8 350900 162299
416520 671875 168345 107585 17406 351585 163225
414958 674050 173504 106261 17846,8 355111 165747
413396 676225 178663 104937 18287,6 358637 168269
411834 678400 183822 103613 18728,4 362163 170791
410272 680575 188981 102289 19169,2 365689 173313
408710 682750 194140 100965 19610 369215 175835
408444 689303 198800 100591 20927 375730 179481
408178 695856 203460 100217 22244 382245 183127
407912 702409 208120 99843 23561 388760 186773
407646 708962 212780 99469 24878 395275 190419
407380 715515 217440 99095 26195 401790 194065
409192 725553,2 222920 99485 27531 406892 199086,6
411004 735591,4 228400 99875 28867 411994 202326,6
412816 745629,6 233880 100265 30203 417096 205566,5
414628 755667,8 239360 100655 31539 422198 208806,5
416440 765706 244840 101045 32875 427300 212046,5
433301,8 759679,7 248936,2 102489,3 29427,45 427963,5 215286,5
435770,9 765766,3 253969 102480,2 30078,08 432506,9 218526,4
	
   	
  
33	
  
	
  
ANNEXE	
  3	
  :	
  Histogramme	
  et	
  nuage	
  de	
  points	
  du	
  modèle	
  de	
  régression	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
   	
  
34	
  
	
  
ANNEXE	
  4	
  :	
  Histogrammes	
  et	
  Normogrammes	
  Q-­‐Q	
  du	
  test	
  de	
  normalité	
  
	
  
	
  
	
  
	
  
	
  
	
   	
  
35	
  
	
  
	
  
	
   	
  
36	
  
	
  
	
   	
  
37	
  
	
  
	
   	
  
38	
  
	
  
	
   	
  
39	
  
	
  
Descriptives
4814,3235 302,25399
4199,3832
5429,2639
4788,2908
5230,0000
3106154,1
1762,4285
1814,00
8646,00
6832,00
2725,00
-,151 ,403
-,643 ,788
3,3176 ,38986
2,5245
4,1108
3,2788
2,6000
5,168
2,27323
,40
7,10
6,70
4,15
,264 ,403
-1,572 ,788
11,7926 2,74759
6,2026
17,3827
9,1865
8,4500
256,674
16,02106
4,17
100,00
95,83
5,80
5,349 ,403
30,123 ,788
66319,492 906,16661
64475,882
68163,102
66183,750
64300,000
27918689
5283,8139
59800,00
75200,00
15400,00
9200,00
,483 ,403
-1,263 ,788
396177,25 4364,201
387298,22
405056,29
396461,88
408045,00
6E+008
25447,444
352454,0
435770,9
83316,87
43825,00
-,725 ,403
-,870 ,788
Moyenne
Borne inférieure
Borne supérieure
Intervalle de confiance à
95% pour la moyenne
Moyenne tronquée à 5%
Médiane
Variance
Ecart-type
Minimum
Maximum
Intervalle
Intervalle interquartile
Asymétrie
Aplatissement
Moyenne
Borne inférieure
Borne supérieure
Intervalle de confiance à
95% pour la moyenne
Moyenne tronquée à 5%
Médiane
Variance
Ecart-type
Minimum
Maximum
Intervalle
Intervalle interquartile
Asymétrie
Aplatissement
Moyenne
Borne inférieure
Borne supérieure
Intervalle de confiance à
95% pour la moyenne
Moyenne tronquée à 5%
Médiane
Variance
Ecart-type
Minimum
Maximum
Intervalle
Intervalle interquartile
Asymétrie
Aplatissement
Moyenne
Borne inférieure
Borne supérieure
Intervalle de confiance à
95% pour la moyenne
Moyenne tronquée à 5%
Médiane
Variance
Ecart-type
Minimum
Maximum
Intervalle
Intervalle interquartile
Asymétrie
Aplatissement
Moyenne
Borne inférieure
Borne supérieure
Intervalle de confiance à
95% pour la moyenne
Moyenne tronquée à 5%
Médiane
Variance
Ecart-type
Minimum
Maximum
Intervalle
Intervalle interquartile
Asymétrie
Aplatissement
Misenchantier
Taux_innoccupation
Taux_hyp5ans
TREND(Revenu_moyen)
TREND(Pop15_54_1)
Statistique
Erreur
standard
ANNEXE	
  5	
  :	
  Test	
  de	
  normalité	
  sur	
  les	
  variables	
  retenues
	
  

Contenu connexe

En vedette

Natasha_Lambert_RapportDeStage
Natasha_Lambert_RapportDeStageNatasha_Lambert_RapportDeStage
Natasha_Lambert_RapportDeStageNatasha Lambert
 
Calculo i correcciones [u de chile]
Calculo i correcciones [u de chile]Calculo i correcciones [u de chile]
Calculo i correcciones [u de chile]Felipe Olivares
 
Dossier de produdction - groupe n°75
Dossier de produdction - groupe n°75Dossier de produdction - groupe n°75
Dossier de produdction - groupe n°75Ecgd
 
Diapo milgram v3.0
Diapo milgram v3.0Diapo milgram v3.0
Diapo milgram v3.0Jules Parent
 
Taxe d'apprentissage 2014 Master MOI
Taxe d'apprentissage 2014 Master MOITaxe d'apprentissage 2014 Master MOI
Taxe d'apprentissage 2014 Master MOIJohannaToxopeus
 
Casa en cura brochero
Casa en cura brocheroCasa en cura brochero
Casa en cura brocheroedsary
 
Portfolio rebecca perret 2
Portfolio rebecca perret 2Portfolio rebecca perret 2
Portfolio rebecca perret 2rperret4
 
Leading tunisian scientists in mathematics, computer science and engineering....
Leading tunisian scientists in mathematics, computer science and engineering....Leading tunisian scientists in mathematics, computer science and engineering....
Leading tunisian scientists in mathematics, computer science and engineering....Mohamed Larbi BEN YOUNES
 
La newsletter de mgrh 31
La newsletter de mgrh 31La newsletter de mgrh 31
La newsletter de mgrh 31CABINET MGRH
 
Réseaux sociaux outils de differenciation 20 novembre 2014
Réseaux sociaux outils de differenciation 20 novembre 2014Réseaux sociaux outils de differenciation 20 novembre 2014
Réseaux sociaux outils de differenciation 20 novembre 2014polenumerique33
 

En vedette (18)

Aruba vs Rackspace
Aruba vs RackspaceAruba vs Rackspace
Aruba vs Rackspace
 
test
testtest
test
 
Natasha_Lambert_RapportDeStage
Natasha_Lambert_RapportDeStageNatasha_Lambert_RapportDeStage
Natasha_Lambert_RapportDeStage
 
cv resume fr
cv resume frcv resume fr
cv resume fr
 
Calculo i correcciones [u de chile]
Calculo i correcciones [u de chile]Calculo i correcciones [u de chile]
Calculo i correcciones [u de chile]
 
Dossier de produdction - groupe n°75
Dossier de produdction - groupe n°75Dossier de produdction - groupe n°75
Dossier de produdction - groupe n°75
 
Diapo milgram v3.0
Diapo milgram v3.0Diapo milgram v3.0
Diapo milgram v3.0
 
Taxe d'apprentissage 2014 Master MOI
Taxe d'apprentissage 2014 Master MOITaxe d'apprentissage 2014 Master MOI
Taxe d'apprentissage 2014 Master MOI
 
WELCOME TO B4
WELCOME TO B4WELCOME TO B4
WELCOME TO B4
 
Casa en cura brochero
Casa en cura brocheroCasa en cura brochero
Casa en cura brochero
 
Modulos ama
Modulos amaModulos ama
Modulos ama
 
Portfolio rebecca perret 2
Portfolio rebecca perret 2Portfolio rebecca perret 2
Portfolio rebecca perret 2
 
Leading tunisian scientists in mathematics, computer science and engineering....
Leading tunisian scientists in mathematics, computer science and engineering....Leading tunisian scientists in mathematics, computer science and engineering....
Leading tunisian scientists in mathematics, computer science and engineering....
 
Expo tic 2013
Expo tic 2013Expo tic 2013
Expo tic 2013
 
La newsletter de mgrh 31
La newsletter de mgrh 31La newsletter de mgrh 31
La newsletter de mgrh 31
 
Brochure des dix ans de l'AILF (2002-2012)
Brochure des dix ans de l'AILF (2002-2012)Brochure des dix ans de l'AILF (2002-2012)
Brochure des dix ans de l'AILF (2002-2012)
 
Garage jorge michels
Garage jorge michelsGarage jorge michels
Garage jorge michels
 
Réseaux sociaux outils de differenciation 20 novembre 2014
Réseaux sociaux outils de differenciation 20 novembre 2014Réseaux sociaux outils de differenciation 20 novembre 2014
Réseaux sociaux outils de differenciation 20 novembre 2014
 

Similaire à Evolution de la mise en chantier résidentiel depuis 1980 à 2013 dans la RMR de Québec

1_PDFsam_MQG804_NotesDeCours_A23_1.pdf
1_PDFsam_MQG804_NotesDeCours_A23_1.pdf1_PDFsam_MQG804_NotesDeCours_A23_1.pdf
1_PDFsam_MQG804_NotesDeCours_A23_1.pdfJeanPhilippeTurcotte5
 
Analyse de données sous SPSS 17_ACP, multivarie.pdf
Analyse de données sous SPSS 17_ACP, multivarie.pdfAnalyse de données sous SPSS 17_ACP, multivarie.pdf
Analyse de données sous SPSS 17_ACP, multivarie.pdfPrénom Nom de famille
 
The historical Decomposition of the S&P500
The historical Decomposition of the S&P500The historical Decomposition of the S&P500
The historical Decomposition of the S&P500Mamadou Diallo, MSc
 
Etude De Cas Vehicule Hybride
Etude De Cas Vehicule HybrideEtude De Cas Vehicule Hybride
Etude De Cas Vehicule HybridePascal Cottereau
 
Rapport data-mining
Rapport data-miningRapport data-mining
Rapport data-miningSawsen Larbi
 
Profil statistique du secteur des TIC au Québec
Profil statistique du secteur des TIC au QuébecProfil statistique du secteur des TIC au Québec
Profil statistique du secteur des TIC au Québecpolenumerique33
 
Rapport de Monitoring 2011
Rapport de Monitoring 2011Rapport de Monitoring 2011
Rapport de Monitoring 2011regiosuisse
 
Bilan et perspectives économiques pour la RMR de Québec - 2013-2014
Bilan et perspectives économiques pour la RMR de Québec - 2013-2014Bilan et perspectives économiques pour la RMR de Québec - 2013-2014
Bilan et perspectives économiques pour la RMR de Québec - 2013-2014Université Laval
 
FEDER - Rapport d'évaluation TIC 2015 (phase 1)
FEDER - Rapport d'évaluation TIC 2015 (phase 1)FEDER - Rapport d'évaluation TIC 2015 (phase 1)
FEDER - Rapport d'évaluation TIC 2015 (phase 1)Silicon Comté
 
Bootstrap methodology in claim reserving in Insurance
Bootstrap methodology in claim reserving in InsuranceBootstrap methodology in claim reserving in Insurance
Bootstrap methodology in claim reserving in InsuranceARIJ BenHarrath
 
Conception d'un modèle d'estimation de la consommation énergétique pour un sy...
Conception d'un modèle d'estimation de la consommation énergétique pour un sy...Conception d'un modèle d'estimation de la consommation énergétique pour un sy...
Conception d'un modèle d'estimation de la consommation énergétique pour un sy...PierreVerhulst
 
ournoyer, L., Lachance, L., et Dostie, S. (2015). Perspectives cognitives, co...
ournoyer, L., Lachance, L., et Dostie, S. (2015). Perspectives cognitives, co...ournoyer, L., Lachance, L., et Dostie, S. (2015). Perspectives cognitives, co...
ournoyer, L., Lachance, L., et Dostie, S. (2015). Perspectives cognitives, co...Louis Cournoyer
 
Csss Laval projet clinique 2011-2016
Csss Laval  projet clinique 2011-2016 Csss Laval  projet clinique 2011-2016
Csss Laval projet clinique 2011-2016 Sylvie Spattz
 
Statistiques ofppt
Statistiques ofpptStatistiques ofppt
Statistiques ofpptkhawla atir
 
Modulestatistiques 120308132649-phpapp01
Modulestatistiques 120308132649-phpapp01Modulestatistiques 120308132649-phpapp01
Modulestatistiques 120308132649-phpapp01ilhamto katosa
 
Bilan social et tableaux de bord _ des outils de pilotage au service des ress...
Bilan social et tableaux de bord _ des outils de pilotage au service des ress...Bilan social et tableaux de bord _ des outils de pilotage au service des ress...
Bilan social et tableaux de bord _ des outils de pilotage au service des ress...kabbani2
 
Rapport s goudreau2
Rapport s goudreau2Rapport s goudreau2
Rapport s goudreau2drainham
 

Similaire à Evolution de la mise en chantier résidentiel depuis 1980 à 2013 dans la RMR de Québec (20)

1_PDFsam_MQG804_NotesDeCours_A23_1.pdf
1_PDFsam_MQG804_NotesDeCours_A23_1.pdf1_PDFsam_MQG804_NotesDeCours_A23_1.pdf
1_PDFsam_MQG804_NotesDeCours_A23_1.pdf
 
Analyse de données sous SPSS 17_ACP, multivarie.pdf
Analyse de données sous SPSS 17_ACP, multivarie.pdfAnalyse de données sous SPSS 17_ACP, multivarie.pdf
Analyse de données sous SPSS 17_ACP, multivarie.pdf
 
The historical Decomposition of the S&P500
The historical Decomposition of the S&P500The historical Decomposition of the S&P500
The historical Decomposition of the S&P500
 
Etude De Cas Vehicule Hybride
Etude De Cas Vehicule HybrideEtude De Cas Vehicule Hybride
Etude De Cas Vehicule Hybride
 
Rapport data-mining
Rapport data-miningRapport data-mining
Rapport data-mining
 
Profil statistique du secteur des TIC au Québec
Profil statistique du secteur des TIC au QuébecProfil statistique du secteur des TIC au Québec
Profil statistique du secteur des TIC au Québec
 
Projet-RDÉE
Projet-RDÉEProjet-RDÉE
Projet-RDÉE
 
Rapport de Monitoring 2011
Rapport de Monitoring 2011Rapport de Monitoring 2011
Rapport de Monitoring 2011
 
Bilan et perspectives économiques pour la RMR de Québec - 2013-2014
Bilan et perspectives économiques pour la RMR de Québec - 2013-2014Bilan et perspectives économiques pour la RMR de Québec - 2013-2014
Bilan et perspectives économiques pour la RMR de Québec - 2013-2014
 
Bilan soc 4
Bilan soc 4Bilan soc 4
Bilan soc 4
 
FEDER - Rapport d'évaluation TIC 2015 (phase 1)
FEDER - Rapport d'évaluation TIC 2015 (phase 1)FEDER - Rapport d'évaluation TIC 2015 (phase 1)
FEDER - Rapport d'évaluation TIC 2015 (phase 1)
 
Bootstrap methodology in claim reserving in Insurance
Bootstrap methodology in claim reserving in InsuranceBootstrap methodology in claim reserving in Insurance
Bootstrap methodology in claim reserving in Insurance
 
Conception d'un modèle d'estimation de la consommation énergétique pour un sy...
Conception d'un modèle d'estimation de la consommation énergétique pour un sy...Conception d'un modèle d'estimation de la consommation énergétique pour un sy...
Conception d'un modèle d'estimation de la consommation énergétique pour un sy...
 
ournoyer, L., Lachance, L., et Dostie, S. (2015). Perspectives cognitives, co...
ournoyer, L., Lachance, L., et Dostie, S. (2015). Perspectives cognitives, co...ournoyer, L., Lachance, L., et Dostie, S. (2015). Perspectives cognitives, co...
ournoyer, L., Lachance, L., et Dostie, S. (2015). Perspectives cognitives, co...
 
Csss Laval projet clinique 2011-2016
Csss Laval  projet clinique 2011-2016 Csss Laval  projet clinique 2011-2016
Csss Laval projet clinique 2011-2016
 
Facteur re
Facteur reFacteur re
Facteur re
 
Statistiques ofppt
Statistiques ofpptStatistiques ofppt
Statistiques ofppt
 
Modulestatistiques 120308132649-phpapp01
Modulestatistiques 120308132649-phpapp01Modulestatistiques 120308132649-phpapp01
Modulestatistiques 120308132649-phpapp01
 
Bilan social et tableaux de bord _ des outils de pilotage au service des ress...
Bilan social et tableaux de bord _ des outils de pilotage au service des ress...Bilan social et tableaux de bord _ des outils de pilotage au service des ress...
Bilan social et tableaux de bord _ des outils de pilotage au service des ress...
 
Rapport s goudreau2
Rapport s goudreau2Rapport s goudreau2
Rapport s goudreau2
 

Evolution de la mise en chantier résidentiel depuis 1980 à 2013 dans la RMR de Québec

  • 1.     UNIVERSITÉ LAVAL FACULTÉ DES SCIENCES DE L’ADMINISTRATION ÉCONOMIE URBAINE ET MARCHÉS IMMOBILIERS GUI-4100/6100 Évolution de la mise en chantier résidentiel depuis 1980 à 2013 dans la RMR de Québec Travail de session remis à M. François Des rosiers Par Florian POIX florian.poix.1@ulaval.ca # 111 099 739 Michael LEFEBVRE michael.lefebvre.1@ulaval.ca # 903 178 548 Katerine GIRARD katerine.girard.1@ulaval.ca # 910 052 569 Automne 2014
  • 2. Table  des  matières   Introduction  .................................................................................................................................................................  2   Méthodologie  ...............................................................................................................................................................  3   Analyse  et  interprétation  .......................................................................................................................................  7   -­‐Analyse  de  la  base  de  données……………………………………………………………………………….…………………………7   -­‐Tests  de  normalité………………………………………………………………………………………………………………………....11   -­‐Analyse  de  corrélation………………………………………………………………….....................................................................13   -­‐Tests  de  colinéarité…………………………………………………………………………………………………………………..…...16   -­‐Interprétation  de  la  qualité  du  modèle  de  régression…………..…………………………………………………………..20   -­‐Interprétation  de  l'ajustement  du  modèle  de  régression…………………………………………………………….……21   -­‐Évaluation  et  interprétation  des  paramètres  du  modèle………………………………………………………………….23   Conclusion  et  Interpretation  globale  .............................................................................................................  27   Bibliographie  ..............................................................................................................................................................  28   ANNEXE  1  :  Carte  de  la  RMR  de  Québec  .......................................................................................................  30   ANNEXE  2  :  Base  de  données  .............................................................................................................................  31   ANNEXE  3  :  Histogramme  et  nuage  de  points  du  modèle  de  régression  ........................................  33   ANNEXE  4  :  Histogrammes  et  Normogrammes  Q-­‐Q  du  test  de  normalité  .....................................  34   ANNEXE  5  :  Test  de  normalité  sur  les  variables  retenues  ....................................................................  39     Table  des  figures   Figure  1  :  Mise  en  chantier  et  variables  connexes  .......................................................................................  7   Figure  2:  relations  entre  les  données  économiques  ...................................................................................  8   Figure  3  :  évolution  des  facteurs  démographiques  .....................................................................................  9   Figure  4  :  évolution  des  facteurs  économiques  ............................................................................................  9   Figure  5  :  Évolution  des  facteurs  socioéconomiques  ..............................................................................  10   Figure  6  :  nuages  de  dispersion  des  variables  indépendantes  retenues  ........................................  26     Table  des  tableaux   Tableau 1 : Liste des données primaires à l'étude  .............................................................................................  4   Tableau  2  :  test  de  normalité  sur  l’ensemble  des  données  à  l’étude  ................................................  11   Tableau  3  :  Test  de  normalité  sur  les  données  transformées  ..............................................................  12   Tableau  4  :  Analyse  de  corrélation  ..................................................................................................................  13   Tableau  5  :  Statistiques  de  colinéarité  ...........................................................................................................  16   Tableau  6  :  analyse  de  régression  avec  des  variables  log  .....................................................................  17   Tableau  7  :  analyse  intégrant  différentes  variables  .................................................................................  18   Tableau  8  :  analyse  intégrant  différentes  variables  .................................................................................  18   Tableau  9  :  analyse  intégrant  d'autres  variables  ......................................................................................  19   Tableau  10:  Analyse  de  variances  ...................................................................................................................  21   Tableau  11  :  Analyse  de  régression  ................................................................................................................  21   Tableau  12  :  Coefficients  du  modèle  ...............................................................................................................  23   Tableau  13  :  Équation  de  régression  pour  prédir  une  valeur  de  "y"  ................................................  25  
  • 3. 2       Introduction       La situation économique et démographique du Québec évolue sans cesse. Il en est de même pour le marché résidentiel. Partout, on remarque un développement relativement constant d’immeubles à condominiums et à appartements, des maisons individuelles et jumelées qui prennent forme dans les paysages urbains pour répondre aux besoins d’une population changeante. Après une période d’effervescence à la fin des années 1970 qui a conduit vers un boom immobilier de 1985 à 1989, la demande dans le marché du logement tend à ralentir, bien que le marché reste encore très actif. Depuis 2000, le marché du logement maintient une certaine vigueur qui semble vouloir perdurer. Les faibles taux d’intérêt sont en grandes parties responsables de la prospérité du marché. Plusieurs recherches démontrent que le marché de la propriété tout comme le marché locatif représentent des très bons potentiels de développement futur. C’est un secteur actif qui évolue constamment. À titre d’exemple, on compte 386 mises en chantier résidentiel pour la période de janvier à mars 2014 sur le territoire de Québec et une prédiction de 4125 pour l’année 2014 contre un total de 6652 pour l’année 2010. (Société canadienne d’hypothèques et de logement). Plusieurs études sur le marché résidentiel sont menées régulièrement. Une étude de la FCIQ a notamment permis de créer un modèle pour mieux comprendre l’impact de ces facteurs sur l’évolution des prix. En parallèle, on peut se poser la question, à savoir quels sont les facteurs qui influencent cette fois la mise en chantier ? Le marché du logement et les constructions de logements neufs sont des facteurs importants de l’économie nationale et régionale c’est pourquoi il sera question de tenter de mesurer les impacts de différentes variables sur ce phénomène. Le thème de la recherche portera sur l’évolution de la mise en chantier résidentiel dans la région métropolitaine de Québec depuis 1980 à 2013. Pour tenter de mesurer ce phénomène, plusieurs données de type économique, socio-économique et démographique seront analysées.
  • 4. 3     L’outil d’analyse utilisée sera l’analyse de régression, qui permettra de comprendre comment évolue la mise en chantier résidentiel depuis 1980 jusqu'à 2013. En d’autres termes, l’analyse de régression servira d’outils de mesure pour mieux connaître l’influence des facteurs externes sur le nombre de mise en chantier résidentiel. Notre variable dépendante, à savoir la mise en chantier résidentiel, sera mise en relation avec les variables issues des données économiques, socio- économiques et démographiques qui seront abordées dans la prochaine section. Il s’agira de faire corréler les variables les plus importantes pour évaluer leur degré de signification grâce au coefficient (R²) et ainsi pouvoir mieux comprendre quelles sont les variables qui influencent de façon significative la variable dépendante. Un modèle essentiellement empirique sera élaboré afin de mieux comprendre le phénomène. Le contenu du travail comprendra d’une part la méthodologie, l’analyse détaillée des variables grâce à des graphiques inter reliés, des figures et des tableaux, l’interprétation des résultats obtenus et finalement, la conclusion du travail et la partie bibliographique. Méthodologie       Pour effectuer ce travail, il fut question tout d’abord de rechercher des données sur différentes variables. Des données ont été compilées à partir du coeur du sujet, donc sur le nombre de mise en chantier des maisons individuelles et des jumelés ainsi que la mise en chantier des appartements dans la RMR de Québec. Ces informations ont été compilées sous la forme d’une seule variable, sois la mise en chantier globale. D’autres données ont été récoltées tel que les taux hypothécaires réels sur 5 ans, les données sur les prix moyens du logement, l’indice du prix du neuf, la quantité d’unités écoulées sur le marché et les taux d’inoccupation. Un certain nombre de variables socio-économiques ont également été compilées, telles que la population active chez les femmes, la population active totale, les revenus moyens par ménages et la taille des ménages. La taille des ménages fut regroupée en deux variables, sois les ménages de 1 et 2 personnes et les ménages de 3 personnes et plus. D’autres données de types démographiques ont été compilées, telles que le taux de natalité, la population totale d’immigrants et les différentes tranches d’âges de la population. Les recherches se sont concentrées sur la tranche d’âge de 15 à 54 ans. Les deux tranches d’âge de 15 à 34 ans et de 35 à 54 ont été regroupées afin de contenir les tranches d’âge de 15 à 54 ans. Ces données ont été récoltées pour la population de la RMR de Québec de 1980 à 2013 tel que mentionné plus haut. Les données sur la population de 15 à 54 ans, la taille des ménages, la population active chez les femmes et la population active totale proviennent du recensement de
  • 5. 4     Statistique Canada. Les données sur l’immigration, le revenu moyen par ménages, la population active, le taux hypothécaire, le taux d’inoccupation et l’indice des prix du neuf proviennent de la banque de données CANSIM. Les données sur le loyer moyen proviennent de la société canadienne d’hypothèque et du logement. Le nombre d’unités écoulées proviennent des données de la Société canadienne de l’hypothèque et de logement. Bien qu’elle ait été compilée, cette dernière variable n’a pas été utilisée dans le modèle, car une sélection des variables fut nécessaire afin de ne pas surcharger l’analyse. Pour la majorité des variables, les données les plus récentes dataient de 2011. Des procédures d’extrapolation et d’interpolation ont été effectuées pour aller chercher les données manquantes pour 2012 et 2013, mais aussi pour certaines données manquantes jusqu’en 1980. Pour les variables disponibles aux 5 ans dans les recensements et celles tout simplement absentes pour certaines années, une série d’interpolation a été effectuée. Au départ, une quinzaine de variables ont été récoltées. Avant d’entamer le processus d’analyse, celles-ci ont été revues afin d’effectuer une présélection. Après consultation, 13 variables seulement ont été retenues (Tableau 1). Tableau 1 : Liste des données primaires à l'étude DONNÉES À L’ÉTUDE SOURCE Population âgée de 15 à 54 ans Statistique Canada – Recensement Ménages de 1 à 2 personnes Statistique Canada- Recensement Ménages de 3 personnes et plus Statistique Canada – Recensement Immigration Statistique Canada – Cansim Revenu moyen par ménages Statistique Canada - Cansim La population active Statistique Canada - Cansim La population active chez les femmes Statistique Canada - Recensement La population totale Statistique Canada - Recensement Le Taux hypothécaire réel Statistique Canada – Cansim Taux d’inoccupation Statistique Canada - CANSIM Indice des prix du neuf Statistique Canada - CANSIM Loyer moyen Société Canadienne d’hypothèque et du logement
  • 6. 5     Avant l’utilisation de SPSS, 4 graphiques et un histogramme ont été élaborés avec Excel, afin de pouvoir mieux saisir la relation entre les différentes variables. Cela a notamment permis de faire la sélection des variables du premier modèle étudié. Une analyse sommaire a été effectuée. Pour chaque variable, la forme de la distribution a été mesurée pour s’assurer que le modèle de régression suive une distribution normale. Un test de normalité de Kolmogorov-Smirnov et de Shapiro-Wilks a été effectué. Toutefois, une attention plus particulière a été accordée au test de Shapiro-Wilks en raison de sa meilleure fiabilité en général. Une analyse sommaire des coefficients d’asymétrie et d’aplatissement a également été effectuée grâce aux tableaux générés par SPSS. Ces tableaux ne figurent toutefois pas dans l’analyse afin de ne pas alourdir le travail. Sur ces 13 variables, 7 ont révélé une distribution anormale. La variable dépendante, soit la mise en chantier résidentiel présentait une distribution normale. Pour les variables indépendantes anormales, une transformation logarithmique a été effectuée à l’aide de la fonction arithmétique Lg10. Seules 2 variables présentaient alors une distribution normale. Une autre transformation a donc été faite, mais cette fois, en grossissant nos variables, c’est-à-dire en ajoutant +1 à chaque transformation de variable. Par la suite, les variables qui présentaient toujours une distribution anormale ont été mises de côté. Une analyse de corrélation a également été effectuée en intégrant tous les variables à l’étude. Par la suite, l’analyse de régression linéaire via la méthode « Enter » ainsi qu’un diagnostic de colinéarité ont été effectués avec les variables qui présentaient toutes une distribution normale. Il s’est alors avéré qu’il existait une très forte multi colinéarité entre les variables ce qui venait fausser le modèle. Après plusieurs tentatives, en retirant des variables en alternance, seules deux variables présentaient un VIF de 10.00, qui étaient la valeur minimum. Cette valeur n’était pas satisfaisante. Toutes les variables dites normales présentaient une forte colinéarité. Une alternative à ce problème fut d’introduire certaines variables à distribution anormale préalablement rejetées. Ces variables furent introduites au modèle de régression linéaire par essais et erreur, en alternance, afin de déterminer celles qui présentaient les plus faibles indices de colinéarité. Les nombreux tests effectués incluaient parfois un mélange de données à distribution normale et anormale. Suite à cette série d’analyses et d’épuration, il s’est avéré que seules les variables suivantes détenaient un VIF dans la mesure de l’acceptable : Le taux hypothécaire moyen, le taux d’inoccupation, le revenu moyen par ménages et la population âgée de 15 à 54 ans. Les autres variables ont été rejeté car elles détenaient un VIF supérieur ou égal à 10,00, ou elles intervenaient de façon à faire augmenter la multi-colinéarité autres variables. L’immigration
  • 7. 6     présentait parfois un vif acceptable, mais il prenait ensuite une ampleur significative lorsque mis en relation avec le revenu moyen par ménages. Il fallait donc faire un choix entre les deux variables. Au final, le choix s’est arrêté sur ces 4 variables indépendantes énumérées ci-haut. Ces variables ont été conservées dans le modèle de régression. Plusieurs analyses de régression ont été effectuées en intégrant ces 4 variables. La première analyse s’est effectuée avec les variables ayant subi une transformation logarithmique de base. La deuxième s’est effectuée avec les variables ayant subi une transformation logarithmique exagérée de +1. La troisième analyse comprenait les variables n’ayant pas subi de transformation logarithmique. C’est cette troisième et dernière analyse qui a été retenue en raison des résultats obtenus dans le modèle. Les variables avant subies une transformation log + 1 n’ont pas été retenus, car les résultats générés par la transformation n’étaient pas significatifs. Finalement, une évaluation de la qualité du modèle de régression par une analyse de variance, une évaluation de l’ajustement du modèle de régression aux données et une évaluation des paramètres du modèle a été complétée.
  • 8. 7     Analyse  et  interprétation     Analyse  de  la  base  de  données     Afin de mieux définir les variables indépendantes à utiliser face à la variable dépendante, il fut question d’analyser préalablement l’interrelation et les tendances des données par le biais de graphiques en courbes et un histogramme. La figure 1 présente un graphique qui met en relation les mises en chantier de différents types de propriétés (individuels, jumelés et appartements) face au loyer moyen, aux unités écoulées et celles achevées, mais non écoulées sur le marché de la RMR de Québec. Après analyse, il a été décidé de conserver la variable « mise en chantier » et de revoir celle-ci de façon globale afin qu’elle comprenne tous les types de propriétés. Figure  1  :  Mise  en  chantier  et  variables  connexes   La figure 2 permet de comprendre la relation entre plusieurs données économiques tels les taux hypothécaires moyens, taux de chômage, taux d’inoccupation et les prix moyens des propriétés résidentielles. Ces variables ont toutes été approfondies afin d’être utilisées dans l’étude, compte tenu de leur importance à première vue. 400   450   500   550   600   650   700   750   0   250   500   750   1000   1250   1500   1750   2000   2250   2500   2750   3000   3250   3500   3750   4000   4250   4500   4750   1990   1993   1996   1999   2002   2005   2008   2011   2014   Mises    en  chan?er   Période   Mises en chantier vs. unités achevés mais non écoulés Achevés  mais  non  écoulés   Unités  écoulés  sur  le  marché   Mises  en  chan>er  (individuels  et  jumelés)   Mises  en  chan>er  (appartements)   Loyers  moyens  
  • 9. 8     Figure  2:  relations  entre  les  données  économiques   L’histogramme de la figure 3 a été élaboré afin de pouvoir visualiser les tendances démographiques de la RMR de Québec selon différentes tranches d’âge ou spécificités (ex. : natalité). 0   15000   30000   45000   60000   75000   90000   105000   120000   135000   150000   165000   180000   195000   210000   225000   240000   255000   270000   285000   300000   315000   330000   0.00   1.00   2.00   3.00   4.00   5.00   6.00   7.00   8.00   9.00   10.00   11.00   12.00   13.00   14.00   15.00   1990   1993   1996   1999   2002   2005   2008   2011   2014   prix     Taux   Période   Taux d'intérêt vs. prix moyens vs. taux de chômage Taux  hyp.  moyen  annoncé  5  ans   Taux  de  chômage   Taux  d'inoccupa>on  (logement)   Prix  moyens   Enreg.  (Taux  hyp.  moyen  annoncé  5  ans)   Enreg.  (Taux  de  chômage)   Enreg.  (Taux  d'inoccupa>on  (logement))   Enreg.  (Prix  moyens)  
  • 10. 9     Figure  3  :  évolution  des  facteurs  démographiques     Figure  4  :  évolution  des  facteurs  économiques   0   10000   20000   30000   40000   50000   60000   70000   80000   90000   100000   110000   120000   130000   140000   150000   160000   170000   180000   190000   200000   210000   220000   230000   240000   250000   1986   1991   1996   2001   2006   2011   Nombre  de  personnes   Années   Évolution des facteurs démographiques natalité  (Capitale-­‐Na>onale)   pop.  totale  d'imigrants   popula>on  0-­‐14  ans   popula>on  15-­‐34  ans   popula>on  35-­‐54  ans   popula>on  55-­‐64  ans   popula>on  65  ans  et  +   126660   158595   163225   175835   194065   32873   42164   43737   50230   60884   69504   64.5   67.28   64.4   65.6   67.4   67.4   60   65   70   0   20000   40000   60000   80000   100000   120000   140000   160000   180000   200000   1981   1986   1991   1996   2001   2006   2011   Pourcentage(%) Population(Nombredepersonnes) Évolution des facteurs économiques pop.  active  chez  les  femmes   revenus  moyens  par  menage   taux  d'activité   Enreg.  (pop.  active  chez  les  femmes)   Enreg.  (revenus  moyens  par  menage)   Enreg.  (taux  d'activité)  
  • 11. 10     La figure 4 a permis d’entrevoir l’évolution de trois facteurs liés au contexte économique de la RMR de Québec. Les facteurs tels la composition des ménages et le nombre de divorcés qui sont présentés à la figure 5, permettent de présenter les certaines tendances de l’évolution socioéconomique pour la RMR de Québec. Sur la base des données économiques, démographiques et socioéconomiques travaillées et analysées à travers ces différents graphiques des figures 1 à 5, une première analyse de régression linéaire pouvait voir le jour en intégrant les variables indépendantes suivantes : taux hypothécaire 5 ans, taux d’inoccupation, indice du logement neuf, revenu moyen, loyer moyen, population de 15 à 54 ans, population active, population active chez les femmes, ménage de 2 personnes et moins, ménage de 3 personnes et plus et finalement les immigrants. 17740   36860   49750   58510   39405   43880   0   10000   20000   30000   40000   50000   60000   70000   0   20000   40000   60000   80000   100000   120000   140000   160000   180000   200000   220000   240000   1986   1991   1996   2001   2006   2011   Divorcés Nombredeménage Année   Évolution  des  facteurs  socioéconomiques   1  à  2  personnes   3  personnes   4  personnes  et  +   divorcés   Enreg.  (1  à  2  personnes)   Enreg.  (3  personnes)   Enreg.  (4  personnes  et  +)   Enreg.  (divorcés)   Figure  5  :  Évolution  des  facteurs  socioéconomiques
  • 12. 11     Test  de  normalité     Afin de s’assurer d’une meilleure performance de notre modèle, un test de normalité a été effectué sur la totalité des variables à l’étude. Tableau  2  :  test  de  normalité  sur  l’ensemble  des  données  à  l’étude   Suivant le test Shapiro-Wilk, on considère qu’une variable est normale quand la valeur de la signification est supérieure à 0,05. Afin de pouvoir poursuivre l’analyse, une attention particulière fut portée sur la variable dépendante, afin de s’assurer qu’elle soit supérieure à cette valeur. Variable « Mise en chantier » = 0.127 > 0.05 avec un échantillon de 34 observations,  ce qui amène à conclure au non-rejet de l’hypothèse nulle. De ce fait, rien n’indique que la distribution n’est pas normale.
  • 13. 12     Par la suite, en appliquant la même analyse, il est possible de faire ressortir les variables indépendantes ayant une distribution considérée comme normale (signification > 0.05) : -­‐ Loyer moyen : signification = 0.215 -­‐ Population totale : signification = 0.058 -­‐ Ménages de 1 & 2 personnes : signification = 0,157 -­‐ Population active des femmes : signification = 0.182 -­‐ Population active : signification = 0.168 Voir les histogrammes en annexe #4. Afin d’obtenir un maximum de variables dans le modèle, celles qui étaient considérées comme non normales ont été transformées à l’aide d’un modèle mathématique. Le tableau suivant intègre des données transformées. Tableau  3  :  Test  de  normalité  sur  les  données  transformées   Dans le tableau ci-dessus, les variables ayant une distribution initialement non normales on subit une transformation logarithmique. Le tableau #3 permet de retenir comme variables normalement distribuées : -­‐ log prix des logements neufs avec une signification de ,134 -­‐ log des immigrants avec une signification de ,068 La variable de la population de 15 à 54 ans étant importante pour l’analyse, elle sera conservée dans le modèle étant donné que la normalité n’est pas un critère indispensable pour les variables indépendantes.
  • 14. 13     Analyse  de  corrélation   Tableau  4  :  Analyse  de  corrélation  
  • 15. 14     En analysant le contenu du tableau 4, il apparaît que les variables indépendantes ont une faible corrélation avec la variable dépendante : « mise en chantiers de logements », avec une corrélation de Pearson ne dépassant pas les 0,229. Certaines variables présentent même une corrélation négative telles que les ménages de 3 personnes et plus avec une valeur de - 0,42 ou encore la population de 15 à 54 ans avec une valeur de -0,194. Cela nous amène à supposer que les variables indépendantes ont un faible pouvoir explicatif envers la variable dépendante « mise en chantier » Des données sont néanmoins intéressantes à retenir. En effet, les prix des logements neufs ainsi que les loyers moyens présentent une forte corrélation avec les variables indépendantes étudiées. Il apparaît notamment une corrélation positive avec : -­‐ L’immigration : o corrélation de Pearson prix des logements neufs = 0,949 o corrélation de Pearson loyers moyens = 0,964 -­‐ Le revenu moyen : o corrélation de Pearson prix des logements neufs = 0,817 o corrélation de Pearson loyers moyens = 0,840 -­‐ Le Loyer moyen : o corrélation de Pearson prix des logements neufs = 0,995 -­‐ Le prix des logements neufs : o corrélation de Pearson loyers moyens = 0,995 -­‐ La population de 15 à 54 ans : o corrélation de Pearson prix des logements neufs = 0,863 o corrélation de Pearson loyers moyens = 0,866 -­‐ La population totale : o corrélation de Pearson prix des logements neufs = 0,971 o corrélation de Pearson loyers moyens = 0,988 -­‐ Les ménages de 1 et 2 personnes : o corrélation de Pearson prix des logements neufs = 0,969 o corrélation de Pearson loyers moyens = 0,995 -­‐ La population active : o corrélation de Pearson prix des logements neufs = 0,989 o corrélation de Pearson loyers moyens = 0,994
  • 16. 15     -­‐ La population active chez les femmes : o corrélation de Pearson prix des logements neufs = 0,983 o corrélation de Pearson loyers moyens = 0,992 La similitude entre la corrélation des variables « prix des logements neufs » et « loyers moyens et les autres variables est flagrante. Ces 2 variables ont sensiblement la même relation avec les autres variables indépendantes. Certaines variables ont également une corrélation négative, cela signifie qu’il existe une relation linéaire négative entre le prix des logements neufs et : -­‐ Taux d’inoccupation : o corrélation de Pearson prix des logements neufs = -0,367 o corrélation de Pearson loyers moyens = -0,427 -­‐ Les ménages de 3 personnes et plus : o corrélation de Pearson prix des logements neufs = -0,348 o corrélation de Pearson loyers moyens = -0,431 La valeur absolue des coefficients n’étant cependant pas extrêmement forte, la corrélation est donc moins significative que pour les variables précédentes.
  • 17. 16     Tests  de  colinéarité       Cette analyse de régression a été effectuée en incluant toutes les variables du modèle à distribution normale ainsi que la population de 15 à 54 ans. Tableau  5  :  Statistiques  de  colinéarité
  • 18. 17     Afin de se prémunir de risques de multi-colinéarité des données, le coefficient VIF (ou facteur d’inflation de la variance) doit être inférieur à 10. Comme le démontre le contenu du tableau 5, il y a une forte multi-colinéarité des données ce qui vient fausser l’analyse. Il est possible de constater que plus il y a de variables, plus la multi-colinéarité est importante. Cela est d’autant plus marquant pour la population active avec un VIF de 1965,989 et la population active chez les femmes où le VIF est de 1563,447. Les chances sont donc très fortes pour que les deux variables d’expliquent mutuellement. Il a donc été décidé de refaire un modèle en supprimant les variables les plus colinéaires telles que la population active et la population active chez les femmes. Parmi les tests, il fut question de les remplacer les données brutes par des données transformées par un log. Compte tenu de la présence importante de multi-colinéarité, il est accepté que le modèle ne contienne pas que de variables normales. Tableau  6  :  analyse  de  régression  avec  des  variables  log   Il est possible de constater dans le tableau 6 un VIF acceptable pour les variables suivantes : -­‐ Log de la population de 14 à 54 ans : 6.001 < 10 -­‐ Log des taux hypothécaires : 1.603 < 10 -­‐ Log des logements inoccupés : 3.758 < 10 Concernant le log « ménagetrois » (ménage de 3 personnes et plus), le VIF est de 9,574 donc également inférieurs à 10, mais s’en rapproche très fortement, ce qui n’est pas idéal.
  • 19. 18     Afin d’avoir un modèle plus significatif, avec une multi colinéarité moindre, plusieurs tests ont été fait avec l’ensemble des données du modèle. Voici quelques exemples d’autres tests qui ont été effectués. Test 1 : Tableau  7  :  analyse  intégrant  différentes  variables   Dans le tableau 7, il apparaît que le log des immigrants et la population de 15 à 54 ans respecte les tolérances de colinéarité. Le problème se révèle lorsque l’on ajoute la variable loyer moyen. Dans ce cas, le VIF des immigrants passe à 16,302 et le loyer moyen à 24,793. Test 2 : Tableau  8  :  analyse  intégrant  différentes  variables  
  • 20. 19     Le tableau 8, met en évidence que le problème de multi corrélation du modèle dans le tableau 7 était lié à la variable "immigrant" qui présentait une forte colinéarité avec le loyer moyen. Dans le cas présent le modèle ne contient que 2 variables, mais le VIF est acceptable. Test 3 : Tableau  9  :  analyse  intégrant  d'autres  variables   Ce test semble pertinent, néanmoins, il apparaît un coefficient VIF pour la variable immigrants important (>10) ce qui amène un fort risque de multi-colinéarité. Il a donc été décidé de reproduire un modèle sans cette variable. Ce qui a généré le modèle final qui suit dans la prochaine section .
  • 21. 20       Interprétation de la qualité du modèle de régression L’interprétation débute en évaluant la qualité du modèle. On vérifie si la première étape du modèle explique significativement plus de variabilité qu’un modèle sans prédicteur. Ensuite, il s'agit de s'assurer que toutes les variables introduites contribuent à améliorer significativement la variabilité expliquée par le modèle final. Analyse de variance : L’objectif de l’analyse de la variance est de décomposer la variabilité existante dans la variable dépendante en deux sources de variation : une attribuable aux diverses modalités des facteurs considérés et une autre attribuable à toute autre source de variation non prise en considération. Pour tester l’influence du facteur a du tableau 10, la démarche du test de Fisher a été utilisée. 1. Hypothèses statistiques : • Hypothèse nulle : H0 = µ1 = µ2 = … µK (les moyennes sont toutes égales) • Contre-hypothèse : H1 = les µj ne sont toutes égales. 2. Seuil de signification : α = 0,05 3. Conditions d’application du test : On suppose que les observations constituent des échantillons prélevés au hasard et indépendamment de k populations normales de variance identiques σ2 . 4. La statistique qui convient pour le test est le rapport des carrés moyens. En supposant H0 vrai et selon les conditions d’application, la quantité F= CMA/CM RES est distribuée selon la loi de Fisher avec (k-1) et (n-k) degré de liberté. 5. Règle de décision. Au seuil α, la valeur critique F de fisher est Fα ;(k-1),(n-k). Donc F0,05 ;(4),(29) = 2,70 selon les valeurs de la distribution F. 6. Calcul du quotient des carrés moyens : F= CMA/CM RES = 3,463 7. Décision et conclusion : Étant que F est supérieur à la valeur critique (3,462 > 2,70), H0 est rejeté et H1 favorisé. Une influence significative du facteur a est donc présente. L’essentiel de l’analyse de variance se résume au tableau 10 qui permet d’obtenir les deux carrés moyens (les variances) pour tester l’hypothèse nulle. Le tableau 10 reproduit les résultats de l’analyse de variance permettant de vérifier si l’ensemble des variables indépendantes expliquent globalement «Y» de façon significative. Comme il est possible de le constater, le F calculé est de 3,463, ce qui excède la valeur critique de 2,70. La probabilité que ce résultat soit dû au hasard est, en fait, inférieure à 0,05 (colonne Sig). L’hypothèse nulle H0 est donc exclue et, on peut interpréter que l’ensemble des variables indépendantes du modèle explique l’évolution de la mise en chantier de façon significative.
  • 22. 21     ANOVAb 33136356 4 8284088,967 3,463 ,020a 69366730 29 2391956,192 102503085 33 Régression Résidu Total Modèle 1 Somme des carrés ddl Carré moyen F Signification Valeurs prédites : (constantes), TREND(Pop15_54_1), Taux_innoccupation, Taux_ hyp5ans, TREND(Revenu_moyen) a. Variable dépendante : Misenchantierb. Interprétation  de  l'ajustement  du  modèle  de  régression  aux  données   Maintenant que l’on sait que le modèle est significatif, le tableau récapitulatif du modèle permet de déterminer la contribution de bloc de variables. Récapitulatif du modèle(b) Tableau  11  :  Analyse  de  régression   Modèle R R2 R2 ajusté Erreur standard de l'estimation 1a ,569(a) ,323 ,230 1546,59503 2b ,103(b) ,011 -,053 1808,72951 3c ,231(c) ,053 -,008 1769,37600 4d ,250(d) ,062 ,002 1760,80363 5e ,194(e) ,038 -,024 1783,77475 6f ,229(f) ,053 -,009 1769,96418 7g ,448(g) ,201 ,121 1652,44039 8h ,231(h) ,053 -,041 1798,56580 a. Valeurs prédites : (constantes), TREND(Pop15_54_1), Taux_innoccupation, Taux_hyp5ans, TREND(Revenu_moyen) b. Valeurs prédites : (constantes), Taux_innoccupation, Taux_hyp5ans c. Valeurs prédites : (constantes), TREND(Pop15_54_1), Taux_innoccupation d. Valeurs prédites : (constantes), Taux_innoccupation, TREND(Revenu_moyen) e. Valeurs prédites : (constantes), Taux_hyp5ans, TREND(Pop15_54_1) f. Valeurs prédites : (constantes), TREND(Revenu_moyen), Taux_hyp5ans) g. Valeurs prédites : (constantes), TREND(Pop15_54_1), Taux_hyp5ans, TREND(Revenu_moyen) h. Valeurs prédites : (constantes), Taux_innoccupation, Taux_hyp5ans, TREND(Pop15_54_1) b Variable dépendante : Misenchantier Tableau  10:  Analyse  de  variances
  • 23. 22     Corrélation multiple R : La valeur de la corrélation multiple R est un indice standardisé, variant entre -1 et +1, de la force de la relation entre l'ensemble des variables indépendantes et la variable dépendante. C'est la corrélation entre les valeurs prédites et les valeurs réelles. Une valeur de 0,569 pour le modèle 1 suggère que les données sont ajustées au modèle et qu’il existe une relation entre l’ensemble des variables indépendantes et l’évolution des mises en chantier. Quand R > ,75 on peut affirmer qu’il existe une forte relation entre l'ensemble des variables, ce qui n’est pas le cas pour le modèle 1. Les variables suivantes permettent au modèle 1 d’obtenir la meilleure relation entre les variables indépendantes et la variable dépendante : • Population de 15-54 ans ; • Taux d’inoccupation ; • Taux hypothécaire 5 ans ; • Revenu moyen. Corrélation multiple (R2) : Le coefficient de détermination est un indicateur de la performance explicative du modèle. Il représente la proportion de la variation totale de la variable dépendante expliquée par l’ensemble des variables explicatives de l’échantillon. Ainsi, on dira que la combinaison des variables population de 15-54 ans, taux d’inoccupation, taux hypothécaire 5 ans et revenu moyen expliquent seulement 32,3% de la variance de l’évolution des mises en chantier.   Le R² ajusté : Les variables explicatives dans l’équation de régression ont pour effet de faire augmenter le (R²) de façon non proportionnelle au (R²) ajusté. Le coefficient (R²) ajusté expliquerait donc plus précisément le pouvoir explicatif du modèle. L’erreur standard de l’estimation est l’indicateur de la performance prédictive du modèle de régression. Exprimé en nombre dans la forme linéaire du modèle, cet indicateur représente l’erreur commise dans l’estimation des mises en chantiers par le modèle.
  • 24. 23     Coefficientsa -629,338 5525,759 -,114 ,910 -6,901 17,071 -,063 -,404 ,689 ,969 1,032 470,293 205,316 ,607 2,291 ,029 ,333 3,005 ,359 ,105 1,076 3,402 ,002 ,233 4,285 -,050 ,015 -,723 -3,340 ,002 ,498 2,006 (constante) Taux_hyp5ans Taux_innoccupation TREND(Revenu_moyen) TREND(Pop15_54_1) Modèle 1 B Erreur standard Coefficients non standardisés Bêta Coefficients standardisés t Signification Tolérance VIF Statistiques de colinéarité Variable dépendante : Misenchantiera. Évaluation  et  interprétation  des  paramètres  du  modèle     Il a été vérifié que le modèle est significatif et que le modèle 1 est celui qui explique le plus de variance même si le pouvoir explicatif reste faible. Il est tout de même possible de construire l’équation de régression pour prédire une valeur de Y. L’équation de base est la suivante : Yi : (b0 + b1X1 + b2X2 + … + bnXn) + εi En remplaçant maintenant les b par les coefficients fournis dans le tableau ci-dessus : Yprédit = (-629,34 - 6,90taux_hyp5ans + 470,29Taux_innoccupation + 0.36TREND(Revenu_moyen) - 0,05TREND(Pop15_54_1)) Pour 2013, un nombre de mises en chantier prédit de : Yprédit = (-629,34 – 6,90*0,04 +470,29*0,02 + 0,36*73808,30 – 0,05*435770,87) Yprédit = 4162.24 = 4162 mises en chantier en 2013 Le signe du coefficient indique le sens de la relation. Il est à noter que plus le revenu moyen et le taux d’inoccupation augmente, plus le nombre de mise en chantier augmente. On interprète aussi avec l’équation de régression que quand les taux hypothécaires et la population de 15-54 ans diminue, la mise en chantier augmente. Tableau  12  :  Coefficients  du  modèle
  • 25. 24     De plus, le coefficient Beta nous informe également sur le degré auquel les variables indépendantes influencent la variable dépendante si elles sont toutes constantes. Par exemple, le nombre de mises en chantier est diminué de 629 annuellement. Ensuite, la valeur de t nous indique si le coefficient est significatif. Alors que le tableau sur le récapitulatif du modèle confirmait si le modèle était significatif, la signification de t nous permet de répondre si chaque variable contribue significativement au modèle. Plus la valeur de t est élevée, plus la variable contribue au modèle. On constate donc que trois variables sur quatre sont significatives et que la variabilité expliquée par le revenu moyen et la population 15-54 ans sont plus importantes que celle expliquée par le taux d’inoccupation. Finalement, la valeur VIF des variables indépendantes tend vers 1 et est en déca de 5. Une valeur VIF de 10 est problématique au niveau de la multi-colinéarité. En observant le tableau 13 construit à partir de l’équation de régression pour prédire une valeur de Y, on peut constater de faibles et de grandes différences entre le Yprédit et la valeur réelle de la variable dépendante mise en chantier. Les variables indépendantes revenu moyen des ménages et la population 15-54 ans font varier fortement à la hausse ou à la baisse l’évolution de la mise en chantier de la RMR de Québec.
  • 26. 25     Tableau  13  :  Équation  de  régression  pour  prédire  une  valeur  de  "y"  
  • 27. 26     Figure  6  :  nuages  de  dispersion  des  variables  indépendantes  retenues   Les graphiques ci dessus permettent d’illustrer les relations entre la variable dépendante et les variables indépendantes. En analysant ces graphiques, il n’apparaît pas de relation claire entre la variable dépendante et chaque variable prise individuellement.  
  • 28. 27     Conclusion  et  interprétation  globale   Les résultats ont montré que le revenu moyen des ménages et la population 15-54 ans sont des variables significative pour le modèle présenté. Par contre, le modèle mis de l’avant par notre étude ne permet pas d’affirmer qu’il est prédicteur de l’évolution de la mise en chantier de la RMR de Québec car il n’explique pas de façon significative la compréhension de la situation. En fait, l’étude effectuée ne démontre pas suffisamment la pertinence de faire intervenir les valeurs de notre modèle dans l'explication. Parmi les valeurs qui pourraient expliquer de façon plus probante l’évolution de la mise en chantier, l'importance accordée au vieillissement de la population et l’activité économique propre de la RMR apparaîtrait comme les plus importantes. Les limites ayant empêché de rendre le modèle plus pertinent ont tout d’abord été l’obligation d’interpoler et extrapoler les données afin de les obtenir par années de 1980 à 2013 pour chacune des variables. La distribution normale était respectée que pour une faible partie de l’ensemble des variables de l’étude. Et le problème majeur provient de la multi-colinéarité des variables ce qui a obligé de réduire le modèle à simplement 4 variables indépendantes. De plus il est à noter que l’évolution de la mise en chantier est une question peu documentée par les chercheurs qui se sont penchés sur divers sujets connexes comme le besoin en logements ou le prix de ventes des propriétés pour la RMR de Québec. On retrouve davantage de données provinciales que de données reliées à la RMR de Québec.     En conclusion, l'analyse des données indique clairement que l'hypothèse de cette recherche, selon laquelle l’évolution de la mise en chantier est expliqué par le revenu moyen des ménages, du nombre de personnes composant la population des 15-54 ans, des taux hypothécaire 5 ans et du taux d’inoccupation n’est pas confirmée.    
  • 29. 28     Bibliographie Statistique Canada : CANSIM Construction résidentielle : [en ligne] http://www5.statcan.gc.ca/cansim/a33?RT=TABLE&themeID=2166&spMode=tables&la ng=fra (page consultée le 20 novembre 2014) Divorces et séparation : [en ligne] http://www5.statcan.gc.ca/cansim/a33?RT=TABLE&themeID=40001&spMode=tables& lang=fra (Page consultée le 21 novembre 2014) Emploi et chômage : [en ligne] http://www5.statcan.gc.ca/cansim/a33?RT=TABLE&themeID=1803&spMode=tables&lang=fra (page consultée le 21 novembre 2014) Immigration : [en ligne] http://www5.statcan.gc.ca/cansim/a33?lang=fra&spMode=master&themeID=30000&RT=TABL E (Page consultée le 13 novembre) Bibliothèque de l’Université Laval, données Recensement Statistique Canada, Dictionnaire du recensement 1981 [en ligne] http://ariane.ulaval.ca/cgi- bin/recherche.cgi?qu=01-1116321 (page consultée le 3 novembre 2014) Statistique Canada, Dictionnaire du recensement1986 [en ligne] http://ariane.ulaval.ca/cgi- bin/recherche.cgi?qu=01-1356834 (Page consultée le 3 novembre 2014) Statistique Canada, Dictionnaire du recensement 1991 [en ligne] http://ariane.ulaval.ca/cgi- bin/recherche.cgi?qu=01-0061667 (Page consultée le 3 novembre 2014) Statistique Canada, Dictionnaire du recensement 1996 [en ligne] http://ariane.ulaval.ca/cgi- bin/recherche.cgi?qu=01-0521272 (Page consultée le 4 novembre 2014) Statistique Canada, Dictionnaire du recensement 2001 [en ligne] http://ariane.ulaval.ca/cgi- bin/recherche.cgi?qu=01-0641765 (Page consultée le 4 novembre 2014) Statistique Canada, Dictionnaire du recensement 2006 [en ligne] http://ariane.ulaval.ca/cgi- bin/recherche.cgi?qu=a1591874 (Page consultée le 3 novembre 2014) Université Laval. Bibliothèque. Données statistiques en ligne http://www.bibl.ulaval.ca/web/economique/donnees-statistiques (Page consultée le 1 novembre 2014)
  • 30. 29     Autres sites internet Université de Sherbrooke, SPSS17 [en ligne] : http://spss.espaceweb.usherbrooke.ca/pages/stat- inferentielles/regression-multiple.php (Page consultée le 25 novembre 2014) Université de Montréal, Département de sociologie, L’analyse de régression multiple [en ligne] https://www.webdepot.umontreal.ca/Enseignement/SOCIO/Intranet/SOL6210/public/notesdecour s/REGRES.pdf (document PDF consultée le 25 novembre 2014) Société canadienne d’hypothèque et du logement [en ligne] https://www.cmhc- schl.gc.ca/fr/index.cfm (page consultée le 31 octobre 2014) Société canadienne d’hypothèque et de logement, Perspectives du marché de l’habitation, RMR de Québec [en ligne] http://www.cmhc- schl.gc.ca/odpub/esub/64281/64281_2014_B02.pdf?fr=1417909487534 (document PDF consultée le 6 décembre 2014) Magazine FORCES - Le marché immobilier au Québec [en ligne] http://www.magazineforces.com/quebec/le-marche-immobilier-au-quebec-atterr (Page consultée le 3 décembre 2014) UQAM, Table B.3b 5% Critical Values of the F Distribution [en ligne] http://www.er.uqam.ca/nobel/k23546/eco8600/tables/FisherCValues-0.05.png (Page consultée au 2014-12-05) Université LAVAL – Gestion urbaine et immobilière, La modélisation statistique en analyse et évaluation immobilières, Guide méthodologique par François DES ROSIERS (document PDF) Gaston Quirion, M.S.I. (Conseiller à la documentation, Information statistique)
  • 31. 30     ANNEXE  1  :  Carte  de  la  RMR  de  Québec    
  • 32. 31     Années Taux hypotécaire Taux d'innocupation Indice du prix du neuf Mise en chantier résidentiel Revenu moyen par menages Loyer moyen 1980 14,32 2,8 35,05 3545 63700 315,92 1981 18,15 1,8 38,23 3746 63100 327,41 1982 17,89 4,8 40,48 3071 61600 338,9 1983 13,29 5,2 43,19 4622 60200 350,39 1984 13,61 1,9 45,32 3719 60300 361,88 1985 12,18 1,5 47,7 6140 61700 373,37 1986 11,22 3,2 50,97 7734 62600 384,86 1987 11,14 5,6 55,5 8646 63200 396,35 1988 11,6 5,2 60,33 6133 64400 407,84 1989 12,05 4,6 64,52 6300 66000 419,33 1990 13,24 6,1 66,65 5972 64100 455 1991 11,16 5,7 68,53 6523 61700 479 1992 9,52 6,7 69,06 6300 61400 485 1993 8,7 6,2 68,83 4699 59800 493 1994 9,34 7,1 68,49 4677 60500 491 1995 9,22 6,2 68,98 2405 60800 493 1996 7,94 6,4 68,04 2208 61000 491 1997 7,07 6,5 67,75 2233 61400 493 1998 6,9 5,1 68,14 1845 64200 496 1999 7,39 3,4 69,31 1814 65900 497 2000 8,2 1,5 70,78 2275 67800 505 2001 7,18 0,7 72,56 2555 68900 523 2002 6,7 0,4 75,69 4282 68900 536 2003 6,04 0,4 82,63 5599 68500 555 2004 5,8 1,1 87,61 6186 69700 581 2005 5,48 1,5 91,44 5835 70300 600 2006 100 1,5 96,2 5176 72100 619 2007 6,36 1,4 100 5284 74300 620 2008 6,41 0,6 105,3 5457 75200 631 2009 5,05 0,5 112,64 5513 74500 655 2010 4,82 1,1 116,25 6652 74900 675 2011 4,57 1,6 117,93 5445 75000 699 2012 4,24 2,1 121,38 6416 73354,44 712 2013 4,17 2,4 122,68 4680 73808,3 727 ANNEXE  2  :  Base  de  données            
  • 33. 32     Population de 15 à 54 ans Population totale Ménages de 1 à 2 pers. Ménages de 3 et plus Nombre d' immigrants Population active totale Population active chezles femmes 352454 569291,6 88943 100349 8607,39 282575,5 111815 358085 576075 93890 101575 12270 280960 116620 356970 577355 97734 102322 12544 286161 118628 355855 578635 101578 103069 12818 291362 120636 354740 579915 105422 103816 13092 296563 122644 353625 581195 109266 104563 13366 301764 124652 352510 582475 113110 105310 13640 306965 126660 361981 595090 119818 105591 13706 315204 133047 371452 607705 126526 105872 13772 323443 139434 380923 620320 133234 106153 13838 331682 145821 390394 632935 139942 106434 13904 339921 152208 399865 645550 146650 106715 13970 348160 158595 403196 650815 150989 106889 14657,2 348845 159521 406527 656080 155328 107063 15344,4 349530 160447 409858 661345 159667 107237 16031,6 350215 161373 413189 666610 164006 107411 16718,8 350900 162299 416520 671875 168345 107585 17406 351585 163225 414958 674050 173504 106261 17846,8 355111 165747 413396 676225 178663 104937 18287,6 358637 168269 411834 678400 183822 103613 18728,4 362163 170791 410272 680575 188981 102289 19169,2 365689 173313 408710 682750 194140 100965 19610 369215 175835 408444 689303 198800 100591 20927 375730 179481 408178 695856 203460 100217 22244 382245 183127 407912 702409 208120 99843 23561 388760 186773 407646 708962 212780 99469 24878 395275 190419 407380 715515 217440 99095 26195 401790 194065 409192 725553,2 222920 99485 27531 406892 199086,6 411004 735591,4 228400 99875 28867 411994 202326,6 412816 745629,6 233880 100265 30203 417096 205566,5 414628 755667,8 239360 100655 31539 422198 208806,5 416440 765706 244840 101045 32875 427300 212046,5 433301,8 759679,7 248936,2 102489,3 29427,45 427963,5 215286,5 435770,9 765766,3 253969 102480,2 30078,08 432506,9 218526,4    
  • 34. 33     ANNEXE  3  :  Histogramme  et  nuage  de  points  du  modèle  de  régression                      
  • 35. 34     ANNEXE  4  :  Histogrammes  et  Normogrammes  Q-­‐Q  du  test  de  normalité                
  • 36. 35          
  • 37. 36        
  • 38. 37        
  • 39. 38        
  • 40. 39     Descriptives 4814,3235 302,25399 4199,3832 5429,2639 4788,2908 5230,0000 3106154,1 1762,4285 1814,00 8646,00 6832,00 2725,00 -,151 ,403 -,643 ,788 3,3176 ,38986 2,5245 4,1108 3,2788 2,6000 5,168 2,27323 ,40 7,10 6,70 4,15 ,264 ,403 -1,572 ,788 11,7926 2,74759 6,2026 17,3827 9,1865 8,4500 256,674 16,02106 4,17 100,00 95,83 5,80 5,349 ,403 30,123 ,788 66319,492 906,16661 64475,882 68163,102 66183,750 64300,000 27918689 5283,8139 59800,00 75200,00 15400,00 9200,00 ,483 ,403 -1,263 ,788 396177,25 4364,201 387298,22 405056,29 396461,88 408045,00 6E+008 25447,444 352454,0 435770,9 83316,87 43825,00 -,725 ,403 -,870 ,788 Moyenne Borne inférieure Borne supérieure Intervalle de confiance à 95% pour la moyenne Moyenne tronquée à 5% Médiane Variance Ecart-type Minimum Maximum Intervalle Intervalle interquartile Asymétrie Aplatissement Moyenne Borne inférieure Borne supérieure Intervalle de confiance à 95% pour la moyenne Moyenne tronquée à 5% Médiane Variance Ecart-type Minimum Maximum Intervalle Intervalle interquartile Asymétrie Aplatissement Moyenne Borne inférieure Borne supérieure Intervalle de confiance à 95% pour la moyenne Moyenne tronquée à 5% Médiane Variance Ecart-type Minimum Maximum Intervalle Intervalle interquartile Asymétrie Aplatissement Moyenne Borne inférieure Borne supérieure Intervalle de confiance à 95% pour la moyenne Moyenne tronquée à 5% Médiane Variance Ecart-type Minimum Maximum Intervalle Intervalle interquartile Asymétrie Aplatissement Moyenne Borne inférieure Borne supérieure Intervalle de confiance à 95% pour la moyenne Moyenne tronquée à 5% Médiane Variance Ecart-type Minimum Maximum Intervalle Intervalle interquartile Asymétrie Aplatissement Misenchantier Taux_innoccupation Taux_hyp5ans TREND(Revenu_moyen) TREND(Pop15_54_1) Statistique Erreur standard ANNEXE  5  :  Test  de  normalité  sur  les  variables  retenues