Application des R´esaeaux de Neurones en Finance
Lamrani Alaoui Youssef
Mohamed Ali Khouaja
Rachid Ait Lhaj
Universit´e Ca...
Introduction g´en´erale
Pour faire face aux diff´erents risques qui nuisent leurs
stabilit´es les banques cherchent en perm...
Introduction g´en´erale
Un des probl`emes principaux auxquels font face les banques
c’est leur incapacit´e `a d´eterminer ...
pr´esentation de la base donn´ee d’´etude
Notre base de donn´ees d’´etudes est constitu´ee d’un ´echantillon de
5960 indiv...
variable description
BAD 0 si le client a rembours´e sa dette et 1 sinon
CLAG l’ˆage de cr´edit le plus ancien par mois
CL...
Figure: une partie de base de donn´ees d’´etude
0 1
BAD
qualité de client
01000200030004000
DebtCon HomeImp
RAISON
01000200030004000
Figure: repr´esentation de la variabl...
% d’observations
debtcon 68.4
homeImp 31.6
Table: % des modalit´es de la variables REASON
% d’observations
0 80.1
1 19.9
T...
Comme tout projet de data mining on doit suivre les phases de
construction des mod`eles suivantes :
1 L’exploration et le ...
l’exploration et le traitement des donn´ees
une fois ces ´etapes sont r´ealis´e on on conclue que :
le pourcentage des don...
> data<-read.table("fichier3.txt",head=T)
> #lire la base de donn´ees
> data<-subset(data,select=-c(2))
> #suppression de ...
La d´etection des variables les plus discriminantes
Cette phase est int´eressant avant l’´elaboration des mod`eles
pr´edic...
La d´etection des variables les plus discriminantes
´etape AIC Variableajout´ee
2 5071.73 CLAG
3 4906.01 DEROG
4 4855.24 N...
Construction des ´echantillons test et d’apprentissage
on divise la population en deux sous populations : une
premi`ere qu...
La d´etection des variables les plus discriminantes
> set.seed(12345)
> d = sort(sample(nrow(data), nrow(data) * 0.65))
> ...
´Elaboration du mod`eles pr´edictif
Les r´eseaux de neurones sont des outils puissants pour pr´edire
des ph´enom`enes non ...
Param`etres de complexit´e
Le mod`ele d´epend de plusieurs param`etres :
1 l’architecture du r´eseau : nombre de couches c...
Nous avons choisi les diff´erents param`etres du MLP `a la main ,
grˆace la fonction tune.nnet de R qui a nous permet de fix...
> library(e1071)
> tune.model = tune.nnet(BAD ~ ., data = appren,
+ size = c( 3, 5),decay = c(0.1, 0.001))
> tune.model
Pa...
> plot(tune.model)
0.140
0.142
0.144
0.146
0.148
3.0 3.5 4.0 4.5 5.0
0.02
0.04
0.06
0.08
0.10
Performance of `nnet'
size
d...
Validation du mod`ele
L’´Evaluation des performances d’un mod`ele de pr´ediction est une
´etape primordiale qui s’effectue ...
Matrice de confusion et le taux de bon classement
la matrice de confusion permet de comparer les valeurs pr´edites par
le ...
> pred_RN = predict(model, newdata = test,type="class")
> #pr´ediction de la qualit´e de nouveaux clients
> mat = table(pr...
La courbe ROC
la courbe ROC r´esume les performances de toutes les r`egles de
classement que l’on peut obtenir en faisant ...
ROC Réseaux de neurones
Truepositiverate
0.0 0.2 0.4 0.6 0.8 1.0
0.00.20.40.60.81.0
00.20.40.60.81Lamrani Alaoui Youssef M...
la surface sous la courbe ROC
La surface situ´ee sous la courbe ROC not´ee AUC, c’est une mesure
de la performance d’un sc...
ANN toolbox sous MATLAB
En utilisant l’outil ANN toolbox sous MATLAB, on verra comment
pr´edir, `a partir des donn´ees du ...
ANN toolbox sous MATLAB
Nous savons que RNA dependent des donn´ees de l’entr´ee, une
d´ependance qui peut ˆetre non lin´ea...
ANN toolbox sous MATLAB
L’impl´ementation est simple :
On retient juste le cours d’ouverture et la ligne de temps
comme En...
ANN toolbox sous MATLAB
On retient le fichier excel de type ”.csv”
Ensuite, on pr´epare la base de donn´ees `a ˆetre utilis...
ANN toolbox sous MATLAB
Ensuite, on importe le fichier .csv en MATLAB
uiopen( C : /Users/med/Downloads/tablegoog.csv , 1)
L...
ANN toolbox sous MATLAB
On peut mˆeme g´en´erer une fonction pour notre mod`ele RNA
Lamrani Alaoui Youssef Mohamed Ali Kho...
ANN toolbox sous MATLAB
Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones e...
Prochain SlideShare
Chargement dans…5
×

Application des réseaux de neurones artificiels en finance

1 185 vues

Publié le

Application des réseaux de neurones artificiels en finance

Publié dans : Données & analyses
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
1 185
Sur SlideShare
0
Issues des intégrations
0
Intégrations
6
Actions
Partages
0
Téléchargements
47
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Application des réseaux de neurones artificiels en finance

  1. 1. Application des R´esaeaux de Neurones en Finance Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Universit´e Cadi Ayyad,Facult´e des Sciences et Techniques de Marrakech,Ing´enieurie en Actuariat et Finace 1er f´evrier 2015 Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  2. 2. Introduction g´en´erale Pour faire face aux diff´erents risques qui nuisent leurs stabilit´es les banques cherchent en permanence `a am´eliorer leurs syst`emes de surveillance et `a prendre plus de pr´ecaution Le d´efit des banques aujourd’hui est la sp´ecification des mod`eles les plus robustes Permettant l’am´elioration de la pr´ecision de la mesure du risque de cr´edit. Dans le cadre de notre projet l’objectif principal est de construire un mod`ele de scoring pour la pr´ediction de risque de d´efauts des particuliers d’une entreprise am´ericaine en se basant sur une technique de l’intelligence artificielles `a savoir les r´eseaux de neurones Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  3. 3. Introduction g´en´erale Un des probl`emes principaux auxquels font face les banques c’est leur incapacit´e `a d´eterminer avec certitude si le client va honorer ses engagements et rembourser l’emprunt en totalit´e, ou s’il va simplement faire d´efaut. Le scoring a ´et´e d´evelopp´e dans cette optique, avec des outils de plus en plus pointus. En r´esum´e, il s’agit de d´etecter les ”mauvais payeurs ”`a partir d’une s´erie de caract´eristiques mesur´ees sur des individus, en vue d’accorder ou refuser un prˆet financier. Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  4. 4. pr´esentation de la base donn´ee d’´etude Notre base de donn´ees d’´etudes est constitu´ee d’un ´echantillon de 5960 individus et 13 variables import´ees de la biblioth`eque SAS de la base de donn´ees SAMPSIO.HMEQ. Il y a des variables qui sont propres aux clients et des autres relatives au cr´edit. Le tableau suivant d´ecrit les diff´erentes variables et aussi leurs rˆoles. Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  5. 5. variable description BAD 0 si le client a rembours´e sa dette et 1 sinon CLAG l’ˆage de cr´edit le plus ancien par mois CLNO le nombre de cr´edits DEBTINC taux de cr´edit -`a-revenu DELINQ nombre de cr´edits non rembours´es DEROG nombre d’´etats d´erogatoires principaux JOB cat´egorie prof´essionnelle du client LOAN montant du cr´edit YOJ Anciennet´e du travail le plus r´ecent VALUE la valeur de la propr´eit´e MORTDUE montant dˆu sur l’hypoth`eque existante NINQ nombre d’enquˆetes r´ecentes de degr´e de solvabilit´e REASON Debtcon 1 HomeImp 2 1. cr´edit de consolidation 2. cr´edit immobilier
  6. 6. Figure: une partie de base de donn´ees d’´etude
  7. 7. 0 1 BAD qualité de client 01000200030004000 DebtCon HomeImp RAISON 01000200030004000 Figure: repr´esentation de la variable BAD et REASON Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  8. 8. % d’observations debtcon 68.4 homeImp 31.6 Table: % des modalit´es de la variables REASON % d’observations 0 80.1 1 19.9 Table: %des modalit´es de la variables BAD Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  9. 9. Comme tout projet de data mining on doit suivre les phases de construction des mod`eles suivantes : 1 L’exploration et le traitement des donn´ees et ce afin de s´electionner les variables les plus discriminantes 2 ´Elaboration du mod`ele pr´edictif en fonctions des variables discriminantes et en utilisant les r´eseaux de neurones 3 validation du mod`ele en se basant sur des indicateurs de validation comme la corbe ROC et le taux de bon classement Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  10. 10. l’exploration et le traitement des donn´ees une fois ces ´etapes sont r´ealis´e on on conclue que : le pourcentage des donn´ees manquantespour la variable DEBTINC d´epasse 21% alors on va renoncer `a l’exploiter.pour les autres variables on fait appel au package (mice) de R et qui va nous permettre de faire une imputation multiple. il y a une forte corr´elation entre la variables MORTDUT et VALUE d’o`u l’importance d’´eliminer l’une des deux afin d’´eviter toute redondance d’information, on a opt´e pour L’´elimination de MORTDUT.Pour les variables qualitatives le V de Cramer ne d´etecte aucune corr´elation entre elles. Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  11. 11. > data<-read.table("fichier3.txt",head=T) > #lire la base de donn´ees > data<-subset(data,select=-c(2)) > #suppression de la variables MORTDUT > data<-subset(data,select=-c(7)) > #supprimer la variable DEBTINC > data$BAD<-factor(data$BAD) > #faire comprendre au logiceil > #que la variable BAD est binaire Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  12. 12. La d´etection des variables les plus discriminantes Cette phase est int´eressant avant l’´elaboration des mod`eles pr´edictifs, une telle tˆache est effectu´ee par un test de comparaison des moyennes ou des m´edians pour les variables quantitatives, test de khi-deux et le coefficient v de cramer pour les variables qualitatives, une s´election automatique est aussi disponible sous R et qui se base sur la minimisation des deux crit`eres AIC et BIC S´election automatique des variables la s´election des variables pourra s’effectuer automatiquement en se basant sur des diff´erentes m´ethodes Backward,Forward ou Stepwise. En g´en´erale la m´ethode Stepwise donne le meilleur r´esultat, pour notre cas elle a s´electionn´e toutes les variables, le r´esultat de de cette m´ethode est donn´e dans le tableau suivant : Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  13. 13. La d´etection des variables les plus discriminantes ´etape AIC Variableajout´ee 2 5071.73 CLAG 3 4906.01 DEROG 4 4855.24 NINQ 5 4807.48 JOB 6 4785.45 LOAN 7 4776.68 REASON 8 4769.15 VALUE 9 4766.19 YOJ 10 4763.52 CLNO Table: s´election automatique des variables Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  14. 14. Construction des ´echantillons test et d’apprentissage on divise la population en deux sous populations : une premi`ere qui comprend 65% de la population : on l’appelle ´echantillon d’apprentissage et le 35% restantes constituent l’´echantillon test. Le premier ´echantillon permet de mod´eliser le mod`ele et de construire les r`egles d’affectation d’un individu selon ses caract´eristiques. l’´echantillon test a pour objectif de v´erifier si le mod`ele fond´e sur l’´echantillon d’apprentissage est statistiquement fiable. Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  15. 15. La d´etection des variables les plus discriminantes > set.seed(12345) > d = sort(sample(nrow(data), nrow(data) * 0.65)) > appren <- data[d, ] > # Echantillon de test > test <- data[-d, ] Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  16. 16. ´Elaboration du mod`eles pr´edictif Les r´eseaux de neurones sont des outils puissants pour pr´edire des ph´enom`enes non lin´eaires. Les pr´edicteurs X1, X2, ..., Xp sont g´en´eralement num´eriques. Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  17. 17. Param`etres de complexit´e Le mod`ele d´epend de plusieurs param`etres : 1 l’architecture du r´eseau : nombre de couches cach´ees (une ou deux en g´en´eral) et le nombrede neurones par couche 2 le nombre d’it´eration, l’erreur maximale tol´er´ee Les param`etres de r´eglage sont difficiles `a d´efinir correctement.dans notre cas nous voulons exp´erimenter un mod`ele de type perceptron multicouche(MLP) avec en entr´ee des variables explicatives num´eriques et qualitatives et en sortie la variable binaire (BAD) `a pr´evoir. La librairie nnet sous R est limit´ee aux perceptrons `a une seule couche cach´ee, mais cela est th´eoriquement suffisant pour approcher n’importe quelle fonction `a condition d’ins´erer suffisamment de neurones. Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  18. 18. Nous avons choisi les diff´erents param`etres du MLP `a la main , grˆace la fonction tune.nnet de R qui a nous permet de fixer nombre de neurones de la couche cach´ee ainsi que le param`etre de r´egularisation decay en 0.1,autrement on a augment´e le nombre maximum d’it´erations afin de garantir la Convergence de Notre algorithme. > library(nnet) > set.seed(06072012) > model = nnet(BAD ~ ., data =appren, size = 5, + decay = 0.001,maxit=300) Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  19. 19. > library(e1071) > tune.model = tune.nnet(BAD ~ ., data = appren, + size = c( 3, 5),decay = c(0.1, 0.001)) > tune.model Parameter tuning of 'nnet': - sampling method: 10-fold cross validation - best parameters: size decay 5 0.001 - best performance: 0.1396528 Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  20. 20. > plot(tune.model) 0.140 0.142 0.144 0.146 0.148 3.0 3.5 4.0 4.5 5.0 0.02 0.04 0.06 0.08 0.10 Performance of `nnet' size decay Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  21. 21. Validation du mod`ele L’´Evaluation des performances d’un mod`ele de pr´ediction est une ´etape primordiale qui s’effectue via plusieurs ndicateurs : la matrice de confusion,le taux de bon classement,la courbe ROC et la surface sous cette courbe . Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  22. 22. Matrice de confusion et le taux de bon classement la matrice de confusion permet de comparer les valeurs pr´edites par le mod`ele avec les valeurs observ´ees : Le taux de bon classement est le taux d’instances biens class´ees (TBC) ,il repr´esente la proportion de vrais cas : vrais positifs et vrais n´egatifs dans la population. Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  23. 23. > pred_RN = predict(model, newdata = test,type="class") > #pr´ediction de la qualit´e de nouveaux clients > mat = table(pred_RN,test$BAD) # matrice de confusion > print(mat) pred_RN 0 1 0 1654 244 1 31 157 > taux = sum(diag(mat))/sum(mat) > #taux de bon classement > print(taux) [1] 0.8681687 Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  24. 24. La courbe ROC la courbe ROC r´esume les performances de toutes les r`egles de classement que l’on peut obtenir en faisant varier le seuil de d´ecision > require(ROCR) > pred = predict(model, newdata = test) > predict<-prediction(pred[,1],test$BAD) > perf6 <- performance(predict,"tpr","fpr") > plot(perf6,colorize=TRUE,main="ROC R´eseaux de neurones") Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  25. 25. ROC Réseaux de neurones Truepositiverate 0.0 0.2 0.4 0.6 0.8 1.0 0.00.20.40.60.81.0 00.20.40.60.81Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  26. 26. la surface sous la courbe ROC La surface situ´ee sous la courbe ROC not´ee AUC, c’est une mesure de la performance d’un score,et la qualit´e de discrimination du mod`ele en traduisant la probabilit´e qu’un bon client aura un score sup´erieure au score d’un mauvais client,Elle varie entre 0 et 1 en pratique 0.5 et 1, car si AUC < 0.5, cela signifie que les scores ont ´et´e invers´es. La valeur de AUC du mod`ele est la suivante : > auc_rn<-performance(predict,"auc") > attr(auc_rn,"y.values") #calcul de l'AUC > 0.8073437 Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  27. 27. ANN toolbox sous MATLAB En utilisant l’outil ANN toolbox sous MATLAB, on verra comment pr´edir, `a partir des donn´ees du march´e, les prix des actifs (Google comme exemple). Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  28. 28. ANN toolbox sous MATLAB Nous savons que RNA dependent des donn´ees de l’entr´ee, une d´ependance qui peut ˆetre non lin´eaire pour produire la sortie. Nous allons ainsi voir comment lier cet outil au r´eseau internet afin de pouvoir pr´edire en se basant sur des donn´ees actualis´ees. Nous allons nous recourir au site finance.yahoo.com pour t´el´echarger l’historique des prix et pouvoir ainsi analyser l’actif Google (GOOG) Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  29. 29. ANN toolbox sous MATLAB L’impl´ementation est simple : On retient juste le cours d’ouverture et la ligne de temps comme Entr´ees. Programmer le cours de clˆoture comme Sortie Pour commencer, on t´el´echarge l’historique des cours du 1er janvier 2012 jusqu’aujourd’hui Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  30. 30. ANN toolbox sous MATLAB On retient le fichier excel de type ”.csv” Ensuite, on pr´epare la base de donn´ees `a ˆetre utiliser sous MATLAB. Pour ce faire, on trie les donn´ees par date Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  31. 31. ANN toolbox sous MATLAB Ensuite, on importe le fichier .csv en MATLAB uiopen( C : /Users/med/Downloads/tablegoog.csv , 1) Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  32. 32. ANN toolbox sous MATLAB On peut mˆeme g´en´erer une fonction pour notre mod`ele RNA Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance
  33. 33. ANN toolbox sous MATLAB Lamrani Alaoui Youssef Mohamed Ali Khouaja Rachid Ait Lhaj Application des R´esaeaux de Neurones en Finance

×