1. BANKING SECTOR ANALYSIS OF IZMIR PROVINCE:
A GRAPHICAL DATA-MINING ANALYSIS
(R SOFTWARE APPLICATIONS)
10:19:11
FATMA ÇINAR MBA, CAPITAL MARKET BOARD OF TURKEY
Assoc. Prof. Dr. C. ÇOŞKUN KÜÇÜKÖZMEN İZMİR UNIVERSITY OF ECONOMICS
34.Operations
Research&Industrial
Engıneerıng National
Congress 25-27 June
2014
2. 10:19:11
Gerçek Zamanlı İnteraktif Data Analizi
Effect and Response Analysis
Araç; R Yazılımının Lattice ve ggplot2 Grafik
Paketleri kullanılacak
İzmir Dataset
Graphics Data-
Mining Analysis
3. Agenda Dataset Kaynağı: İzmir vb. şehirlerin Finansal
verileri (BDDK)
İzmir main dataset
Sahip Bilgisi: 15 şehir ve 6 hesap yılının Grafik
Data Mining Analizi
Dönem: 2008-2013 Hesp. İşlm.
Dataset’indeki veriler yıl ve şehir faktörlerine göre
set edildi.
Basic bir datayı faktörleştirilerek analiz ediyoruz.
10:19:11
4. 10:19:11
summary(Dataset)
ILKOD SEHIR SYIL NYIL AY
Min. : 1.00 ADANA : 22 Y2008:60 Min. :2008 Min. : 3.000
1st Qu.:16.00 ANKARA : 22 Y2009:60 1st Qu.:2009 1st Qu.: 3.000
Median :33.00 ANTALYA : 22 Y2010:60 Median :2010 Median : 6.000
Mean :29.67 BURSA : 22 Y2011:60 Mean :2010 Mean : 7.227
3rd Qu.:42.00 DENİZLİ : 22 Y2012:60 3rd Qu.:2012 3rd Qu.: 9.000
Max. :55.00 GAZİANTEP: 22 Y2013:30 Max. :2013 Max. :12.000
(Other) :198
SDONEM NDONEM TOPNAKDIKREDI NAKDIKREDI
D200803: 15 Min. :200803 Min. : 2301180 Min. : 2249452
D200806: 15 1st Qu.:200906 1st Qu.: 5006994 1st Qu.: 4775867
D200809: 15 Median :201011 Median : 9001388 Median : 8623443
D200812: 15 Mean :201035 Mean : 14542560 Mean : 14003463
D200903: 15 3rd Qu.:201203 3rd Qu.: 15756949 3rd Qu.: 15263775
D200906: 15 Max. :201306 Max. :113564461 Max. :110692193
(Other):240
TAKIPALACAK GNAKDIKREDI TASIT KONUT
Min. : 39600 Min. : 215400 Min. : 34377 Min. : 313429
1st Qu.: 251686 1st Qu.: 971274 1st Qu.: 70138 1st Qu.: 625852
Median : 339949 Median : 1923710 Median :106403 Median : 944120
Mean : 539097 Mean : 4654118 Mean :168232 Mean : 1740547
3rd Qu.: 599559 3rd Qu.: 2933005 3rd Qu.:213790 3rd Qu.: 1812319
Max. :2872268 Max. :62782383 Max. :789062 Max. :13037891
KMH DIGERTUKETICI KREDIKARTI TAKIPTASIT
Min. : 13457 Min. : 329107 Min. : 2929 Min. : 1454
1st Qu.: 37365 1st Qu.: 728700 1st Qu.: 503812 1st Qu.: 3398
Median : 56261 Median : 1215660 Median : 828166 Median : 5354
Mean : 88532 Mean : 1815939 Mean :1197707 Mean : 8673
5. AMACIMIZ
10:19:11
Yöneticilerin, IT dünyasının
karmaşık kavram ve süreçlerinden
arındıran, interaktif ve yalın
görseller aracılığı ile veri
bankalarının karmaşıklığını yok
eden bir yaklaşımla stratejik karar
verme pozisyonuna
ulaştırabilmektir.
Yöneticilerin, IT dünyasının karmaşık kavram ve süreçlerinden arındıran,
interaktif ve yalın görseller aracılığı ile veri bankalarının karmaşıklığını yok
eden bir yaklaşımla stratejik karar verme pozisyonuna ulaştırabilmektir.
13. Topnakdi
Kredi X
TakipAlaca
k Scatter
Plot Grafiği
(lattice)
10:19:11
14. Topnakdi
Kredi X
TakipAla
cak Şehir
Faktörüne
göre
Scatter
Plot
Grafiği
(lattice)
10:19:11
15. Topnakdi
Kredi X
Takip
Alacak Yıl
Faktörüne
göre
Scatter
Plot
Grafiği
(lattice)
10:19:11
16. Takip
Alacak X
Takip
Enerji
Scatter
Plot
Grafiği
(lattice)
10:19:12
17. Takip
Alacak X
Takip
Enerjinin
Şehir
Faktörüne
göre
Scatter
Plot
Grafiği
10:19:12
18. Takip
Alacak X
Takip
Enerjinin
Yıl
Faktörüne
göre
Scatter
Plot
Grafiği
(lattice)
10:19:12
19. Takip
Alacak X
Takip
Taşıt
Scatter
Plot
Grafiği
(lattice)
10:19:11
20. Takip
Alacak X
Takip
Taşıt Şehir
Faktörüne
göre
Scatter
Plot
Grafiği
(lattice)
10:19:11
21. Takip
Alacak X
Takip
Taşıt Yıl
Faktörüne
göre
Scatter
Plot
Grafiği
(lattice)
10:19:11
22. Takipalaca
k X Takip
Enerji
Şehir ve Yıl
Faktörüne
göre XY
Plot
Grafiği
(lattice)
10:19:11
23. Takipalacak
X Takip
Konut Şehir
ve Yıl
Faktörüne
göre XY
Plot Grafiği
(lattice)
10:19:12
24. Toplam
Nakdi Kredi
X Takip
Alacak Yıl
ve Antalya
Faktörüne
göre XY
Plot Grafiği
(lattice)
10:19:12
25. Toplam
Nakdi Kredi
X Takip
Alacak Yıl
ve Bursa
Faktörüne
göre XY
Plot Grafiği
(lattice)
10:19:12
26. Takip Alacak
X Takip
Enerji
Toplam
Nakdi Kredi
etkisi altında
Şehir
faktörüne
Göre Balon
Grafiği
(ggplot2)
10:19:12
27. Takip Alacak
X Takip
Enerji
Toplam
Nakdi Kredi
etkisi altında
Şehir ve Yıl
faktörüne
Göre Balon
Grafiği
(ggplot2)
10:19:12
28. Takip Alacak
X Takip
Konut Takip
Kredi
Toplam
Nakdi Kredi
etkisi altında
Şehir ve Yıl
faktörüne
Göre Balon
Grafiği
(ggplot2)
10:19:11
29. Toplam
Nakdi
Kredi X
Takip
Alacak
Kredilerinin
Yıl ve Şehir
faktörüne
Göre
Matrix Plot
Grafiği
(ggplot2)
10:19:11
30. Enerji X
Takip Enerji
Kredilerinin
Yıl ve Şehir
faktörüne
Göre Matrix
Plot Grafiği
(ggplot2)
10:19:11
31. Toplam
Nakdi
Kredi X
Takipalaca
k Yıl ve
Şehir
faktörüne
Göre Matrix
Plot Grafiği
(ggplot2)
10:19:11
32. 2008-2013 tarih aralığındaki 15 şehirdeki bankaların
hesap işlemleri ‘Grafik Datamining ve R software’ ile
analiz edildi.
November 19, 2014
Data setindeki veriler factor–effect analizii ile değerlendirildi.
Takibe düşen Kredilerin Şehirlere göre dağılımı, Kredi
Tutarlarının Toplam Nakdi Krediler içindeki Payları ve
Bakiyeleri BBDK Fintürk verilerine dayanılarak önerdiğimiz
Grafik Data-Mining tekniği ile yorumlanabilir hale getirildi.
Datanın Summary R Yazılımının bir istatistik Hizmeti girilen verilen minimum maksimum medyan verilerini tek tıkla görebiliyoruz.
Faktör tabanlı analizin en basit halini histogramlarla yapıyoruz. Tek nümerik değerinin tek faktöre göre grafik analizinin başlangıç noktası bildiğimiz histogramlardır. Renkli sütunlar dağıtılan kredilerin hangi montanlarda realize edildiği konusunda fikir verildi.
Diğer faktörlerin etkisini bu grafik tipi yansıtamadığı için şimdi daha ileri grafik tekniklerine ihtiyacımız olduğu açık. Bunun için R yazılımının lattice ve ggplot2 paketlerinden yararlanacağız.
Dotplot Grafiği tek nümerik çok faktör tek nümerikte normalde histogram olarak yapılır ancak çok fazla bir enformasyon vermez bunun yerine R yazılımının Lattice paketinin Dotplot Grafiğini kullanıyoruz. Böylece tek bir nümerik değişkene etki eden bütün faktörleri analiz edebiliyoruz.
Tek nümerik Toplamnakdi Kredi 3 faktör 4 boyutlu renkler dönemi gösterir
Topnakdi Kredide 2013 te ilk iki dönemde montan farklılığı gözüküyor.
Scatter plot sacılım grafiği Toplam Nakdi Kredi içinde takip alacağın Saçılım Grafiği faktör efekti olmadan sistemdeki anomalileri görebiliyoruz.
Düz yeşil çizgi lineer regresyon,kırmızı çizgi R ın smooth u ardışık verilerin gerçek trendini yakalıyor. Bu grafikte tam enformasyon alamıyoruz. Kırmızı eğrinin üst ve alt kesikli egrileri %95 guven aralığını belirliyor, bu aralığın dışında kalanlar ise normal dışı anomalik verilerdir. Burada faktörlerin efektini gözlemlememiz gerekiyor.
Scatter Plot sacılım grafiği Toplam Nakdi Kredi karşısında takibe düşen alacakların şehir faktörüne göre sacılım grafiği. Toplam Nakdi Kredi içindeki alacaklarının nispeten zaman içinde bütün şehirlerde artma eğilimli olduğunu görüyoruz. Ankara sistemin dışında görülüyor. Anomalik noktalardan kolaylıkla göörülüyor.
Scatter Plot 2 nümerik değişken bir faktör
Topnakdi kredide Ankara 3e+07 den sonra anomalik bir davranış gösteriyor. Aynı zamanda takipteki alacaklarda da 1e+06 da anomalik davranış gösteriyor.
Scatter Plot sacılım grafiği Toplam Nakdi Kredi karşısında takibe düşen alacakların şehir faktörüne göre sacılım grafiği. Toplam Nakdi Kredi içindeki alacaklarının nispeten zaman içinde bütün şehirlerde artma eğilimli olduğunu görüyoruz. Ankara sistemin dışında görülüyor. Anomalik noktalardan kolaylıkla görülüyor.
Takip alacaklar içinde takibe düşen enerji kredilerinin zaman içinde arttığını görüyoruz.
Bir önceki slaytta görülen takip anomalilerine şehir faktörüne göre baktığımızda hangi anomalinin hangi şehirde oluştuğunu görebiliyoruz.
Bir önceki slaytta görülen takip anomalilerine zaman metriğinden baktığımızda hangi anomalinin hangi yılda oluştuğunu görebiliyoruz.
Scatter plot sacılım grafiği takip alacak içinde takip taşıtın sacılım grafiği faktör efekti olmadan sistemdeki anomalileri görebiliyoruz.
Scatter Plot sacılım grafiği Takip alacaklar karşısında takibe düşen taşıt kredilerinin şehir faktörüne göre sacılım grafiği. Takip alacak içinde takipteki Taşıt alacaklarının nispeten azaldığını görüyoruz.
Az önceki slaytlarda 2 nümerik değişkenini tek faktörle inceleyebiliyorduk. Daha fazla faktör gerektiğinde xy plot grafiğini kullanabiliyoruz. 2 nümerik 2 faktör analizi yapılıyor.
Her bir renk yıl, yılların içindeki her bir nokta dönemleri gösteriyor.
3 nümerik tek faktör grafiği şimdi bu analizi daha ileri bir aşamaya taşımak istersek ggplot 2 paketiyle balon grafiklerden yararlanabiliyoruz. Burada balon üçüncü nümerik değişkenin etkisi ile orantılı olarak görünür. Burada takip alacak ve takip enerji ilişkisini toplam nakdi kredi ve şehir efektiyle görebiliyoruz.
Önceki slaytlarda iki nümerik ve tek faktör olarak yaptığımız analizi şimdi 3 nümerik ve 2 faktör olarak daha ileri bir düzeye taşıyoruz.
Bir grafik üzerinde anomalilerin hangi şehirde ve hangi yılda toplam nakdi kredi efekti altında gerçekleştiğini görebiliyoruz. Shape yıllar, balon Toplam Nakdi kredi.
Takip alacak içindeki takip enerjinin topnakdi krediye göre endekslenmeiş hali 3 nümerik 2 faktör şekiller yıl, renkler şehir
ggplot 2 paketi bize grafikleri matrix formatında görme olanağı sağlıyor. Matrix Plot grafikte sütun sayısını istediğimiz gibi set edebiliyoruz.
X ve y değişkeni kendi standart scale göre
ggplot 2 paketi bize grafikleri matrix formatında görme olanağı sağlıyor. Matrix Plot grafik. 2 nümerik, 2 faktör olarak enerji kredilerine karşı takibe düşen enerji kredilerinin yıl ve şehirlerine göre dağılımını görüyoruz. Tek sütun olan grafiği 3 sutüne dönüştürdük.
Peki fark nedir bu matrix te diğerlerinde şehirlerin kendi scale lerine göre standardize edilişi.