SlideShare une entreprise Scribd logo
1  sur  72
Télécharger pour lire hors ligne
УНИВЕРСИТЕТ ЗА НАЦИОНАЛНО И СВЕТОВНО СТОПАНСТВО
ФИНАНСОВО СЧЕТОВОДЕН ФАКУЛТЕТ
КАТЕДРА „ФИНАНСИ“
МАГИСТЪРСКА ПРОГРАМА ПО
„БАНКОВО ДЕЛО И МЕЖДУНАРОДНИ ФИНАНСИ“
ПЕРСПЕКТИВИ ПРЕД ПРИЛОЖЕНИЕТО НА
LOGIT И PROBIT РЕГРЕСИОННИ МОДЕЛИ,
ПРИ ИЗЛЕДВАНЕТО НА КРЕДИТНИЯ РИСК
НА КРЕДИТОПОЛУЧАТЕЛИТЕ В БАНКАТА
МАГИСТЪРСКА ТЕЗА
Петър Славчев Кирков
Факултетен номер: 1420165
Дипломант
гл. ас. д-р Ирина Казанджиева –
Йорданова
Научен ръководител
СЕПТЕМВРИ 22, 2015
СОФИЯ
1
УНИВЕРСИТЕТ ЗА НАЦИОНАЛНО И СВЕТОВНО СТОПАНСТВО
КАТЕДРА „ФИНАНСИ”
МАГИСТЪРСКА ТЕЗА
на тема: „Перспективи пред приложението на LOGIT и PROBIT регресионни
модели, при изследване на кредитния риск на кредитополучателите в
банката.”
Магистърска програма по „Банково дело и международни финанси“
ДИПЛОМАНТ:
Петър Славчев Кирков
Факултетен номер: 1420165
НАУЧЕН РЪКОВОДИТЕЛ
гл. ас. д-р Ирина Казанджиева - Йорданова
2
СЪДЪРЖАНИЕ
Списък на използваните уравнения........................................................................................... 5
Списък на използваните графики .............................................................................................. 5
Списък на използваните таблици............................................................................................... 5
УВОД ................................................................................................................................................ 7
ИЗЛОЖЕНИЕ............................................................................................................................... 10
Глава Първа. Въведение и теоретична постановка на LOGIT и PROBIT моделите...... 10
1. Въведение в регресионния анализ ........................................................................... 10
2. Представяне на LOGIT модела ................................................................................ 13
2.1. Възникване и развитие на LOGIT ................................................................... 13
2.2. Теория и на модела ............................................................................................. 15
2.2.1. Формулировка ............................................................................................. 15
2.2.2. Графично представяне............................................................................... 16
2.2.3. Тълкуване..................................................................................................... 16
3. Представяне на PROBIT модела .............................................................................. 17
3.1. Възникване и развитие на PROBIT................................................................. 17
3.2. Теория на модела на модела.............................................................................. 18
3.2.1. Формулировка ............................................................................................. 18
3.2.2. Графично представяне............................................................................... 19
3.2.3. Тълкуване..................................................................................................... 20
4. Сфери на приложение на моделите ......................................................................... 20
Глава Втора. Практическа постановка и емпирично изследване...................................... 24
5. Детайлно описание на целта и методологията на практическото изследване 24
6. Методика за идентифицирането на обекти на изследването.............................. 26
3
7. Методика при избора на входящи параметри....................................................... 29
7.1. Първични входящи параметри на модела ..................................................... 29
7.2. Оценка и избор на статистически значими параметри за модела............. 30
7.2.1. Метод на базиран на Student`s T--test...................................................... 30
7.2.2. Метод на „Изчистване на корелационната матрица“.......................... 31
7.2.3. Метод на „Най-добрия от всяка група“.................................................. 31
7.3. Оценка на трите метода за избор на входящи параметри и избор на
окончателни входящи параметри за модела.............................................................. 32
8. Кодиране на зависимата променлива Y ................................................................. 33
9. LOGIT модел................................................................................................................ 34
9.1. Задаване на параметри при изготвяне на модела......................................... 34
9.2. Статистически преглед на входящите параметри на модела..................... 34
9.3. Статистическа значимост на модела............................................................... 35
9.3.1. Тестване на обяснителната способност на модела................................ 35
9.3.2. Тест на нулевата хипотеза......................................................................... 35
9.3.3. Тест на входящите параметри .................................................................. 36
9.4. Коефициенти и регресионно уравнение на модела....................................... 36
9.5. Първична точност на модела............................................................................ 38
9.6. Практическо тестване и вторична точност на модела................................. 39
9.7. Визуализация на модела .................................................................................... 40
10. PROBIT модел.......................................................................................................... 41
10.1. Задаване на параметри при изготвяне на модела..................................... 41
10.2. Статистически преглед на входящите параметри на модела................. 41
10.3. Статистическа значимост на модела........................................................... 41
10.3.1. Тестване на обяснителната способност на модела................................ 41
10.3.2. Тестване на нулевата хипотеза................................................................. 41
10.3.3. Тест на входящите параметри .................................................................. 42
4
10.4. Коефициенти и регресионно уравнение на модела................................... 42
10.5. Първична точност на модела........................................................................ 42
10.6. Практическо тестване и вторична точност на модела............................. 43
10.7. Визуализация на модела ................................................................................ 43
Глава Трета. Допълнителен анализ и перспективи за развитие на моделите ................. 44
11. Анализ на раздалечеността ................................................................................... 44
12. Анализ на грешки от Тип 1 и Тип 2..................................................................... 45
13. Перспективи за надграждане на моделите с цел подобряване на тяхната
точност................................................................................................................................... 49
ЗАКЛЮЧЕНИЕ............................................................................................................................ 51
Използвана литература............................................................................................................... 53
Приложения .................................................................................................................................. 59
5
Списък на използваните уравнения
Уравнение 1: Линейна функция....................................................................................... 11
Уравнение 2: Кодиране на изходящата променлива Y.................................................. 13
Уравнение 3: Формулировка на LOGIT модела ............................................................. 15
Уравнение 4: Формулировка 1 на PROBIT модела........................................................ 18
Уравнение 5: Формулировка 2 на PROBIT модела........................................................ 18
Уравнение 6: Регресионно уравнение на LOGIT модела .............................................. 37
Уравнение 7: Регресионно уравнение на PROBIT модела ............................................ 42
Уравнение 8: Отношение на грешка Тип 1 спрямо грешка Тип 2................................ 48
Уравнение 9: Изразяване на грешка Тип 2, чрез грешка Тип 1 .................................... 48
Списък на използваните графики
Графика 1: Линейна функция........................................................................................... 11
Графика 2: Графично представяне на LOGIT модела.................................................... 16
Графика 3: Графично представяне на PROBIT модела ................................................. 20
Графика 4: Графично представяне на регресионна съвкупност на LOGIT ................. 70
Графика 5: Графично представяне на тестова съвкупност на LOGIT.......................... 70
Графика 6: Графично представяне на регресионна съвкупност на PROBIT............... 71
Графика 7: Графично представяне на тестова съвкупност на PROBIT ....................... 71
Списък на използваните таблици
Таблица 1: Обобщаване на изследваната съвкупност.................................................... 59
Таблица 2: Първични входящи фактори на модела ....................................................... 59
Таблица 3: Student`s T-test ................................................................................................ 61
Таблица 4: Входящи фактори избрани по метода на Student`s T-test........................... 62
Таблица 5: Входящи фактори избрани по метода на „Изчистване на
корелационната матрица”................................................................................................. 62
Таблица 6: Входящи фактори избрани по метода на „Най-добрия от всяка група”... 63
Таблица 7: Сравнение на вторичната точност от трите групи входящи фактори....... 64
Таблица 8: Първоначални настройки на LOGIT модела ............................................... 64
Таблица 9: Статистически преглед на извадка „2013/2014” ......................................... 64
Таблица 10: Статистически преглед на входящите количествени параметри ............ 64
Таблица 11: Статистически преглед на входящите качествени параметри................. 65
6
Таблица 12: Тестване на обяснителната способност на LOGIT модела ...................... 65
Таблица 13: Тестване на нулевата хипотеза на LOGIT модела .................................... 65
Таблица 14: Тестване на входящите фактори на LOGIT модела.................................. 65
Таблица 15: Извеждане и тестване на регресионните коефициенти на LOGIT
модела................................................................................................................................. 66
Таблица 16: Първична точност на LOGIT модела ......................................................... 66
Таблица 17: Вторична точност на LOGIT модела.......................................................... 66
Таблица 18: Първоначални настройки на PROBIT модела ........................................... 67
Таблица 19: Статистически преглед на извадка „2013/2014” ...................................... 67
Таблица 20: Статистически преглед на входящите количествени параметри ............ 67
Таблица 21: Статистически преглед на входящите качествени параметри................. 67
Таблица 22: Тестване на обяснителната способност на PROBIT модела.................... 68
Таблица 23: Тестване на нулевата хипотеза на PROBIT модела.................................. 68
Таблица 24: Тестване на входящите фактори на PROBIT модела................................ 68
Таблица 25: Извеждане и тестване на регресионните коефициенти на PROBIT
модела................................................................................................................................. 68
Таблица 26: Първична точност на PROBIT модела ....................................................... 69
Таблица 27: Вторична точност на PROBIT модела........................................................ 69
Таблица 28: Анализ на раздалечеността ......................................................................... 69
Таблица29: Анализ на класификационната точка.......................................................... 69
7
УВОД
През последните две десетилетия се наблюдаваха множество банкови и
финансови кризи, които за жалост се разпространиха и към реалния сектор, който
и до днес понася негативите и не може да се възстанови напълно. Безспорно най-
траен отпечатък остави световната финансова криза от 2008 година. Тези събития
доведоха до необходимостта от цялостно преосмисляне на постановките, относно
измерването и управлението на кредитния риск, от страна на банковите
институции, по отношение на техните настоящи и бъдещи кредитополучатели.
Прецизното измерване на кредитния риск и възможността за фалит
(Probability of default) са от огромно значение, както за банковия и финансов
сектор, така и за инвеститорите, реалния сектор и всички икономически агенти
като цяло. Поради тази причина тематиката става все по-актуална, особено в
условия на съкращаване на разходите за аналитичен персонал от страна на
банковите институции,за сметка на все по-широкото навлизане на
автоматизираните системи за оценка и измерване на рисковете.
Основната цел на настоящата разработка е тестването на изградена с
помощта на LOGIT и PROBIT моделите, система за ранни предупредителни
сигнали, (Early warning system). Разработената система има за цел да пресметне
какъв е шансът по отношение на даден настоящ кредитополучател в действаща
търговска банка в страната, поне веднъж да допусне просрочие по своята
главница, по-голямо от 30 дни, през предстоящата една година.
След успешно тестване на модела бе констатирано, че точността му по
отношение на идентифицирането на потенциални редовни и нередовни
кредитополучатели за бъдещ период от една година възлиза на 85,71%. Казано с
други думи, при извадка от 100 кредитополучателя, изградената система успешно
би идентифицирала 86 от тях, като посочи дали ще бъдат редовни или нередовни,
което бива и емпирично доказано в практическата част на разработката.
Съответно в отделна точка са представени и възможности за подобряване
на модела с цел повишаване на неговата точност. Те от своя страна, съзнателно не
са приложени в настоящата разработка, поради фактът, че за тяхното включване е
необходимо провеждането на съвсем отделни, а и в някои случаи мащабни
8
емпирични изследвания. Тук следва да се отбележи, че самият модел има напълно
реално практическо приложение, предвид факта, че е изграден въз основна на база
данни от реални кредитополучатели, принадлежащи към кредитния портфейл на
действаща банката в България.
Като допълнителен принос, на настоящата дипломна работа,могат да се
отбележат следните елементи.
 Предложени са два алтернативни метода за избора на входящи
променливи на модела, а именно методът на „Изчистената корелационна
матрица” и методът за избор на „Най-добрият от всяка група ”. В
последствие след съпоставката им с друг такъв класически метод, базиран
на Student`s T-test, бе доказано, че методът на „Изчистената корелационна
матрица”, се отличава, като по-надежден. Това от своя страна доказва, че
простотата на предложения метод, не е за сметка на неговата точност.
 В отделна точка „Анализ на раздалечеността”, включена в Глава
Трета е представен иновативен метод, целящ по-задълбоченото и прецизно
анализиране на резултатите от двата модела, тъй като първоначално
точността на LOGIT и PROBIT бива почти еднаква, но благодарение на
предложения анализ на раздалечеността, PROBIT се доказва като по-
надежден.
 Също в Глава Трета е обособена друга отделна точка, в която са
описани разсъждения по отношение на измерването на характерните за
двата вида модели грешки от Тип 1 и Тип 2. Съответно е направен и опит
за извеждане на уравнение, оценяващо взаимовръзката и относителната
цена на двата типа грешки, по отношение на прилагането на LOGIT и
PROBIT моделите в контекста на банковото дело и в частност на
изследването на кредитния риск.
Следва да се отбележи, че горните три елемента са само маркирани, като
не са детайлно анализирани и дискутирани, предвид основната тема на
разработката и необходимостта на тях да бъдат посветени отделни и
самостоятелни изследвания.
Желанието за избор на настоящата тема е продиктувано от една страна
поради актуалността на проблема за по-надеждното измерване на кредитния риск,
9
но от друга и поради факта, че разглежданите модели и перспективите пред
тяхното приложение в българския банков сектор, на този етап не са били широко
изследвани.
Поради ясното осъзнаване от страна на автора, че тематиката бива твърде
широка, настоящата разработка има основно за цел само да демонстрира как се
изграждат подобен тип системи, както и да тълкува техните резултати. Поради
тази причина множество от елементите на разработката, подлежат на отделно
допълнително развитие, което само по себе си може да бъде предпоставка за
създаването на множество други научни трудове в сферата. От друга страна,
предвид насочеността на материала към аудитория принадлежаща на сферата на
финансите и в частност банковото дело, съзнателно се набляга повече на самата
методология по изграждането и тестването на модела и разискване на
проблематиката, относно приложението му в банковата дейност. Поради тази
причина специфичната иконометрична трактовка бива умишлено оставане на
заден план и не е задълбочено разисквана.
10
ИЗЛОЖЕНИЕ
Глава Първа. Въведение и теоретична постановка на LOGIT и PROBIT
моделите
1. Въведение в регресионния анализ
Регресионният анализ е с относително кратка история, на фона на другите
математически модели, които се използват във финансите. За неговото начало се
считат трудовете на Legendre1
и Gauss2
в началото на VIII век, като терминът
регресия бива въведен за първи път от Galton3
, в края на VII век. Регресионният
анализ оценява и изучава зависимостта и връзката между две и повече
променливи величини. Той е статистически метод за определяне на връзката
между зависима променлива Y и една (при проста регресия) или множество
независим променливи/параметри/фактори (при сложна/множествена регресия)
X1, X2,...,Xn, които в статистически смисъл влияят върху стойностите на целевата
променлива Y. Характерното за него е, че той се концентрира както върху
изследване на наличието на причинно-следствена зависимост между две и повече
променливи величини, така и върху търсенето на функционална връзка между
тях4
. Регресионният анализ се концентрира върху причинно-следствените връзки
и се стреми да направи оценка на конкретната сила на тези връзки.
Най-елементарният и лесно приложим тип регресия е линейната. Тя бива
доста широко позната и изучавана, като фундамент в изследването на причинно-
следствени връзки. Най-общо линейната регресия може да се представи с
уравнение от вида:
1
Legendre, A. (1805). Nouvelles méthodes pour la détermination des orbites des comètes. Sur la Méthode
des moindres quarrés” appears as an appendix.
2
Gauss, C. (1809). Theoria Motus Corporum Coelestium in Sectionibus Conicis Solem Ambientum.
3
Galton, F. (1889). Natural Inheritance. London.
4
Montgomery, D. C., Peck, E. A., & Vining, G. G. (2012). Introduction to Linear Regression Analysis.
John Wiley & Sons.
11
Уравнение 1: Линейна функция
𝒀 = 𝜶 + 𝜷𝟏 ∗ 𝑿𝟏 + 𝜷𝟐 ∗ 𝑿𝟐 + ⋯ . + 𝜷𝒏 ∗ 𝑿𝒏
Където:
 Y: Зависима променлива на модела;
 Х1, X2, ….Xn: Независими променливи на модела;
 α:Свободен член на модела, който е показател обхващаш фактори
извън модела, които не могат да бъдат изследвани, но влияят на Y;
 β1, β2,…βn:Това са коефициентите пред независимите фактори,
които определят силата и посоката на влияние на дадения независими
фактор Х1, X2, ….Xn;
Съответно линейната регресия графично се представя по следния
начин:
Графика 1: Линейна функция
Основното предимство на линейната регресия е нейната разбираемост и
„простота“, научно приета е, както и е широко разпространена. Линейната
регресия е първият метод, който се използва за много проблеми и задачи. От
друга страна основен неин недостатък е, че много явления, просто не съответстват
на предположенията на линейния модел, не е възможно или е много трудно да се
произведат добри резултати, чрез нея.
12
Една основна група от тези явления са онези, при които се изследва каква е
вероятността за настъпване или не, на дадено събитие. Характерно за такъв тип
явления, е че зависимата променлива Y може да заема само стойности от (0;1),
докато при линейните модели тя принадлежи в интервала (-∞;+∞). Поради тази
причина са разработени и нелинейните модели от типа на LOGIT и PROBIT,
които трансформират стойностите на Y посредством имплементиране на
стандартно разпределение на стойностите. Поради този си огромен плюс в
практиката все по-често се използват нелинейните модели.5
Съответно LOGIT и PROBIT моделите, са едни от най-ярките
представители на нелинейните функции, за изследване на вероятности. Този тип
модели изследват връзката между няколко независими променливи Х1, X2,….Xn и
една зависима променлива Y, която показва какъв е шанса за настъпване на
дадено събитие или не, като поради тази причина нейните стойности заемат
интервал от 0 до 1 (от 0% до 100%). Друго предимство на този тип модели е, че
входящите променливи могат да бъдат както качествени, така и количествени
показатели.
Обикновено моделите от този тип са биномни (дихотомни), което
означава, че изследват явления и процеси, които имат само два
взаимоизключващи се изхода, например „даден кредитен лимит ще бъде
редовен през следващата една година, или няма да бъде редовен“.
По-софистициран вариант на LOGIT и PROBIT моделите са полиномните
модели, при които се изследват явления или процеси, при които съществуват
няколко, но отново взаимоизключващи се изхода, като например „даден
кредитен лимит ще бъде редовен през следващата една година, или ще бъде
просрочен до максимум 30 дни, или до максимум 60 дни, или над 60 дни“67
Тези модели се градят на предположението, че въз основа на исторически
данни за състоянието ключови финансови показатели за група от
фалирали/нередовни и не фалирали/редовни компании (или друг вид
икономически единици), има възможност да се предположи с определена точност
5
Resti A, S. A. (2007). Risk Management and Shareholders' Value in Banking: From Risk Measurement
Models to Capital Allocation Policies.
6
Freedman, D. A. (2009). Statistical Models: Theory and Practice. Cambridge University Press.
7
Bessis, J. (2011). Risk Management in Banking, 3rd Edition. Wiley.
13
какво би се случило в бъдеще с дадена друга компания (икономическа единица),
въз основна на настоящото състояние на същите ключови показатели, но
пресметнати за дадената компания
Съществен елемент при изграждането на LOGIT и PROBIT модели е
предварително стойностите на Y да бъдат кодирани, като най-често се използва
следния тип:
Уравнение 2: Кодиране на изходящата променлива Y
𝒀 = {
𝟏 − излесдваното събитие настъпва
𝟎 − изледваното събитие не настъпва
}
Началото по отношение на измерването на риска и изграждането на
модели за кредитна оценка (Credit Scoring Models), бива поставено с трудовете на
Beaver8
. Altman9
от своя страна надгражда значително тези идеи и разработва
цялостна система за анализ наречена Дискриминантен анализ (Multivariate
Discriminant Analysis) . Трудовете на Beaver и Altman са подлагани на широко
съмнение, като в последствие Ohlson10
конструира модели за кредитна оценка
базирани на LOGIT анализ, докато трудовете на Zmijewski11
от своя страна са
базирани на PROBIT анализа. В последствие двата типа модели придобиват
изключително широка популярност, поради тяхната висока точност, която в
повечето случаи е над 90%.
2. Представяне на LOGIT модела
2.1. Възникване и развитие на LOGIT
Много преди да бъде разработен LOGIT моделът във вида, в който се
използва в наши дни при различни типове изследвания, той е преминал през
множество трансформации, като най-първоначалните му наченки могат да се
търсят още при трудовете на Malthus12
, относно експоненциалното нарастване на
8
Beaver, W. (1966). Financial Ratios as Predictors of Failure. Empirical Research in Accounting:Selected
Studies 1966. Journal of Accounting Research, 71-111.
9
Altman, E. I. (1968). Financial Ratios, Discriminant Analysis and Prediction of Corporate Bankruptcy.
Journal of Finance, 589-609.
10
Ohlson, J. A. (1980). Financial ratios and the probabilistic prediction of bankruptcy. . Journal of
Accounting Research, 109-131.
11
Zmijewski, M. E. (1984). Methodological issues related to the estimation of financial distress prediction
models. Journal of Accounting Research., 59-82.
12
Malthus, T. E. (1798). An Essay on the Principle of Population. London.
14
населението на млади и все още негъсто населени държави. Надграждайки
теорията на Malthus, Quetelet1314
, стига до извода, че ръстът на населението на
подобен тип държави все някога ще се забави и ще спре, като по този начин в
своята разработка той слага горната и долната граница на кривата на нарастване.
По-късно асистентът на Quetelet, Verhulst, също навлиза в тематиката и в
последствие публикува три разработки по темата, в които извежда
математическата постановка на логаритмичната крива, както и дава нейното
наименование151617
, , В последствие тази научна материя, обаче не придобива
широк научен интерес и бива бързо забравена. През 20-те години на новия век,
Pearl и Reed преоткриват логаритмичната функция и отново я прилагат в
изследвания по отношение на нарастване на населението1819202122
.След това отново
Reed но в съавторство с Berkson придават нова сфера на приложение на
логаритмичната функция, а именно химията, с публикацията си, посветена на
автокаталистичната верижна реакция 23
. Съответно последват множество
приложения на модела в сферата на фармацевтиката и медицината, като едно от
най-значимите събития е публикацията на Berkson през 1944 24
, в която по
аналогия на вече утвърдилият се PROBIT модел, той дава наименованието
LOGIT.
13
Quetelet, A. (1848). De systµeme social et des lois qui le regissent. Paris.
14
Quetelet, A. (1850). Notice sur Pierre-Francois Verhulst. Annuaire de l'Academie Royale des Sciences,
Lettres et des Beaux-arts 16, 97-124.
15
Verhulst, P. (1838). Notice sur la loi que la population suit dans son accroissement. Correspondance
Mathematique et Physique, publiee par A. Quetelet 10,, 113.
16
Verhulst, P.F. (1845). Recherches mathematiques sur la loi d'accroissement de la population. Nouveaux
Memoires de l'Academie Royale des Sciences, des Lettres et des Beaux-Arts de Belgique 18, 1-32.
17
Verhulst, P.F. (1847). Deuxiµeme memoire sur la loi d'accroissement de la population. Nouveaux
Memoires de l'Academie Royale des Sciences des Lettres et des Beaux-Arts de Belgique 20, 1-32
18
Pearl, R., & Reed, L. J. (1920). On the rate of growth of the population of the United States since 1870
and its mathematical representation. Proceedings of the National Academy of Sciences 6, 275-288
19
Pearl, R., & Reed, L. J. (1922). A further note on the mathematical theory of population growth.
Proceedings of the National Academy of Sciences 8, 365-368.
20
Pearl, R., & Reed, L. J. (1923). On the mathematical theory of population growth. Metron 5, 6-19.
21
Pearl, R. (1927). The indigenous population of Algeria in 1926. Science 66, 593-594.
22
Pearl, R., Winsor, C. P., & White, F. B. (1928). The form of the growth curve of the cantaloupe
(Cucumis melo) under feld conditions. Proceedings of the National Academy of Sciences 14, 895-901.
23
Reed, L. J., & Berkson, J. (1929). The application of the logistic function to experimental data. Journal
of Physical Chemistry 33, 760-779.
24
Berkson, J. (1944). Application of the logistic function to bioassay. Journal of the American Statistical
Association 39, 357–65.
15
Както става ясно, до този момент логаритмичната регресия се използва
като средство за анализиране на протичащи процеси, а не като средство за
определяне на вероятности.
По отношение на сферата на икономиката и финансите, въз основна на
трудовете на Martin25
,. LOGIT модела придобива голяма популярност в и се
превръща е един от най-често срещаните модели са предвещаване на фалити на
действащи икономически единици като фирми банки и др.
2.2. Теория и на модела
2.2.1. Формулировка
В литературата се използват множество различни буквени означения, както
и структури на LOGIT функцията въз, основна на различни математически
преобразования. Въпреки това една от най-често срещани формулировки на
функцията, която следва и да се дискутира с развитието на настоящият труд
следва да се запише така:
Уравнение 3: Формулировка на LOGIT модела
𝑷𝒓(𝒀 = 𝟏|𝑿𝒏) =
𝟏
𝟏 + 𝒆𝒙𝒑(−𝒁)
=
𝒆𝒙𝒑(𝒁)
𝟏 + 𝒆𝒙𝒑(𝒁)
Където:
 Pr(Y=1│Xn): това е крайният показател/продукт на LOGIT модела и
показва каква е вероятността изходът от модела/зависимият фактор, да
получи стойност 1, тоест даденото събитие да настъпи (Y=1, Y е
зависимият фактор), при конкретни стойности на независимите фактори
Х1, X2, ….Xn;
 Y: изходяща зависимата променлива на модела. Yϵ (0;1);
 exp(Z): чете се „експонента от Z“, което се пресмята като е на
степен Z (ez
);
 Z: това е най-същественият елемент на модела, като той показва кои
са независимите фактори и какво е тяхното влияние върху модела. Z се
изчислява по следният начин;
 Z= (α+β1*X1+ β2*X2+….+ βn*Xn)=Σ(α+ βn*Xn),Z (-∞ ; +∞) където:
25
Martin, D. (1977). Early warning of bank failure: A logit regression approach. Journal of Banking &
Finance vol. 1, issue 3, 249-276.
16
o Х1, X2, ….Xn: входящи независими променливи на модела,
които могат да бъдат количествени и качествени;
o β1, β2,…βn: това са коефициентите пред независимите
фактори, които определят силата и посоката на влияние на дадения
независими фактор Х1, X2, ….Xn;
o α:свободен член на модела, който е показател обхващаш
фактори извън модела, които не могат да бъдат изследвани, но
влияят на Y;
Съответно LOGIT модела се базира на логаритмичното разпределение, и
поради тази причина в уравнението е включена експонентата -exp(Z). Друга
важна особеност е, че с нарастване на Z, нарастват и Y, тоест вероятността за
настъпване на даденото събитие.
2.2.2. Графично представяне
Графика 2: Графично представяне на LOGIT модела
2.2.3. Тълкуване
В ляво е представено логаритмичното разпределение от което се извежда
и LOGIT моделът, който от своя страна е представен в дясно. Видно от дясната
графика, моделът напълно отговаря на специфичните предимства на нелинейната
логаритмична регресия, които се състоят в следното:
 По оста X са нанесени стойностите на независимите фактори, които
могат да заемат стойности от минус безкрайност до плюс безкрайност;
17
 Изходите от модела (стойностите на зависимата) променлива са
изобразени по оста Y, като видно както вече бе споменато те са
ограничени, между 0 и 1, независимо от липсата на ограничение при X;
 Стойностите на Y клонят към 0 и 1 но никога не ги достигат, защото
при стойности на Y=0 или Y=1 логаритъмът бива недефиниран и
регресията става невъзможна;
 Съответно с нарастване на Z, зависимата променлива започва да
клони към 1, а с намаляване на Z към 0
3. Представяне на PROBIT модела
3.1. Възникване и развитие на PROBIT
В научната литература, най-често с възникването на PROBIT моделите се
свързва Chester Bliss и Gaddum, но по-задълбочен преглед показва, че корените
на методологията залегнала в модела се крият още в трудовете на Fechner26
,
където в изследването си той открива, че хората не реагират еднакво на различни
външни стимули и поради тази причина се заема да трансформира наблюдаваните
различия в стандартни отклонения. Други автори също със значими и по-ранни
открития от тези на Bliss са Aitchison и Brown27
. По-късно за първи път в серия от
научни публикации Bliss за първи път въвежда термина PROBIT (на кратко от
английския израз - „Probability unit“)28
. По-това време заедно с Bliiss, и Guddum
въвежда методи за по-точното изчисляване на моделите29
. Важен елемент от
развитието на науката, по отношение на PROBIT модела е също така и написаната
книга по темата от страна на Finney 30
, който е заимствал идеите си от
разработките на предните два автора.
Следва да се отбележи, че до този момент, PROBIT анализът е използван
главно в сферата на медицината, здравеопазването и фармацевтиката. През 50-те
години на новия век, за първи път моделът бива прилаган в сферата на
26
Fechner, G. T. (1860). Elemente der Psychophysik. Leipzig: Breitkopf und HÄartel.
27
Aitchison, J., & Brown, J. A. (1957). The Lognormal Distribution. University of Cambridge,
Department of Applied Economics. Cambridge University Press.
28
Bliss, C. I. (1934). The method of probits. Science 79.
29
Gaddum, J. H. (1933). Reports on Biological Standard III. Methods of Biological Assay Depending on a
Quantal Response. London: Special Report Series of the Medical Research Council, no. 183.
30
Finney, D. (1971). Probit Analysis (Third ed.). Cambridge University Press. First edition in 1947.
18
икономиката и маркетинга от Farrell 31
, който използва PROBIT моделите за
изследване на склонностите на потребителите по отношение на различни типове
автомобили, а Adam32
го прилага по отношение на изследване на пазара на
запалки за цигари. В последствие поради добрата аналитична способност на
модела, той бива все по-широко прилаган (в повечето случаи успоредно с LOGIT)
в множество изследвания в сферата на икономиката, финансите банковото дело и
други. Трудове на които си струва да се обърне внимание са например тези на
Theodossiou 33
, където той успява да постигне 93,7% точност на модела, по
отношение на оценка на бизнес сектора в Гърция, което спрямо по-голямата част
от PROBIT моделите се счита за сравнително висока точност.
3.2. Теория на модела на модела
3.2.1. Формулировка
Аналогично на LOGIT модела, при дефинирането на PROBIT модела, също
се наблюдават множество вариации, но за целите на настоящата разработка ще се
използва следната дефиниция, която се базира на нормалното разпределение и
поради тази причина е малко по-комплицитна за представяне в сравнение с
формулировката на LOGIT.
Уравнение 4: Формулировка 1 на PROBIT модела
𝐏𝐫(𝐘 = 𝟏│𝐗𝒏) =
𝟏
√𝟐𝝅
∫ 𝐞𝐱𝐩 (−
𝒙 𝟐
𝟐
) 𝒅𝒛
𝒛
−∞
По-лесно за разбиране представяне на формулировката на модела е дадено
в долната формула;
Уравнение 5: Формулировка 2 на PROBIT модела
𝐏𝐫(𝐘 = 𝟏│𝐗𝐧) = 𝚽(𝐙)
Където:
31
Farrell, M. J. (1954). The demand for motorcars in the United States. Journal of the Royal Statistical
Society series A 117, 171-200.
32
Adam, D. (1958). Les Reactions du Consommateur Devant les Prix. Paris: Sedes: Number 15 in
Observation Economique.
33
Theodossiou, P. (1991). Alternative models for assessing the financial condition of business in Greece .
Journal of Business Finance and Accounting, Vol. 18 No. 5, pp. 697-720.
19
 φ: използва се за обозначаване на стандартното нормално
разпределение;
 φ(Z): Показва каква е стойността на стандартното нормално
разпределение при зададената стойност на Z;
 Pr(Y=1│Xn): това е крайният показател/продукт на LOGIT модела и
показва каква в вероятността изхода от модела/зависимият фактор да
получи стойност 1, тоест даденото събитие да настъпи (Y=1, Y е
зависимият фактор), при конкретни стойности на независимите фактори
Х1, X2, ….Xn;
 Y: изходяща зависимата променлива на модела. Yϵ (0;1);
 Z: това е най-същественият елемент на модела, като той показва кои
са независимите фактори и какво е тяхното влияние върху модела. Z се
изчислява по следният начин:
 Z= (α+β1*X1+ β2*X2+….+ βn*Xn)=Σ(α+ βn*Xn),Zϵ (-∞;+∞), където:
o Х1, X2, ….Xn: входящи независими променливи на модела.
Могат да бъдат количествени и качествени;
o β1, β2,…βn: това са коефициентите пред независимите
фактори, които определят силата и посоката на влияние на дадения
независими фактор Х1, X2, ….Xn;
o α – свободен член на модела, който е показател обхващаш
фактори извън модела, които не могат да бъдат изследвани, но
влияят на Y;
Както става видно, тълкуването на факторите на PROBIT е почти
аналогично с това на LOGIT, както и се наблюдава пълна аналогия, по отношение
на факта че с нарастване на Z, нарастват и Y, тоест вероятността за настъпване на
даденото събитие.
3.2.2. Графично представяне
20
Графика 3: Графично представяне на PROBIT модела
3.2.3. Тълкуване
На лявата графика е представено нормалното разпределение, а на дясната
самият PROBIT модел. Тълкуванието на кривата на PROBIT модела е напълно
аналогично на това на LOGIT.
Въз основа на гореизложеното, може да се обобщи, че по своята
методология, приложение и тълкуване моделите LOGIT и PROBIT са почти
идентични, като основното различие се наблюдава по отношение на
формулировката им и тяхното графично изобразяване, дължащо се на това,
че LOGGIT използва логаритмичното разпределение, докато PROBIT
използва нормалното разпределение. Съответно графично представен
PROBIT се характеризира с „по-голяма острота“ и по-ясно разграничение,
между вероятността за настъпване на дадено събитие или не. Това от своя
страна ще бъде и емпирично демонстрирано в точка „Анализ на
раздалечеността”
4. Сфери на приложение на моделите
С увеличаване на своята популярност и най-вече високата си степен на
обяснителност/доказателственост при използването им, LOGIT и PROBIT
намират все по-широко практическо приложение, като са използвани в
изследвания в широк спектър от различни сфери като:
 В сферата на здравеопазването при пресмятането на вероятностите
от възникване на дадено заболяване, при наличието на определени рискови
21
фактори като степен на заболяване, възраст на индивида, трудови навици и
др.34 35 36 37
;
 Фармацевтиката и химическата промишленост при съставянето на
модели за влиянието на даден химичен елемент върху даден химичен
процес;
 При застраховането за пресмятане на рисковете при определяне на
рисковата група на дадено потенциално за застраховане лице или група от
лица38 39
;
 В сферата на социологическите проучвания, относно потенциалния
изхода за даден социален въпрос, предстоящ избор на политическа партия
или изход от референдум или др.40
;
 При вземане на решения относно изразходването на публични
средства, въз основа на вероятността за различни предпочитания на
индивидите41
;
 Маркетингови проучвания, въз основа на които да се направят
изводи за потенциалните предпочитания на даден индивид въз основна на
група определящи фактори, като социален статус, образование, възраст и
др.42 43
;
34
Kologlu, M., Elker, D., Altun, H., & Sayek, I. (2001). Valdation of MPI and OIA II in two different
groups of patients with secondary peritonitis. Hepato-Gastroenterology Vol. 48, № 37, 147-151
35
Biondo, S., Ramos, E., & Deiros, M. (2000). Prognostic factors for mortality in left colonic peritonitis: a
new scoring system. J. Am. Coll. Surg. Vol. 191, № 6, 635-642.
36
Marshall, J., & Cook, D. (1995). Multiple Organ Dysfunction Score: A reliable descriptor of a complex
clinical outcome. Care Med Vol. 23, 1638-1652.
37
Gall, J. R., Lemeshow, S., & Saulnier, F. (1993). A new Simplified Acute Physiology Score (SAPS II)
based on a European/North American multicenter study. JAMA Vol. 270., 2957-2963.
38
Keane, M. P. (2004). Modeling Health Insurance Choice Using the Heterogeneous Logit Model.
Department of Economics Yale University .
39
Wen, C.-H., Wang, M.-J., & Lan, L. W. (1914). Discrete choice modeling for bundled automobile.
Insurance Policies. Journal of the Eastern Asia Society for Transportation Studies, Vol. 6, 1928-2005.
40
Harrell, F. E. (2001). Regression Modeling Strategies. Springer-Verlag.
41
Harrell, F. E. (2001). Regression Modeling Strategies. Springer-Verlag.
42
Adam, D. (1958). Les Reactions du Consommateur Devant les Prix. Paris: Sedes: Number 15 in
Observation Economique.
43
Farrell, M. J. (1954). The demand for motorcars in the United States. Journal of the Royal Statistical
Society series A 117, 171-200.
22
 В психологията и социалните науки, като се съставят модели за
предричане на поведението и/или предпочитанията на даден индивид , въз
основна на група определящи фактори44
;
Може би обаче най-широко е използването им днес е в сферата на
финансите и банковото дело при определяне на така наречения риск от наплащане
и/или фалит (Probability of default), като моделите днес са толкова софистицирани,
че са в състояние да бъдат приложени по отношение на широк спектър от
изследвания като например:
 Анализ на индивидуална икономическа единица и вероятността й за
изпадане в неплатежоспособност и фалит45
;
 Анализ за риска от фалит на новосформирани високотехнологични
компании, познати като „старт-ъп компании“ (start-up)46
;
 Анализ на кредитния портфейл на дадена банка47
;
 Анализ на цяла банкова институция или банковия сектор като
цяло48 49 50
;
 Анализ за риска от неплатежоспособност на община или друг вид
обособена държавна самостоятелна единица51
;
 Анализ на състоянието на цели икономически сектори52 53 54 55 56
;
44
Little, T. D. (2013). The Oxford Handbook of Quantitative Methods in Psychology: Vol. 2 Statistical
Analysis. Oxford university press.
45
Soleimani, A. S., & Salimi, S. V. (2012). Corporate Bankruptcy Prediction Using a Logit Model
Evidence from Listed Companies of Iran. World Applied Sciences Journal 17, 1143-1148
46
Biondo, S., Ramos, E., & Deiros, M. (2000). Prognostic factors for mortality in left colonic peritonitis: a
new scoring system. J. Am. Coll. Surg. Vol. 191, № 6, 635-642.
47
Karacula, E. (2009). An application of logit and probit models over the default probabilities of retail
banking mortgage credits. Instanbul bilgi university, Institute of social science.
48
Memić, D. (2015). Assessing Credit Default using Logistic Regression and Multiple Discriminant
Analysis: Empirical Evidence from Bosnia and Herzegovina. University Sarajevo School of Science and
Technology - Department of Economics.
49
Gurný, P., & Gurný, M. (2013). Comparison of credit scoring models on probability of default
estimation for US banks. Prague economic papers, 2, 163-181.
50
Ploeg, S. (2010). Bank default prediction models a comparison and an application to credit rating
transitions;. Erasmus university rotterdam and Earst & Young.
51
Puntillo, P. (2012). Predictive models of default risk in local governments. A logistic regression.
Business Economics University of Calabria, Department of Business Science.
52
Yazdanfar, D., & Nilsson, M. (2008). The bankruptcy determinants of Swedish SMEs. Institute for
Small Business & Entrepreneurship.
53
Aliakbari, S. (2009). Prediction of Corporate Bankruptcy for the UK Firms in Manufacturing Industry.
Brunel University Department of Economics and Finance.
54
Blanco, A., Irimia, A., & Oliver, M. D. (2012). The Prediction of Bankruptcy of Small Firms in the UK
using Logistic Regression. University of Seville, Department of Financial Economics and Operations
Management.
23
 Анализ за риска от неплатежоспособност на цяла държава57
;
 Също така моделите могат да се използват при тестването и
математическото формализиране на дадени икономически теории, както и
извеждане на финансови ковенанти58 59 60 61 62
.
Видно от горните примери, LOGIT и PROBIT моделите практически
имат неограничена сфера на приложение. Следва обаче да се направи едно
много важно уточнение, поради своята специфика, изследваните примери,
спрямо които следва да се прилагат моделите, трябва да бъдат изключително
специфично систематизирани, като в повечето случай възможните варианти
от изхода на модела трябва да бъдат дихотомни, тоест да бъдат сведени до два
взаимоизключващи се изхода или полиномни, в такъв случай е необходимо
да бъдат сведени до няколко взаимоизключващи се изхода
55
Pederzoli, C., & Torricelli, C. (2010). A parsimonious default prediction model for Italian SMEs. Banks
and Bank Systems, Volume 5, 5-9.
56
Janer, J. (2011). Bankruptcy Prediction and its Advantages. Copenhagen Business School, Department
of Economics.
57
Petr Jakubík, P. T. (2008). The Prediction of Corporate Bankruptcy and Czech Economy’s Financial
Stability through Logit Analysis. Czech National Bank and Charles University Prague.
58
ashid, A., & Abbas, Q. (2011). Predicting Bankruptcy in Pakistan. Theoretical and Applied Economics
Volume XVIII, 103-128
59
Bonfim, D. (2009). Credit risk drivers: Evaluating the contribution of firm level information and of
macroeconomic dynamics. Journal of Banking & Finance, 281-299.
60
Keen, R. Z. (2007). Default probability for the Jordanian companies: a test of cash flow theory.
University of Wollongong.
61
Comelli, F. (2014). Comparing the Performance of Logit and Probit Early Warning Systems for
Currency Crises in Emerging Market Economies. International Monetary Fund.
62
Fernandes, J. E. (2005). Corporate credit risk modeling: Quantitve rating system and probability of
default estimation.
24
Глава Втора. Практическа постановка и емпирично изследване
5. Детайлно описание на целта и методологията на практическото
изследване
Както вече беше споменато основната цел на настоящия труд е да
разработи напълно и тества, реален и действащ модел, имащ за цел
идентифицирането на потенциални проблемни и бъдещи нередовни
кредитополучатели в действаща търговска банка от страната. Моделът се прилага
по отношение на вече действащи кредитополучатели, а не настоящи
кредитоискатели.Последното е предприето, понеже допълнителното
финансиране може както да подобри състоянието на дадена компания, така и
да го влоши. Това от своя страна следва да бъде подложено на допълнителен
анализ с изводите от който, LOGIT и PROBIT моделите да бъдат
допълнително коригирани.
Изхождайки от основната трактовка на регресионните модели и в частност
на нелинейните LOGIT и PROBIT, тяхното изграждане и приложение се базира на
исторически данни за изминал период, въз основна на които се съставя
подходящо регресионно уравнение, което да има прогностична способност по
отношение на даден бъдещ период. В академичната литература и практичната
сфера се наблюдават различни методите на структуриране на двата периода
(исторически и прогностичен), по отношение на отстоянието на въпросните два
периода, спрямо настоящия момент на изследването. Някои автори разглеждат
например, структура от типа „t-3, t-2, t-1;t+1, t+2, t+3“, което означава, че въз
основа на исторически данни за 3 години назад се търси успешна прогностичност
през следващите 3 бъдещи години от момента на изследването. Други автори от
своя страна разглеждат структура от типа „t-2 или t-3, t+1“, което се изразява в
това, че според тях прогностичните сигнали за влошаване на състоянието на
дадена компания не се съдържат в предходната година, ами понякога в 2 или 3
години преди настоящия момент на изследването, като за целта те провеждат
25
допълнително отделно специфично изследване именно само по това
направление63 64 65 66 67
.
В настоящата разработка е използвана структура от типа „t-1, t+1“, което
означа, че въз основа на исторически данни от една година назад във времето се
съставя регресионен модел, имащ за цел да прогнозира една година напред във
времето. Избора на тази структура се обуславя от факта, че в разработката се
използват входящи променливи, които са базирани единствено въз основна на
финансовото състояние на даден кредитоискател и ограничен набор от
информация извлечена от банковия портфейл на банката. В такъв случай не са
включени променливи, които да отразяват външни за кредитоискателите и
банката влияния, като макроикономическата среда, политическата среда и др
По-конкретно изследването е изградено на следния принцип.
Първоначално е идентифицирана група от компании „2013/2014“(Регресионна
съвкупност), при която от една страна въз основна на данни през 2013, като
източник за тези данни са техните финансови отчети към 31.12.2013, банковия
портфейл и търговския регистър и от друга страна въз основна на данни за
редовността или просрочията на тези компании през 2014 е изградено
регресионно уравнение. Втората група компании са така наречените
„2014/2015“68
(Тестова съвкупност) и те следва да се използват при практическото
тестване на модела. Чрез вече съставното регресионно уравнение с помощта на
първата група компании „2013/2014“ и финансовите данни на компаниите от
група „2014/2015“ следва да се провери на практика, кои компании от втората
група следва да бъдат идентифицирани от модела като нередовни
кредитополучатели през следващите 12 месеца, в случая това е 2015 година. На
63
Gurný, P., & Gurný, M. (2013). Comparison of credit scoring models on probability of default
estimation for US banks. Prague economic papers, 2, 163-181.
64
Rashid, A., & Abbas, Q. (2011). Predicting Bankruptcy in Pakistan. Theoretical and Applied Economics
Volume XVIII, 103-128.
65
Memić, D. (2015). Assessing Credit Default using Logistic Regression and Multiple Discriminant
Analysis: Empirical Evidence from Bosnia and Herzegovina. University Sarajevo School of Science and
Technology - Department of Economics.
66
Yazdanfar, D., & Nilsson, M. (2008). The bankruptcy determinants of Swedish SMEs. Institute for
Small Business & Entrepreneurship.
67
Kasgari, A. A., Salehnezhad, S. H., & Ebadi, F. (2013). The Bankruptcy Prediction by Neural Networks
and Logistic Regression. International Journal of Academic Research in Accounting, Finance and
Management Sciences Vol. 3, 146-152.
68
Предвид датата на изготвяне на настоящата разработка и желанието за максимална актуалност на
данните, периода за 2015 все още не е напълно изтекъл и реално се разглежда само до 31.07.2015.
26
практика обаче, до 31.08.2015 се разполага с подобна информация за просрочията
на кредитополучателите. Поради тази причина е възможно да се сравни кои
кредитополучатели са прогнозирани като редовни или нередовни от страна на
модела и какво всъщност се е случило реално с тях до 31.08.2015 година. Това е
така наречения практически тест на модела, чиято изходна стойност за точността
на модела ще има най-голяма тежест при определяне на най-точния модел. Тя ще
бъде изследвана в точките „Практическо тестване и вторична точност на модела“,
съответно за LOGIT и PROBIT по отделно.
6. Методика за идентифицирането на обекти на изследването
Базата, на която се осъществява емпиричното изследване в настояващата
разработка е извлечена от кредитния портфейл на „Търговска Банка Д“ АД, която
има статут на търговска банка оперираща на територията на България, без
наличие на чуждестранни клонове. Банката има издаден пълен банков лиценз от
централната банка на страната – Българска Народна Банка. Именно поради тази
причина изследването претендира и за възможността то да бъде прилагано и
извън академичната среда, при реалната оценката на кредитния портфейл на
действащи търговски банки.
Поради съображения за конфеденциалност и опазване на банковата тайна
конкретните кредитополучатели няма да бъдат идентифицирани, както и е
необходимо да се отбележи, че изследването се базира само на представителна
извадка на случаен принцип, и то не дава пълно описание на количествените и
качествените параметри на кредитния портфейл на банката.
От портфейла на банката е филтрирана извадка от текущите
кредитополучатели, които отговарят едновременно на следните условия:
 Юридическо лице, принадлежащо на един от трите сегмента –
„Малък бизнес“, „Средни корпоративни клиенти“ и „Големи корпоративни
клиенти“;
 Избрани са само балансови експозиции, съответно са изключени
задбалансови и съдебни експозиции;
 Според своето възникване и приключване на кредитната
експозиция, никоя от тях не следва да е възникнала и/или приключила в
27
годината на изследваната група, тоест 2014 за извадка „2013/2014” и 2015
за извадка „2014/2015”;
 Просрочията на извадката от нередовни кредитополучатели не
следва да надвишава 360 дни за компаниите попадащи в извадката за
„2013/2014” и 240 дни за компаниите попадащи в извадката за „2014/2015”.
Основната идея е да се изследват компании, които към датата на
съответния годишен финансов отчет са без просрочие, тъй като основната
цел на модела е да предвижда просрочия през следващите 12 месеца от
публикуването на отчетната счетоводна информация. Всъщност теорията
на моделите позволява и обратния ред, ако модела се захрани с данни за
вече нередовен кредитополучател, той има възможност да оцени, дали
компанията ще продължи да бъде нередовна през следващата една години,
или ще успее да се „върне в редовност“.
Въз основа на горните критерии на случаен принцип са селектирани общо
213 кредитни лимита на 172 компании, разделени на две съвкупности както
следва:
 Съвкупност 2013/2014 – данните на тези компании ще се използват
за съставяне на регресионен модел и извличане на регресионни
коефициенти, поради тази причина тази съвкупност може да бъде наречена
регресионна съвкупност;
 Съвкупност 2014/2015 - данните на тези компании ще се използват
последващо тестване на прогностичната способност на модела съставен
въз основна на горната съвкупност, поради тази причина тази съвкупност
може да бъде наречена тестова съвкупност.
Разминаването между броя кредитополучатели и броя кредитни лимит се
обуславя от факта, че някои компании разполагат с повече от един кредитен
лимит, които обаче се различават по своите параметри като например: вид, лихвен
процент, сума на обезпечението, покритие на главницата срок и др. Поради факта,
че входящи фактори характеризиращи самия кредитен лимит в последствие се
включват в регресионните модели, бе предприето, тези компании да бъдат
28
включени в регресионните модели по няколко пъти, според броя на разрешените
им лимити. По детайлна информация за броя на кредитополучателите и броя на
кредитните лимити използвани в настоящата разработка е представена в
Таблица 1
Съответно за всеки един кредитополучател, респективно кредитен лимит е
извлечена информация от следните източници, въз основна на която на по-късен
етап следва да се конструират входящите параметри на модела.
 Баланс;
 Отчет за приходи и разходи;
 Отчет за паричния поток;
 Данни от кредитния портфейл на банката като:
o Кредитополучател;
o Тип на кредитния лимит, спрямо следния шифър:
001 – Стандартен кредит с погасителен план;
002 – Кредитна линия;
003 – Револвиращ кредит;
004 – Овърдрафт;
005 – Фирмена кредитна карта;
o Разрешен размер;
o Дни на просрочие на главницата;
o Лихвен процент общо (като сума от лихвения процент и
размера на годишните такси и комисионни дължими по лимита);
o Дата на договор за кредит;
o Дата на активиране на кредита (преди 31.12.2014);
o Дата на приключване на кредита (след 31.12.2015);
o Обща сума на обезпечението;
o Вид на плащане на главницата – анюитет, равни вноски по
главница и свободен (прилага се за Кредитни линии и Овърдрафт
кредити за оборотно финансиране на текущи нужди, докато първите
два типа обикновено се прилагат за инвестиционно финансиране за
закупуване и/или изграждане на ДМА);
29
o Тип на плащане на лихвите – по погасителен план или
текущи лихви (първия тип се прилага за кредити погасяващи се на
анюитети и равни вноски по главницата, докато втория при
свободен тип на погасяване на главницата);
 Търговски регистър:
o Дата на регистрация на компанията;
o Брой осигурени лица (персонал) през 2014 и 2015 година.
7. Методика при избора на входящи параметри
7.1. Първични входящи параметри на модела
Следващата стъпка след избора и организиране на база данни, е да се
идентифицира съвкупност от потенциални входящи фактори при изграждането на
регресионния модел.
В Таблица 2 са описани общо 41 потенциални входящи променливи, като е
описан методът на тяхното изчисляване и очакваната взаимовръзка със
стабилността на финансовото състояние на разглеждания кредитоискател.
Факторите са разделени в 10 основни групи както следва:
 Банков портфейл;
 Парични потоци;
 Развитие и спецификация на фирмата;
 Управление на човешките ресурси;
 Показатели за ликвидност;
 Коефициенти за ефективност;
 Показатели характеризиращи рентабилността;
 Анализ на зависимостта между рентабилността и ангажираността на
капитала;
 Показатели характеризиращи обращаемостта на активите;
 EBITDA (Earnings before interest, taxes, depreciations and
amortizations – Приходи преди лихви, данъци и амортизации).
30
7.2. Оценка и избор на статистически значими параметри за модела
По отношение на избора на най-подходящи входящи променливи за даден
регресионен модел съществува широк набор от статистически методи и
алгоритми, много от които представляват сериозна трудност за разбирането им от
страна на не професионалисти в сферата на статистиката. Поради тази причина в
настоящата разработка са предложени две различни методологии за избор на най-
подходящи фактори измежду представените в горната точка 41 фактора, като
единият метод е базиран повече на статистическата теория, докато другият от
своя страна залага повече на икономическата интуиция. Преди това обаче е
представен и един класически метод базиран на Student`s T-test.
7.2.1. Метод на базиран на Student`s T--test
Статистическо обследване на стойностите на гореописаните фактори е
представено в Таблица 3, като са изчислени средната стойност и стандартното
отклонение. Въз основа на последните две колони на таблицата, където са
представени стойностите на Students`Т-test, според който ако стойността на P-
Value е по-малка от 0,05 се наблюдава статистически значимо различие между
стойностите на даден показател изчислен за групата от редовните
кредитополучатели и за групата на нередовните кредитополучатели.69 70
Съответно въз основа на данните от последните две колони в Таблица 3,
може да се види, че по отношение на факторите X3, X4, X18, X30, X33, X41, двете
групи на редовни и нередовни кредитни лимити статистически се различават.
Например, средния размер на покритието на кредитните лимити, които са били
редовни през последните 12 месеца е 3,13, докато покритието на нередовните
експозиции е 4,58. Това различие може да се обясни със стремежа на
мениджмънта на банката да изисква по-висок дял на обезпечението за видимо по-
рисковите експозиции, според тяхната преценка.
В случая някои автори използват именно факторите идентифицирани по
този метод изведени в Таблица 5 за последващото изграждане на регресионните
69
Student. (1908a). The probable error of a mean. Biometrika VI,, 1-25.
70
Student. (1908b). Probable error of a correlation coefficient. Biometrika VI,, 302-310.
31
модели.71 72 73
Освен тях обаче, в следващата точка са представени и два други
алтернативни метода.
7.2.2. Метод на „Изчистване на корелационната матрица“
Този метод се базира изцяло на статистическата теория и корелационната
матрица на Pearson. 74
При него се стартира с корелационната матрица,
изобразяваща корелацията между всички 41 входящи фактора (X1, X2, ….X41) и
независимата променлива Y, като също така са идентифицирани и статистически
значимите корелации между тях, при степен на свобода от 0.05.
В последствие един по един се изключват фактори от матрицата като
крайната цел е да останат определен брой фактори, които да отговарят
едновременно на следните условия:
 Да имат максимално висока и статистически значима корелация със
зависимия фактор Y;
 Да имат минимална корелация помежду си.
Въз основа на този метод са избрани общо 9 фактора 75
, отговарящи
едновременно на горните две изисквания и те са посочени в Таблица 5, заедно с
корелацията им спрямо зависимата променлива.
7.2.3. Метод на „Най-добрия от всяка група“
Видно от горния метод за избор на подходящи регресионни фактори, не са
обхванати всички групи от фактори, които бяха първоначално подбрани, като в
случая отпадат факторите от следните групи:
 Парични потоци;
 Управление на човешките ресурси;
71
Soleimani, A. S., & Salimi, S. V. (2012). Corporate Bankruptcy Prediction Using a Logit Model
Evidence from Listed Companies of Iran. World Applied Sciences Journal 17, 1143-1148.
72
Tetteh, M. L., Tetteh, F. A., & Ansah, A. Y. (2014). Credit Default Modeling: a Logit Approach.
Research Journal of Finance and Accounting Vol.5.
73
Low, S.-W., Nor, F. M., & Yatim, P. (2001). Predicting corporate financial distress using the logit
model: The case of Malaysia. Asian Academy of Management Journal vol. 6, 49-61.
74
Pearson, K. (1895). Notes on regression and inheritance in the case of two parents. Proceedings of the
Royal Society of London, 58, 240-242.
75
По отношение фактораX41 следваше да бъде изключен, но поради неизменното му теоретико-
практично значение при оценката на кредитния риск, фактор X41 бе допълнително включен, с цел
максимално подобряване на крайния модел.
32
 Показатели характеризиращи рентабилността;
Поради тази причина се поставя под въпрос значението и на факторите и
от тези групи, в следствие на което е направен подбор на входящи променливи и
по метода на „Най-добрия от всяка група“. Този метод се обуславя повече на
теорията на финансите и банковото дело, и цели максималното обхващане на
различните групи от фактори изследващи по един или друг начин финансовото
състояние на дадена компания. Изхождайки от този метод се избират фактори,
които отговарят едновременно на следните условия:
 Да имат максимално висока корелация със зависимата променлива
Y, като не е значително тя да е статистически значима съгласно
корелационната матрица на Pearson;
 Да се в включи само един фактор от всяка група;
 Да има минимална корелация между избраните фактори.
Въз основа на този метод са избрани общо 10 фактора 76
, отговарящи
едновременно на горните две изисквания и те са посочени в Таблица 6, заедно с
корелацията им спрямо зависимата променлива.
7.3. Оценка на трите метода за избор на входящи параметри и избор на
окончателни входящи параметри за модела
Най-простатата и елементарна оценка за качеството на избраните входящи
променливи може да се направи като се сравни размера на средноаритметичната
стойност на сумата от модулите на техните корелационни стойности спрямо
независимата променлива Y. Видно от Таблица 2, Таблица 4, Таблица 5 и
Таблица 6, тази стойност за всички предварително избрани 41 фактора е 0.1090,
съответно при модела на изчистената матрица тя е 0,2312, при модела на най-
добрия показател от всяка група тя е 0,2037 , докато при сравнителната таблица на
Student тя е 0,2850. Съответно предположението, е че която група от фактори има
по-голяма корелация с независимата Y, съответно тази група от фактори би
имала най-голяма обяснителна способност. В случая това е групата избрана, чрез
Student`s T-test. Друго заключение, което може да се направи все още на този етап,
76
По отношение показателя X4 следваше да бъде изключен, но поради изключително високата му
корелация спрямо Y, фактор X4 бе допълнително включен, с цел максимално подобряване на
крайния модел.
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov
1. Master Thesis - Petar Kirkov

Contenu connexe

Similaire à 1. Master Thesis - Petar Kirkov

Дипломна работа: учебно съдържание по ООП - Светлин Наков
Дипломна работа: учебно съдържание по ООП - Светлин НаковДипломна работа: учебно съдържание по ООП - Светлин Наков
Дипломна работа: учебно съдържание по ООП - Светлин НаковSvetlin Nakov
 
Приложение 2 Долище
Приложение 2 ДолищеПриложение 2 Долище
Приложение 2 Долищеecofactorvarna
 
Приложение 2 към чл. 6 на Агрокооператив-Ник
Приложение 2 към чл. 6 на Агрокооператив-НикПриложение 2 към чл. 6 на Агрокооператив-Ник
Приложение 2 към чл. 6 на Агрокооператив-Никecofactorvarna
 
Google recommendation for security and protection
Google recommendation for security and protectionGoogle recommendation for security and protection
Google recommendation for security and protectionSasho Stoyanov
 
Stefan Tafkov University Work
Stefan Tafkov University WorkStefan Tafkov University Work
Stefan Tafkov University WorkStefan Tafkov
 
Mi Tesis de UNWE - Дипломна работа ESS Taxback 2003
Mi Tesis de UNWE - Дипломна работа ESS Taxback 2003Mi Tesis de UNWE - Дипломна работа ESS Taxback 2003
Mi Tesis de UNWE - Дипломна работа ESS Taxback 2003Aneta Kazakova
 
Innovation_Pitching + fundraising.pdf
Innovation_Pitching + fundraising.pdfInnovation_Pitching + fundraising.pdf
Innovation_Pitching + fundraising.pdfPetyaBankova
 
Приложение 2 Медекс ООД
Приложение 2 Медекс ООДПриложение 2 Медекс ООД
Приложение 2 Медекс ООДecofactorvarna
 

Similaire à 1. Master Thesis - Petar Kirkov (11)

Дипломна работа: учебно съдържание по ООП - Светлин Наков
Дипломна работа: учебно съдържание по ООП - Светлин НаковДипломна работа: учебно съдържание по ООП - Светлин Наков
Дипломна работа: учебно съдържание по ООП - Светлин Наков
 
Наръчник на учетеля
Наръчник на учетеляНаръчник на учетеля
Наръчник на учетеля
 
User guide bulgarian
User guide bulgarianUser guide bulgarian
User guide bulgarian
 
Приложение 2 Долище
Приложение 2 ДолищеПриложение 2 Долище
Приложение 2 Долище
 
Приложение 2 към чл. 6 на Агрокооператив-Ник
Приложение 2 към чл. 6 на Агрокооператив-НикПриложение 2 към чл. 6 на Агрокооператив-Ник
Приложение 2 към чл. 6 на Агрокооператив-Ник
 
Google recommendation for security and protection
Google recommendation for security and protectionGoogle recommendation for security and protection
Google recommendation for security and protection
 
Stefan Tafkov University Work
Stefan Tafkov University WorkStefan Tafkov University Work
Stefan Tafkov University Work
 
Master_thesis2012_FIN
Master_thesis2012_FINMaster_thesis2012_FIN
Master_thesis2012_FIN
 
Mi Tesis de UNWE - Дипломна работа ESS Taxback 2003
Mi Tesis de UNWE - Дипломна работа ESS Taxback 2003Mi Tesis de UNWE - Дипломна работа ESS Taxback 2003
Mi Tesis de UNWE - Дипломна работа ESS Taxback 2003
 
Innovation_Pitching + fundraising.pdf
Innovation_Pitching + fundraising.pdfInnovation_Pitching + fundraising.pdf
Innovation_Pitching + fundraising.pdf
 
Приложение 2 Медекс ООД
Приложение 2 Медекс ООДПриложение 2 Медекс ООД
Приложение 2 Медекс ООД
 

1. Master Thesis - Petar Kirkov

  • 1. УНИВЕРСИТЕТ ЗА НАЦИОНАЛНО И СВЕТОВНО СТОПАНСТВО ФИНАНСОВО СЧЕТОВОДЕН ФАКУЛТЕТ КАТЕДРА „ФИНАНСИ“ МАГИСТЪРСКА ПРОГРАМА ПО „БАНКОВО ДЕЛО И МЕЖДУНАРОДНИ ФИНАНСИ“ ПЕРСПЕКТИВИ ПРЕД ПРИЛОЖЕНИЕТО НА LOGIT И PROBIT РЕГРЕСИОННИ МОДЕЛИ, ПРИ ИЗЛЕДВАНЕТО НА КРЕДИТНИЯ РИСК НА КРЕДИТОПОЛУЧАТЕЛИТЕ В БАНКАТА МАГИСТЪРСКА ТЕЗА Петър Славчев Кирков Факултетен номер: 1420165 Дипломант гл. ас. д-р Ирина Казанджиева – Йорданова Научен ръководител СЕПТЕМВРИ 22, 2015 СОФИЯ
  • 2. 1 УНИВЕРСИТЕТ ЗА НАЦИОНАЛНО И СВЕТОВНО СТОПАНСТВО КАТЕДРА „ФИНАНСИ” МАГИСТЪРСКА ТЕЗА на тема: „Перспективи пред приложението на LOGIT и PROBIT регресионни модели, при изследване на кредитния риск на кредитополучателите в банката.” Магистърска програма по „Банково дело и международни финанси“ ДИПЛОМАНТ: Петър Славчев Кирков Факултетен номер: 1420165 НАУЧЕН РЪКОВОДИТЕЛ гл. ас. д-р Ирина Казанджиева - Йорданова
  • 3. 2 СЪДЪРЖАНИЕ Списък на използваните уравнения........................................................................................... 5 Списък на използваните графики .............................................................................................. 5 Списък на използваните таблици............................................................................................... 5 УВОД ................................................................................................................................................ 7 ИЗЛОЖЕНИЕ............................................................................................................................... 10 Глава Първа. Въведение и теоретична постановка на LOGIT и PROBIT моделите...... 10 1. Въведение в регресионния анализ ........................................................................... 10 2. Представяне на LOGIT модела ................................................................................ 13 2.1. Възникване и развитие на LOGIT ................................................................... 13 2.2. Теория и на модела ............................................................................................. 15 2.2.1. Формулировка ............................................................................................. 15 2.2.2. Графично представяне............................................................................... 16 2.2.3. Тълкуване..................................................................................................... 16 3. Представяне на PROBIT модела .............................................................................. 17 3.1. Възникване и развитие на PROBIT................................................................. 17 3.2. Теория на модела на модела.............................................................................. 18 3.2.1. Формулировка ............................................................................................. 18 3.2.2. Графично представяне............................................................................... 19 3.2.3. Тълкуване..................................................................................................... 20 4. Сфери на приложение на моделите ......................................................................... 20 Глава Втора. Практическа постановка и емпирично изследване...................................... 24 5. Детайлно описание на целта и методологията на практическото изследване 24 6. Методика за идентифицирането на обекти на изследването.............................. 26
  • 4. 3 7. Методика при избора на входящи параметри....................................................... 29 7.1. Първични входящи параметри на модела ..................................................... 29 7.2. Оценка и избор на статистически значими параметри за модела............. 30 7.2.1. Метод на базиран на Student`s T--test...................................................... 30 7.2.2. Метод на „Изчистване на корелационната матрица“.......................... 31 7.2.3. Метод на „Най-добрия от всяка група“.................................................. 31 7.3. Оценка на трите метода за избор на входящи параметри и избор на окончателни входящи параметри за модела.............................................................. 32 8. Кодиране на зависимата променлива Y ................................................................. 33 9. LOGIT модел................................................................................................................ 34 9.1. Задаване на параметри при изготвяне на модела......................................... 34 9.2. Статистически преглед на входящите параметри на модела..................... 34 9.3. Статистическа значимост на модела............................................................... 35 9.3.1. Тестване на обяснителната способност на модела................................ 35 9.3.2. Тест на нулевата хипотеза......................................................................... 35 9.3.3. Тест на входящите параметри .................................................................. 36 9.4. Коефициенти и регресионно уравнение на модела....................................... 36 9.5. Първична точност на модела............................................................................ 38 9.6. Практическо тестване и вторична точност на модела................................. 39 9.7. Визуализация на модела .................................................................................... 40 10. PROBIT модел.......................................................................................................... 41 10.1. Задаване на параметри при изготвяне на модела..................................... 41 10.2. Статистически преглед на входящите параметри на модела................. 41 10.3. Статистическа значимост на модела........................................................... 41 10.3.1. Тестване на обяснителната способност на модела................................ 41 10.3.2. Тестване на нулевата хипотеза................................................................. 41 10.3.3. Тест на входящите параметри .................................................................. 42
  • 5. 4 10.4. Коефициенти и регресионно уравнение на модела................................... 42 10.5. Първична точност на модела........................................................................ 42 10.6. Практическо тестване и вторична точност на модела............................. 43 10.7. Визуализация на модела ................................................................................ 43 Глава Трета. Допълнителен анализ и перспективи за развитие на моделите ................. 44 11. Анализ на раздалечеността ................................................................................... 44 12. Анализ на грешки от Тип 1 и Тип 2..................................................................... 45 13. Перспективи за надграждане на моделите с цел подобряване на тяхната точност................................................................................................................................... 49 ЗАКЛЮЧЕНИЕ............................................................................................................................ 51 Използвана литература............................................................................................................... 53 Приложения .................................................................................................................................. 59
  • 6. 5 Списък на използваните уравнения Уравнение 1: Линейна функция....................................................................................... 11 Уравнение 2: Кодиране на изходящата променлива Y.................................................. 13 Уравнение 3: Формулировка на LOGIT модела ............................................................. 15 Уравнение 4: Формулировка 1 на PROBIT модела........................................................ 18 Уравнение 5: Формулировка 2 на PROBIT модела........................................................ 18 Уравнение 6: Регресионно уравнение на LOGIT модела .............................................. 37 Уравнение 7: Регресионно уравнение на PROBIT модела ............................................ 42 Уравнение 8: Отношение на грешка Тип 1 спрямо грешка Тип 2................................ 48 Уравнение 9: Изразяване на грешка Тип 2, чрез грешка Тип 1 .................................... 48 Списък на използваните графики Графика 1: Линейна функция........................................................................................... 11 Графика 2: Графично представяне на LOGIT модела.................................................... 16 Графика 3: Графично представяне на PROBIT модела ................................................. 20 Графика 4: Графично представяне на регресионна съвкупност на LOGIT ................. 70 Графика 5: Графично представяне на тестова съвкупност на LOGIT.......................... 70 Графика 6: Графично представяне на регресионна съвкупност на PROBIT............... 71 Графика 7: Графично представяне на тестова съвкупност на PROBIT ....................... 71 Списък на използваните таблици Таблица 1: Обобщаване на изследваната съвкупност.................................................... 59 Таблица 2: Първични входящи фактори на модела ....................................................... 59 Таблица 3: Student`s T-test ................................................................................................ 61 Таблица 4: Входящи фактори избрани по метода на Student`s T-test........................... 62 Таблица 5: Входящи фактори избрани по метода на „Изчистване на корелационната матрица”................................................................................................. 62 Таблица 6: Входящи фактори избрани по метода на „Най-добрия от всяка група”... 63 Таблица 7: Сравнение на вторичната точност от трите групи входящи фактори....... 64 Таблица 8: Първоначални настройки на LOGIT модела ............................................... 64 Таблица 9: Статистически преглед на извадка „2013/2014” ......................................... 64 Таблица 10: Статистически преглед на входящите количествени параметри ............ 64 Таблица 11: Статистически преглед на входящите качествени параметри................. 65
  • 7. 6 Таблица 12: Тестване на обяснителната способност на LOGIT модела ...................... 65 Таблица 13: Тестване на нулевата хипотеза на LOGIT модела .................................... 65 Таблица 14: Тестване на входящите фактори на LOGIT модела.................................. 65 Таблица 15: Извеждане и тестване на регресионните коефициенти на LOGIT модела................................................................................................................................. 66 Таблица 16: Първична точност на LOGIT модела ......................................................... 66 Таблица 17: Вторична точност на LOGIT модела.......................................................... 66 Таблица 18: Първоначални настройки на PROBIT модела ........................................... 67 Таблица 19: Статистически преглед на извадка „2013/2014” ...................................... 67 Таблица 20: Статистически преглед на входящите количествени параметри ............ 67 Таблица 21: Статистически преглед на входящите качествени параметри................. 67 Таблица 22: Тестване на обяснителната способност на PROBIT модела.................... 68 Таблица 23: Тестване на нулевата хипотеза на PROBIT модела.................................. 68 Таблица 24: Тестване на входящите фактори на PROBIT модела................................ 68 Таблица 25: Извеждане и тестване на регресионните коефициенти на PROBIT модела................................................................................................................................. 68 Таблица 26: Първична точност на PROBIT модела ....................................................... 69 Таблица 27: Вторична точност на PROBIT модела........................................................ 69 Таблица 28: Анализ на раздалечеността ......................................................................... 69 Таблица29: Анализ на класификационната точка.......................................................... 69
  • 8. 7 УВОД През последните две десетилетия се наблюдаваха множество банкови и финансови кризи, които за жалост се разпространиха и към реалния сектор, който и до днес понася негативите и не може да се възстанови напълно. Безспорно най- траен отпечатък остави световната финансова криза от 2008 година. Тези събития доведоха до необходимостта от цялостно преосмисляне на постановките, относно измерването и управлението на кредитния риск, от страна на банковите институции, по отношение на техните настоящи и бъдещи кредитополучатели. Прецизното измерване на кредитния риск и възможността за фалит (Probability of default) са от огромно значение, както за банковия и финансов сектор, така и за инвеститорите, реалния сектор и всички икономически агенти като цяло. Поради тази причина тематиката става все по-актуална, особено в условия на съкращаване на разходите за аналитичен персонал от страна на банковите институции,за сметка на все по-широкото навлизане на автоматизираните системи за оценка и измерване на рисковете. Основната цел на настоящата разработка е тестването на изградена с помощта на LOGIT и PROBIT моделите, система за ранни предупредителни сигнали, (Early warning system). Разработената система има за цел да пресметне какъв е шансът по отношение на даден настоящ кредитополучател в действаща търговска банка в страната, поне веднъж да допусне просрочие по своята главница, по-голямо от 30 дни, през предстоящата една година. След успешно тестване на модела бе констатирано, че точността му по отношение на идентифицирането на потенциални редовни и нередовни кредитополучатели за бъдещ период от една година възлиза на 85,71%. Казано с други думи, при извадка от 100 кредитополучателя, изградената система успешно би идентифицирала 86 от тях, като посочи дали ще бъдат редовни или нередовни, което бива и емпирично доказано в практическата част на разработката. Съответно в отделна точка са представени и възможности за подобряване на модела с цел повишаване на неговата точност. Те от своя страна, съзнателно не са приложени в настоящата разработка, поради фактът, че за тяхното включване е необходимо провеждането на съвсем отделни, а и в някои случаи мащабни
  • 9. 8 емпирични изследвания. Тук следва да се отбележи, че самият модел има напълно реално практическо приложение, предвид факта, че е изграден въз основна на база данни от реални кредитополучатели, принадлежащи към кредитния портфейл на действаща банката в България. Като допълнителен принос, на настоящата дипломна работа,могат да се отбележат следните елементи.  Предложени са два алтернативни метода за избора на входящи променливи на модела, а именно методът на „Изчистената корелационна матрица” и методът за избор на „Най-добрият от всяка група ”. В последствие след съпоставката им с друг такъв класически метод, базиран на Student`s T-test, бе доказано, че методът на „Изчистената корелационна матрица”, се отличава, като по-надежден. Това от своя страна доказва, че простотата на предложения метод, не е за сметка на неговата точност.  В отделна точка „Анализ на раздалечеността”, включена в Глава Трета е представен иновативен метод, целящ по-задълбоченото и прецизно анализиране на резултатите от двата модела, тъй като първоначално точността на LOGIT и PROBIT бива почти еднаква, но благодарение на предложения анализ на раздалечеността, PROBIT се доказва като по- надежден.  Също в Глава Трета е обособена друга отделна точка, в която са описани разсъждения по отношение на измерването на характерните за двата вида модели грешки от Тип 1 и Тип 2. Съответно е направен и опит за извеждане на уравнение, оценяващо взаимовръзката и относителната цена на двата типа грешки, по отношение на прилагането на LOGIT и PROBIT моделите в контекста на банковото дело и в частност на изследването на кредитния риск. Следва да се отбележи, че горните три елемента са само маркирани, като не са детайлно анализирани и дискутирани, предвид основната тема на разработката и необходимостта на тях да бъдат посветени отделни и самостоятелни изследвания. Желанието за избор на настоящата тема е продиктувано от една страна поради актуалността на проблема за по-надеждното измерване на кредитния риск,
  • 10. 9 но от друга и поради факта, че разглежданите модели и перспективите пред тяхното приложение в българския банков сектор, на този етап не са били широко изследвани. Поради ясното осъзнаване от страна на автора, че тематиката бива твърде широка, настоящата разработка има основно за цел само да демонстрира как се изграждат подобен тип системи, както и да тълкува техните резултати. Поради тази причина множество от елементите на разработката, подлежат на отделно допълнително развитие, което само по себе си може да бъде предпоставка за създаването на множество други научни трудове в сферата. От друга страна, предвид насочеността на материала към аудитория принадлежаща на сферата на финансите и в частност банковото дело, съзнателно се набляга повече на самата методология по изграждането и тестването на модела и разискване на проблематиката, относно приложението му в банковата дейност. Поради тази причина специфичната иконометрична трактовка бива умишлено оставане на заден план и не е задълбочено разисквана.
  • 11. 10 ИЗЛОЖЕНИЕ Глава Първа. Въведение и теоретична постановка на LOGIT и PROBIT моделите 1. Въведение в регресионния анализ Регресионният анализ е с относително кратка история, на фона на другите математически модели, които се използват във финансите. За неговото начало се считат трудовете на Legendre1 и Gauss2 в началото на VIII век, като терминът регресия бива въведен за първи път от Galton3 , в края на VII век. Регресионният анализ оценява и изучава зависимостта и връзката между две и повече променливи величини. Той е статистически метод за определяне на връзката между зависима променлива Y и една (при проста регресия) или множество независим променливи/параметри/фактори (при сложна/множествена регресия) X1, X2,...,Xn, които в статистически смисъл влияят върху стойностите на целевата променлива Y. Характерното за него е, че той се концентрира както върху изследване на наличието на причинно-следствена зависимост между две и повече променливи величини, така и върху търсенето на функционална връзка между тях4 . Регресионният анализ се концентрира върху причинно-следствените връзки и се стреми да направи оценка на конкретната сила на тези връзки. Най-елементарният и лесно приложим тип регресия е линейната. Тя бива доста широко позната и изучавана, като фундамент в изследването на причинно- следствени връзки. Най-общо линейната регресия може да се представи с уравнение от вида: 1 Legendre, A. (1805). Nouvelles méthodes pour la détermination des orbites des comètes. Sur la Méthode des moindres quarrés” appears as an appendix. 2 Gauss, C. (1809). Theoria Motus Corporum Coelestium in Sectionibus Conicis Solem Ambientum. 3 Galton, F. (1889). Natural Inheritance. London. 4 Montgomery, D. C., Peck, E. A., & Vining, G. G. (2012). Introduction to Linear Regression Analysis. John Wiley & Sons.
  • 12. 11 Уравнение 1: Линейна функция 𝒀 = 𝜶 + 𝜷𝟏 ∗ 𝑿𝟏 + 𝜷𝟐 ∗ 𝑿𝟐 + ⋯ . + 𝜷𝒏 ∗ 𝑿𝒏 Където:  Y: Зависима променлива на модела;  Х1, X2, ….Xn: Независими променливи на модела;  α:Свободен член на модела, който е показател обхващаш фактори извън модела, които не могат да бъдат изследвани, но влияят на Y;  β1, β2,…βn:Това са коефициентите пред независимите фактори, които определят силата и посоката на влияние на дадения независими фактор Х1, X2, ….Xn; Съответно линейната регресия графично се представя по следния начин: Графика 1: Линейна функция Основното предимство на линейната регресия е нейната разбираемост и „простота“, научно приета е, както и е широко разпространена. Линейната регресия е първият метод, който се използва за много проблеми и задачи. От друга страна основен неин недостатък е, че много явления, просто не съответстват на предположенията на линейния модел, не е възможно или е много трудно да се произведат добри резултати, чрез нея.
  • 13. 12 Една основна група от тези явления са онези, при които се изследва каква е вероятността за настъпване или не, на дадено събитие. Характерно за такъв тип явления, е че зависимата променлива Y може да заема само стойности от (0;1), докато при линейните модели тя принадлежи в интервала (-∞;+∞). Поради тази причина са разработени и нелинейните модели от типа на LOGIT и PROBIT, които трансформират стойностите на Y посредством имплементиране на стандартно разпределение на стойностите. Поради този си огромен плюс в практиката все по-често се използват нелинейните модели.5 Съответно LOGIT и PROBIT моделите, са едни от най-ярките представители на нелинейните функции, за изследване на вероятности. Този тип модели изследват връзката между няколко независими променливи Х1, X2,….Xn и една зависима променлива Y, която показва какъв е шанса за настъпване на дадено събитие или не, като поради тази причина нейните стойности заемат интервал от 0 до 1 (от 0% до 100%). Друго предимство на този тип модели е, че входящите променливи могат да бъдат както качествени, така и количествени показатели. Обикновено моделите от този тип са биномни (дихотомни), което означава, че изследват явления и процеси, които имат само два взаимоизключващи се изхода, например „даден кредитен лимит ще бъде редовен през следващата една година, или няма да бъде редовен“. По-софистициран вариант на LOGIT и PROBIT моделите са полиномните модели, при които се изследват явления или процеси, при които съществуват няколко, но отново взаимоизключващи се изхода, като например „даден кредитен лимит ще бъде редовен през следващата една година, или ще бъде просрочен до максимум 30 дни, или до максимум 60 дни, или над 60 дни“67 Тези модели се градят на предположението, че въз основа на исторически данни за състоянието ключови финансови показатели за група от фалирали/нередовни и не фалирали/редовни компании (или друг вид икономически единици), има възможност да се предположи с определена точност 5 Resti A, S. A. (2007). Risk Management and Shareholders' Value in Banking: From Risk Measurement Models to Capital Allocation Policies. 6 Freedman, D. A. (2009). Statistical Models: Theory and Practice. Cambridge University Press. 7 Bessis, J. (2011). Risk Management in Banking, 3rd Edition. Wiley.
  • 14. 13 какво би се случило в бъдеще с дадена друга компания (икономическа единица), въз основна на настоящото състояние на същите ключови показатели, но пресметнати за дадената компания Съществен елемент при изграждането на LOGIT и PROBIT модели е предварително стойностите на Y да бъдат кодирани, като най-често се използва следния тип: Уравнение 2: Кодиране на изходящата променлива Y 𝒀 = { 𝟏 − излесдваното събитие настъпва 𝟎 − изледваното събитие не настъпва } Началото по отношение на измерването на риска и изграждането на модели за кредитна оценка (Credit Scoring Models), бива поставено с трудовете на Beaver8 . Altman9 от своя страна надгражда значително тези идеи и разработва цялостна система за анализ наречена Дискриминантен анализ (Multivariate Discriminant Analysis) . Трудовете на Beaver и Altman са подлагани на широко съмнение, като в последствие Ohlson10 конструира модели за кредитна оценка базирани на LOGIT анализ, докато трудовете на Zmijewski11 от своя страна са базирани на PROBIT анализа. В последствие двата типа модели придобиват изключително широка популярност, поради тяхната висока точност, която в повечето случаи е над 90%. 2. Представяне на LOGIT модела 2.1. Възникване и развитие на LOGIT Много преди да бъде разработен LOGIT моделът във вида, в който се използва в наши дни при различни типове изследвания, той е преминал през множество трансформации, като най-първоначалните му наченки могат да се търсят още при трудовете на Malthus12 , относно експоненциалното нарастване на 8 Beaver, W. (1966). Financial Ratios as Predictors of Failure. Empirical Research in Accounting:Selected Studies 1966. Journal of Accounting Research, 71-111. 9 Altman, E. I. (1968). Financial Ratios, Discriminant Analysis and Prediction of Corporate Bankruptcy. Journal of Finance, 589-609. 10 Ohlson, J. A. (1980). Financial ratios and the probabilistic prediction of bankruptcy. . Journal of Accounting Research, 109-131. 11 Zmijewski, M. E. (1984). Methodological issues related to the estimation of financial distress prediction models. Journal of Accounting Research., 59-82. 12 Malthus, T. E. (1798). An Essay on the Principle of Population. London.
  • 15. 14 населението на млади и все още негъсто населени държави. Надграждайки теорията на Malthus, Quetelet1314 , стига до извода, че ръстът на населението на подобен тип държави все някога ще се забави и ще спре, като по този начин в своята разработка той слага горната и долната граница на кривата на нарастване. По-късно асистентът на Quetelet, Verhulst, също навлиза в тематиката и в последствие публикува три разработки по темата, в които извежда математическата постановка на логаритмичната крива, както и дава нейното наименование151617 , , В последствие тази научна материя, обаче не придобива широк научен интерес и бива бързо забравена. През 20-те години на новия век, Pearl и Reed преоткриват логаритмичната функция и отново я прилагат в изследвания по отношение на нарастване на населението1819202122 .След това отново Reed но в съавторство с Berkson придават нова сфера на приложение на логаритмичната функция, а именно химията, с публикацията си, посветена на автокаталистичната верижна реакция 23 . Съответно последват множество приложения на модела в сферата на фармацевтиката и медицината, като едно от най-значимите събития е публикацията на Berkson през 1944 24 , в която по аналогия на вече утвърдилият се PROBIT модел, той дава наименованието LOGIT. 13 Quetelet, A. (1848). De systµeme social et des lois qui le regissent. Paris. 14 Quetelet, A. (1850). Notice sur Pierre-Francois Verhulst. Annuaire de l'Academie Royale des Sciences, Lettres et des Beaux-arts 16, 97-124. 15 Verhulst, P. (1838). Notice sur la loi que la population suit dans son accroissement. Correspondance Mathematique et Physique, publiee par A. Quetelet 10,, 113. 16 Verhulst, P.F. (1845). Recherches mathematiques sur la loi d'accroissement de la population. Nouveaux Memoires de l'Academie Royale des Sciences, des Lettres et des Beaux-Arts de Belgique 18, 1-32. 17 Verhulst, P.F. (1847). Deuxiµeme memoire sur la loi d'accroissement de la population. Nouveaux Memoires de l'Academie Royale des Sciences des Lettres et des Beaux-Arts de Belgique 20, 1-32 18 Pearl, R., & Reed, L. J. (1920). On the rate of growth of the population of the United States since 1870 and its mathematical representation. Proceedings of the National Academy of Sciences 6, 275-288 19 Pearl, R., & Reed, L. J. (1922). A further note on the mathematical theory of population growth. Proceedings of the National Academy of Sciences 8, 365-368. 20 Pearl, R., & Reed, L. J. (1923). On the mathematical theory of population growth. Metron 5, 6-19. 21 Pearl, R. (1927). The indigenous population of Algeria in 1926. Science 66, 593-594. 22 Pearl, R., Winsor, C. P., & White, F. B. (1928). The form of the growth curve of the cantaloupe (Cucumis melo) under feld conditions. Proceedings of the National Academy of Sciences 14, 895-901. 23 Reed, L. J., & Berkson, J. (1929). The application of the logistic function to experimental data. Journal of Physical Chemistry 33, 760-779. 24 Berkson, J. (1944). Application of the logistic function to bioassay. Journal of the American Statistical Association 39, 357–65.
  • 16. 15 Както става ясно, до този момент логаритмичната регресия се използва като средство за анализиране на протичащи процеси, а не като средство за определяне на вероятности. По отношение на сферата на икономиката и финансите, въз основна на трудовете на Martin25 ,. LOGIT модела придобива голяма популярност в и се превръща е един от най-често срещаните модели са предвещаване на фалити на действащи икономически единици като фирми банки и др. 2.2. Теория и на модела 2.2.1. Формулировка В литературата се използват множество различни буквени означения, както и структури на LOGIT функцията въз, основна на различни математически преобразования. Въпреки това една от най-често срещани формулировки на функцията, която следва и да се дискутира с развитието на настоящият труд следва да се запише така: Уравнение 3: Формулировка на LOGIT модела 𝑷𝒓(𝒀 = 𝟏|𝑿𝒏) = 𝟏 𝟏 + 𝒆𝒙𝒑(−𝒁) = 𝒆𝒙𝒑(𝒁) 𝟏 + 𝒆𝒙𝒑(𝒁) Където:  Pr(Y=1│Xn): това е крайният показател/продукт на LOGIT модела и показва каква е вероятността изходът от модела/зависимият фактор, да получи стойност 1, тоест даденото събитие да настъпи (Y=1, Y е зависимият фактор), при конкретни стойности на независимите фактори Х1, X2, ….Xn;  Y: изходяща зависимата променлива на модела. Yϵ (0;1);  exp(Z): чете се „експонента от Z“, което се пресмята като е на степен Z (ez );  Z: това е най-същественият елемент на модела, като той показва кои са независимите фактори и какво е тяхното влияние върху модела. Z се изчислява по следният начин;  Z= (α+β1*X1+ β2*X2+….+ βn*Xn)=Σ(α+ βn*Xn),Z (-∞ ; +∞) където: 25 Martin, D. (1977). Early warning of bank failure: A logit regression approach. Journal of Banking & Finance vol. 1, issue 3, 249-276.
  • 17. 16 o Х1, X2, ….Xn: входящи независими променливи на модела, които могат да бъдат количествени и качествени; o β1, β2,…βn: това са коефициентите пред независимите фактори, които определят силата и посоката на влияние на дадения независими фактор Х1, X2, ….Xn; o α:свободен член на модела, който е показател обхващаш фактори извън модела, които не могат да бъдат изследвани, но влияят на Y; Съответно LOGIT модела се базира на логаритмичното разпределение, и поради тази причина в уравнението е включена експонентата -exp(Z). Друга важна особеност е, че с нарастване на Z, нарастват и Y, тоест вероятността за настъпване на даденото събитие. 2.2.2. Графично представяне Графика 2: Графично представяне на LOGIT модела 2.2.3. Тълкуване В ляво е представено логаритмичното разпределение от което се извежда и LOGIT моделът, който от своя страна е представен в дясно. Видно от дясната графика, моделът напълно отговаря на специфичните предимства на нелинейната логаритмична регресия, които се състоят в следното:  По оста X са нанесени стойностите на независимите фактори, които могат да заемат стойности от минус безкрайност до плюс безкрайност;
  • 18. 17  Изходите от модела (стойностите на зависимата) променлива са изобразени по оста Y, като видно както вече бе споменато те са ограничени, между 0 и 1, независимо от липсата на ограничение при X;  Стойностите на Y клонят към 0 и 1 но никога не ги достигат, защото при стойности на Y=0 или Y=1 логаритъмът бива недефиниран и регресията става невъзможна;  Съответно с нарастване на Z, зависимата променлива започва да клони към 1, а с намаляване на Z към 0 3. Представяне на PROBIT модела 3.1. Възникване и развитие на PROBIT В научната литература, най-често с възникването на PROBIT моделите се свързва Chester Bliss и Gaddum, но по-задълбочен преглед показва, че корените на методологията залегнала в модела се крият още в трудовете на Fechner26 , където в изследването си той открива, че хората не реагират еднакво на различни външни стимули и поради тази причина се заема да трансформира наблюдаваните различия в стандартни отклонения. Други автори също със значими и по-ранни открития от тези на Bliss са Aitchison и Brown27 . По-късно за първи път в серия от научни публикации Bliss за първи път въвежда термина PROBIT (на кратко от английския израз - „Probability unit“)28 . По-това време заедно с Bliiss, и Guddum въвежда методи за по-точното изчисляване на моделите29 . Важен елемент от развитието на науката, по отношение на PROBIT модела е също така и написаната книга по темата от страна на Finney 30 , който е заимствал идеите си от разработките на предните два автора. Следва да се отбележи, че до този момент, PROBIT анализът е използван главно в сферата на медицината, здравеопазването и фармацевтиката. През 50-те години на новия век, за първи път моделът бива прилаган в сферата на 26 Fechner, G. T. (1860). Elemente der Psychophysik. Leipzig: Breitkopf und HÄartel. 27 Aitchison, J., & Brown, J. A. (1957). The Lognormal Distribution. University of Cambridge, Department of Applied Economics. Cambridge University Press. 28 Bliss, C. I. (1934). The method of probits. Science 79. 29 Gaddum, J. H. (1933). Reports on Biological Standard III. Methods of Biological Assay Depending on a Quantal Response. London: Special Report Series of the Medical Research Council, no. 183. 30 Finney, D. (1971). Probit Analysis (Third ed.). Cambridge University Press. First edition in 1947.
  • 19. 18 икономиката и маркетинга от Farrell 31 , който използва PROBIT моделите за изследване на склонностите на потребителите по отношение на различни типове автомобили, а Adam32 го прилага по отношение на изследване на пазара на запалки за цигари. В последствие поради добрата аналитична способност на модела, той бива все по-широко прилаган (в повечето случаи успоредно с LOGIT) в множество изследвания в сферата на икономиката, финансите банковото дело и други. Трудове на които си струва да се обърне внимание са например тези на Theodossiou 33 , където той успява да постигне 93,7% точност на модела, по отношение на оценка на бизнес сектора в Гърция, което спрямо по-голямата част от PROBIT моделите се счита за сравнително висока точност. 3.2. Теория на модела на модела 3.2.1. Формулировка Аналогично на LOGIT модела, при дефинирането на PROBIT модела, също се наблюдават множество вариации, но за целите на настоящата разработка ще се използва следната дефиниция, която се базира на нормалното разпределение и поради тази причина е малко по-комплицитна за представяне в сравнение с формулировката на LOGIT. Уравнение 4: Формулировка 1 на PROBIT модела 𝐏𝐫(𝐘 = 𝟏│𝐗𝒏) = 𝟏 √𝟐𝝅 ∫ 𝐞𝐱𝐩 (− 𝒙 𝟐 𝟐 ) 𝒅𝒛 𝒛 −∞ По-лесно за разбиране представяне на формулировката на модела е дадено в долната формула; Уравнение 5: Формулировка 2 на PROBIT модела 𝐏𝐫(𝐘 = 𝟏│𝐗𝐧) = 𝚽(𝐙) Където: 31 Farrell, M. J. (1954). The demand for motorcars in the United States. Journal of the Royal Statistical Society series A 117, 171-200. 32 Adam, D. (1958). Les Reactions du Consommateur Devant les Prix. Paris: Sedes: Number 15 in Observation Economique. 33 Theodossiou, P. (1991). Alternative models for assessing the financial condition of business in Greece . Journal of Business Finance and Accounting, Vol. 18 No. 5, pp. 697-720.
  • 20. 19  φ: използва се за обозначаване на стандартното нормално разпределение;  φ(Z): Показва каква е стойността на стандартното нормално разпределение при зададената стойност на Z;  Pr(Y=1│Xn): това е крайният показател/продукт на LOGIT модела и показва каква в вероятността изхода от модела/зависимият фактор да получи стойност 1, тоест даденото събитие да настъпи (Y=1, Y е зависимият фактор), при конкретни стойности на независимите фактори Х1, X2, ….Xn;  Y: изходяща зависимата променлива на модела. Yϵ (0;1);  Z: това е най-същественият елемент на модела, като той показва кои са независимите фактори и какво е тяхното влияние върху модела. Z се изчислява по следният начин:  Z= (α+β1*X1+ β2*X2+….+ βn*Xn)=Σ(α+ βn*Xn),Zϵ (-∞;+∞), където: o Х1, X2, ….Xn: входящи независими променливи на модела. Могат да бъдат количествени и качествени; o β1, β2,…βn: това са коефициентите пред независимите фактори, които определят силата и посоката на влияние на дадения независими фактор Х1, X2, ….Xn; o α – свободен член на модела, който е показател обхващаш фактори извън модела, които не могат да бъдат изследвани, но влияят на Y; Както става видно, тълкуването на факторите на PROBIT е почти аналогично с това на LOGIT, както и се наблюдава пълна аналогия, по отношение на факта че с нарастване на Z, нарастват и Y, тоест вероятността за настъпване на даденото събитие. 3.2.2. Графично представяне
  • 21. 20 Графика 3: Графично представяне на PROBIT модела 3.2.3. Тълкуване На лявата графика е представено нормалното разпределение, а на дясната самият PROBIT модел. Тълкуванието на кривата на PROBIT модела е напълно аналогично на това на LOGIT. Въз основа на гореизложеното, може да се обобщи, че по своята методология, приложение и тълкуване моделите LOGIT и PROBIT са почти идентични, като основното различие се наблюдава по отношение на формулировката им и тяхното графично изобразяване, дължащо се на това, че LOGGIT използва логаритмичното разпределение, докато PROBIT използва нормалното разпределение. Съответно графично представен PROBIT се характеризира с „по-голяма острота“ и по-ясно разграничение, между вероятността за настъпване на дадено събитие или не. Това от своя страна ще бъде и емпирично демонстрирано в точка „Анализ на раздалечеността” 4. Сфери на приложение на моделите С увеличаване на своята популярност и най-вече високата си степен на обяснителност/доказателственост при използването им, LOGIT и PROBIT намират все по-широко практическо приложение, като са използвани в изследвания в широк спектър от различни сфери като:  В сферата на здравеопазването при пресмятането на вероятностите от възникване на дадено заболяване, при наличието на определени рискови
  • 22. 21 фактори като степен на заболяване, възраст на индивида, трудови навици и др.34 35 36 37 ;  Фармацевтиката и химическата промишленост при съставянето на модели за влиянието на даден химичен елемент върху даден химичен процес;  При застраховането за пресмятане на рисковете при определяне на рисковата група на дадено потенциално за застраховане лице или група от лица38 39 ;  В сферата на социологическите проучвания, относно потенциалния изхода за даден социален въпрос, предстоящ избор на политическа партия или изход от референдум или др.40 ;  При вземане на решения относно изразходването на публични средства, въз основа на вероятността за различни предпочитания на индивидите41 ;  Маркетингови проучвания, въз основа на които да се направят изводи за потенциалните предпочитания на даден индивид въз основна на група определящи фактори, като социален статус, образование, възраст и др.42 43 ; 34 Kologlu, M., Elker, D., Altun, H., & Sayek, I. (2001). Valdation of MPI and OIA II in two different groups of patients with secondary peritonitis. Hepato-Gastroenterology Vol. 48, № 37, 147-151 35 Biondo, S., Ramos, E., & Deiros, M. (2000). Prognostic factors for mortality in left colonic peritonitis: a new scoring system. J. Am. Coll. Surg. Vol. 191, № 6, 635-642. 36 Marshall, J., & Cook, D. (1995). Multiple Organ Dysfunction Score: A reliable descriptor of a complex clinical outcome. Care Med Vol. 23, 1638-1652. 37 Gall, J. R., Lemeshow, S., & Saulnier, F. (1993). A new Simplified Acute Physiology Score (SAPS II) based on a European/North American multicenter study. JAMA Vol. 270., 2957-2963. 38 Keane, M. P. (2004). Modeling Health Insurance Choice Using the Heterogeneous Logit Model. Department of Economics Yale University . 39 Wen, C.-H., Wang, M.-J., & Lan, L. W. (1914). Discrete choice modeling for bundled automobile. Insurance Policies. Journal of the Eastern Asia Society for Transportation Studies, Vol. 6, 1928-2005. 40 Harrell, F. E. (2001). Regression Modeling Strategies. Springer-Verlag. 41 Harrell, F. E. (2001). Regression Modeling Strategies. Springer-Verlag. 42 Adam, D. (1958). Les Reactions du Consommateur Devant les Prix. Paris: Sedes: Number 15 in Observation Economique. 43 Farrell, M. J. (1954). The demand for motorcars in the United States. Journal of the Royal Statistical Society series A 117, 171-200.
  • 23. 22  В психологията и социалните науки, като се съставят модели за предричане на поведението и/или предпочитанията на даден индивид , въз основна на група определящи фактори44 ; Може би обаче най-широко е използването им днес е в сферата на финансите и банковото дело при определяне на така наречения риск от наплащане и/или фалит (Probability of default), като моделите днес са толкова софистицирани, че са в състояние да бъдат приложени по отношение на широк спектър от изследвания като например:  Анализ на индивидуална икономическа единица и вероятността й за изпадане в неплатежоспособност и фалит45 ;  Анализ за риска от фалит на новосформирани високотехнологични компании, познати като „старт-ъп компании“ (start-up)46 ;  Анализ на кредитния портфейл на дадена банка47 ;  Анализ на цяла банкова институция или банковия сектор като цяло48 49 50 ;  Анализ за риска от неплатежоспособност на община или друг вид обособена държавна самостоятелна единица51 ;  Анализ на състоянието на цели икономически сектори52 53 54 55 56 ; 44 Little, T. D. (2013). The Oxford Handbook of Quantitative Methods in Psychology: Vol. 2 Statistical Analysis. Oxford university press. 45 Soleimani, A. S., & Salimi, S. V. (2012). Corporate Bankruptcy Prediction Using a Logit Model Evidence from Listed Companies of Iran. World Applied Sciences Journal 17, 1143-1148 46 Biondo, S., Ramos, E., & Deiros, M. (2000). Prognostic factors for mortality in left colonic peritonitis: a new scoring system. J. Am. Coll. Surg. Vol. 191, № 6, 635-642. 47 Karacula, E. (2009). An application of logit and probit models over the default probabilities of retail banking mortgage credits. Instanbul bilgi university, Institute of social science. 48 Memić, D. (2015). Assessing Credit Default using Logistic Regression and Multiple Discriminant Analysis: Empirical Evidence from Bosnia and Herzegovina. University Sarajevo School of Science and Technology - Department of Economics. 49 Gurný, P., & Gurný, M. (2013). Comparison of credit scoring models on probability of default estimation for US banks. Prague economic papers, 2, 163-181. 50 Ploeg, S. (2010). Bank default prediction models a comparison and an application to credit rating transitions;. Erasmus university rotterdam and Earst & Young. 51 Puntillo, P. (2012). Predictive models of default risk in local governments. A logistic regression. Business Economics University of Calabria, Department of Business Science. 52 Yazdanfar, D., & Nilsson, M. (2008). The bankruptcy determinants of Swedish SMEs. Institute for Small Business & Entrepreneurship. 53 Aliakbari, S. (2009). Prediction of Corporate Bankruptcy for the UK Firms in Manufacturing Industry. Brunel University Department of Economics and Finance. 54 Blanco, A., Irimia, A., & Oliver, M. D. (2012). The Prediction of Bankruptcy of Small Firms in the UK using Logistic Regression. University of Seville, Department of Financial Economics and Operations Management.
  • 24. 23  Анализ за риска от неплатежоспособност на цяла държава57 ;  Също така моделите могат да се използват при тестването и математическото формализиране на дадени икономически теории, както и извеждане на финансови ковенанти58 59 60 61 62 . Видно от горните примери, LOGIT и PROBIT моделите практически имат неограничена сфера на приложение. Следва обаче да се направи едно много важно уточнение, поради своята специфика, изследваните примери, спрямо които следва да се прилагат моделите, трябва да бъдат изключително специфично систематизирани, като в повечето случай възможните варианти от изхода на модела трябва да бъдат дихотомни, тоест да бъдат сведени до два взаимоизключващи се изхода или полиномни, в такъв случай е необходимо да бъдат сведени до няколко взаимоизключващи се изхода 55 Pederzoli, C., & Torricelli, C. (2010). A parsimonious default prediction model for Italian SMEs. Banks and Bank Systems, Volume 5, 5-9. 56 Janer, J. (2011). Bankruptcy Prediction and its Advantages. Copenhagen Business School, Department of Economics. 57 Petr Jakubík, P. T. (2008). The Prediction of Corporate Bankruptcy and Czech Economy’s Financial Stability through Logit Analysis. Czech National Bank and Charles University Prague. 58 ashid, A., & Abbas, Q. (2011). Predicting Bankruptcy in Pakistan. Theoretical and Applied Economics Volume XVIII, 103-128 59 Bonfim, D. (2009). Credit risk drivers: Evaluating the contribution of firm level information and of macroeconomic dynamics. Journal of Banking & Finance, 281-299. 60 Keen, R. Z. (2007). Default probability for the Jordanian companies: a test of cash flow theory. University of Wollongong. 61 Comelli, F. (2014). Comparing the Performance of Logit and Probit Early Warning Systems for Currency Crises in Emerging Market Economies. International Monetary Fund. 62 Fernandes, J. E. (2005). Corporate credit risk modeling: Quantitve rating system and probability of default estimation.
  • 25. 24 Глава Втора. Практическа постановка и емпирично изследване 5. Детайлно описание на целта и методологията на практическото изследване Както вече беше споменато основната цел на настоящия труд е да разработи напълно и тества, реален и действащ модел, имащ за цел идентифицирането на потенциални проблемни и бъдещи нередовни кредитополучатели в действаща търговска банка от страната. Моделът се прилага по отношение на вече действащи кредитополучатели, а не настоящи кредитоискатели.Последното е предприето, понеже допълнителното финансиране може както да подобри състоянието на дадена компания, така и да го влоши. Това от своя страна следва да бъде подложено на допълнителен анализ с изводите от който, LOGIT и PROBIT моделите да бъдат допълнително коригирани. Изхождайки от основната трактовка на регресионните модели и в частност на нелинейните LOGIT и PROBIT, тяхното изграждане и приложение се базира на исторически данни за изминал период, въз основна на които се съставя подходящо регресионно уравнение, което да има прогностична способност по отношение на даден бъдещ период. В академичната литература и практичната сфера се наблюдават различни методите на структуриране на двата периода (исторически и прогностичен), по отношение на отстоянието на въпросните два периода, спрямо настоящия момент на изследването. Някои автори разглеждат например, структура от типа „t-3, t-2, t-1;t+1, t+2, t+3“, което означава, че въз основа на исторически данни за 3 години назад се търси успешна прогностичност през следващите 3 бъдещи години от момента на изследването. Други автори от своя страна разглеждат структура от типа „t-2 или t-3, t+1“, което се изразява в това, че според тях прогностичните сигнали за влошаване на състоянието на дадена компания не се съдържат в предходната година, ами понякога в 2 или 3 години преди настоящия момент на изследването, като за целта те провеждат
  • 26. 25 допълнително отделно специфично изследване именно само по това направление63 64 65 66 67 . В настоящата разработка е използвана структура от типа „t-1, t+1“, което означа, че въз основа на исторически данни от една година назад във времето се съставя регресионен модел, имащ за цел да прогнозира една година напред във времето. Избора на тази структура се обуславя от факта, че в разработката се използват входящи променливи, които са базирани единствено въз основна на финансовото състояние на даден кредитоискател и ограничен набор от информация извлечена от банковия портфейл на банката. В такъв случай не са включени променливи, които да отразяват външни за кредитоискателите и банката влияния, като макроикономическата среда, политическата среда и др По-конкретно изследването е изградено на следния принцип. Първоначално е идентифицирана група от компании „2013/2014“(Регресионна съвкупност), при която от една страна въз основна на данни през 2013, като източник за тези данни са техните финансови отчети към 31.12.2013, банковия портфейл и търговския регистър и от друга страна въз основна на данни за редовността или просрочията на тези компании през 2014 е изградено регресионно уравнение. Втората група компании са така наречените „2014/2015“68 (Тестова съвкупност) и те следва да се използват при практическото тестване на модела. Чрез вече съставното регресионно уравнение с помощта на първата група компании „2013/2014“ и финансовите данни на компаниите от група „2014/2015“ следва да се провери на практика, кои компании от втората група следва да бъдат идентифицирани от модела като нередовни кредитополучатели през следващите 12 месеца, в случая това е 2015 година. На 63 Gurný, P., & Gurný, M. (2013). Comparison of credit scoring models on probability of default estimation for US banks. Prague economic papers, 2, 163-181. 64 Rashid, A., & Abbas, Q. (2011). Predicting Bankruptcy in Pakistan. Theoretical and Applied Economics Volume XVIII, 103-128. 65 Memić, D. (2015). Assessing Credit Default using Logistic Regression and Multiple Discriminant Analysis: Empirical Evidence from Bosnia and Herzegovina. University Sarajevo School of Science and Technology - Department of Economics. 66 Yazdanfar, D., & Nilsson, M. (2008). The bankruptcy determinants of Swedish SMEs. Institute for Small Business & Entrepreneurship. 67 Kasgari, A. A., Salehnezhad, S. H., & Ebadi, F. (2013). The Bankruptcy Prediction by Neural Networks and Logistic Regression. International Journal of Academic Research in Accounting, Finance and Management Sciences Vol. 3, 146-152. 68 Предвид датата на изготвяне на настоящата разработка и желанието за максимална актуалност на данните, периода за 2015 все още не е напълно изтекъл и реално се разглежда само до 31.07.2015.
  • 27. 26 практика обаче, до 31.08.2015 се разполага с подобна информация за просрочията на кредитополучателите. Поради тази причина е възможно да се сравни кои кредитополучатели са прогнозирани като редовни или нередовни от страна на модела и какво всъщност се е случило реално с тях до 31.08.2015 година. Това е така наречения практически тест на модела, чиято изходна стойност за точността на модела ще има най-голяма тежест при определяне на най-точния модел. Тя ще бъде изследвана в точките „Практическо тестване и вторична точност на модела“, съответно за LOGIT и PROBIT по отделно. 6. Методика за идентифицирането на обекти на изследването Базата, на която се осъществява емпиричното изследване в настояващата разработка е извлечена от кредитния портфейл на „Търговска Банка Д“ АД, която има статут на търговска банка оперираща на територията на България, без наличие на чуждестранни клонове. Банката има издаден пълен банков лиценз от централната банка на страната – Българска Народна Банка. Именно поради тази причина изследването претендира и за възможността то да бъде прилагано и извън академичната среда, при реалната оценката на кредитния портфейл на действащи търговски банки. Поради съображения за конфеденциалност и опазване на банковата тайна конкретните кредитополучатели няма да бъдат идентифицирани, както и е необходимо да се отбележи, че изследването се базира само на представителна извадка на случаен принцип, и то не дава пълно описание на количествените и качествените параметри на кредитния портфейл на банката. От портфейла на банката е филтрирана извадка от текущите кредитополучатели, които отговарят едновременно на следните условия:  Юридическо лице, принадлежащо на един от трите сегмента – „Малък бизнес“, „Средни корпоративни клиенти“ и „Големи корпоративни клиенти“;  Избрани са само балансови експозиции, съответно са изключени задбалансови и съдебни експозиции;  Според своето възникване и приключване на кредитната експозиция, никоя от тях не следва да е възникнала и/или приключила в
  • 28. 27 годината на изследваната група, тоест 2014 за извадка „2013/2014” и 2015 за извадка „2014/2015”;  Просрочията на извадката от нередовни кредитополучатели не следва да надвишава 360 дни за компаниите попадащи в извадката за „2013/2014” и 240 дни за компаниите попадащи в извадката за „2014/2015”. Основната идея е да се изследват компании, които към датата на съответния годишен финансов отчет са без просрочие, тъй като основната цел на модела е да предвижда просрочия през следващите 12 месеца от публикуването на отчетната счетоводна информация. Всъщност теорията на моделите позволява и обратния ред, ако модела се захрани с данни за вече нередовен кредитополучател, той има възможност да оцени, дали компанията ще продължи да бъде нередовна през следващата една години, или ще успее да се „върне в редовност“. Въз основа на горните критерии на случаен принцип са селектирани общо 213 кредитни лимита на 172 компании, разделени на две съвкупности както следва:  Съвкупност 2013/2014 – данните на тези компании ще се използват за съставяне на регресионен модел и извличане на регресионни коефициенти, поради тази причина тази съвкупност може да бъде наречена регресионна съвкупност;  Съвкупност 2014/2015 - данните на тези компании ще се използват последващо тестване на прогностичната способност на модела съставен въз основна на горната съвкупност, поради тази причина тази съвкупност може да бъде наречена тестова съвкупност. Разминаването между броя кредитополучатели и броя кредитни лимит се обуславя от факта, че някои компании разполагат с повече от един кредитен лимит, които обаче се различават по своите параметри като например: вид, лихвен процент, сума на обезпечението, покритие на главницата срок и др. Поради факта, че входящи фактори характеризиращи самия кредитен лимит в последствие се включват в регресионните модели, бе предприето, тези компании да бъдат
  • 29. 28 включени в регресионните модели по няколко пъти, според броя на разрешените им лимити. По детайлна информация за броя на кредитополучателите и броя на кредитните лимити използвани в настоящата разработка е представена в Таблица 1 Съответно за всеки един кредитополучател, респективно кредитен лимит е извлечена информация от следните източници, въз основна на която на по-късен етап следва да се конструират входящите параметри на модела.  Баланс;  Отчет за приходи и разходи;  Отчет за паричния поток;  Данни от кредитния портфейл на банката като: o Кредитополучател; o Тип на кредитния лимит, спрямо следния шифър: 001 – Стандартен кредит с погасителен план; 002 – Кредитна линия; 003 – Револвиращ кредит; 004 – Овърдрафт; 005 – Фирмена кредитна карта; o Разрешен размер; o Дни на просрочие на главницата; o Лихвен процент общо (като сума от лихвения процент и размера на годишните такси и комисионни дължими по лимита); o Дата на договор за кредит; o Дата на активиране на кредита (преди 31.12.2014); o Дата на приключване на кредита (след 31.12.2015); o Обща сума на обезпечението; o Вид на плащане на главницата – анюитет, равни вноски по главница и свободен (прилага се за Кредитни линии и Овърдрафт кредити за оборотно финансиране на текущи нужди, докато първите два типа обикновено се прилагат за инвестиционно финансиране за закупуване и/или изграждане на ДМА);
  • 30. 29 o Тип на плащане на лихвите – по погасителен план или текущи лихви (първия тип се прилага за кредити погасяващи се на анюитети и равни вноски по главницата, докато втория при свободен тип на погасяване на главницата);  Търговски регистър: o Дата на регистрация на компанията; o Брой осигурени лица (персонал) през 2014 и 2015 година. 7. Методика при избора на входящи параметри 7.1. Първични входящи параметри на модела Следващата стъпка след избора и организиране на база данни, е да се идентифицира съвкупност от потенциални входящи фактори при изграждането на регресионния модел. В Таблица 2 са описани общо 41 потенциални входящи променливи, като е описан методът на тяхното изчисляване и очакваната взаимовръзка със стабилността на финансовото състояние на разглеждания кредитоискател. Факторите са разделени в 10 основни групи както следва:  Банков портфейл;  Парични потоци;  Развитие и спецификация на фирмата;  Управление на човешките ресурси;  Показатели за ликвидност;  Коефициенти за ефективност;  Показатели характеризиращи рентабилността;  Анализ на зависимостта между рентабилността и ангажираността на капитала;  Показатели характеризиращи обращаемостта на активите;  EBITDA (Earnings before interest, taxes, depreciations and amortizations – Приходи преди лихви, данъци и амортизации).
  • 31. 30 7.2. Оценка и избор на статистически значими параметри за модела По отношение на избора на най-подходящи входящи променливи за даден регресионен модел съществува широк набор от статистически методи и алгоритми, много от които представляват сериозна трудност за разбирането им от страна на не професионалисти в сферата на статистиката. Поради тази причина в настоящата разработка са предложени две различни методологии за избор на най- подходящи фактори измежду представените в горната точка 41 фактора, като единият метод е базиран повече на статистическата теория, докато другият от своя страна залага повече на икономическата интуиция. Преди това обаче е представен и един класически метод базиран на Student`s T-test. 7.2.1. Метод на базиран на Student`s T--test Статистическо обследване на стойностите на гореописаните фактори е представено в Таблица 3, като са изчислени средната стойност и стандартното отклонение. Въз основа на последните две колони на таблицата, където са представени стойностите на Students`Т-test, според който ако стойността на P- Value е по-малка от 0,05 се наблюдава статистически значимо различие между стойностите на даден показател изчислен за групата от редовните кредитополучатели и за групата на нередовните кредитополучатели.69 70 Съответно въз основа на данните от последните две колони в Таблица 3, може да се види, че по отношение на факторите X3, X4, X18, X30, X33, X41, двете групи на редовни и нередовни кредитни лимити статистически се различават. Например, средния размер на покритието на кредитните лимити, които са били редовни през последните 12 месеца е 3,13, докато покритието на нередовните експозиции е 4,58. Това различие може да се обясни със стремежа на мениджмънта на банката да изисква по-висок дял на обезпечението за видимо по- рисковите експозиции, според тяхната преценка. В случая някои автори използват именно факторите идентифицирани по този метод изведени в Таблица 5 за последващото изграждане на регресионните 69 Student. (1908a). The probable error of a mean. Biometrika VI,, 1-25. 70 Student. (1908b). Probable error of a correlation coefficient. Biometrika VI,, 302-310.
  • 32. 31 модели.71 72 73 Освен тях обаче, в следващата точка са представени и два други алтернативни метода. 7.2.2. Метод на „Изчистване на корелационната матрица“ Този метод се базира изцяло на статистическата теория и корелационната матрица на Pearson. 74 При него се стартира с корелационната матрица, изобразяваща корелацията между всички 41 входящи фактора (X1, X2, ….X41) и независимата променлива Y, като също така са идентифицирани и статистически значимите корелации между тях, при степен на свобода от 0.05. В последствие един по един се изключват фактори от матрицата като крайната цел е да останат определен брой фактори, които да отговарят едновременно на следните условия:  Да имат максимално висока и статистически значима корелация със зависимия фактор Y;  Да имат минимална корелация помежду си. Въз основа на този метод са избрани общо 9 фактора 75 , отговарящи едновременно на горните две изисквания и те са посочени в Таблица 5, заедно с корелацията им спрямо зависимата променлива. 7.2.3. Метод на „Най-добрия от всяка група“ Видно от горния метод за избор на подходящи регресионни фактори, не са обхванати всички групи от фактори, които бяха първоначално подбрани, като в случая отпадат факторите от следните групи:  Парични потоци;  Управление на човешките ресурси; 71 Soleimani, A. S., & Salimi, S. V. (2012). Corporate Bankruptcy Prediction Using a Logit Model Evidence from Listed Companies of Iran. World Applied Sciences Journal 17, 1143-1148. 72 Tetteh, M. L., Tetteh, F. A., & Ansah, A. Y. (2014). Credit Default Modeling: a Logit Approach. Research Journal of Finance and Accounting Vol.5. 73 Low, S.-W., Nor, F. M., & Yatim, P. (2001). Predicting corporate financial distress using the logit model: The case of Malaysia. Asian Academy of Management Journal vol. 6, 49-61. 74 Pearson, K. (1895). Notes on regression and inheritance in the case of two parents. Proceedings of the Royal Society of London, 58, 240-242. 75 По отношение фактораX41 следваше да бъде изключен, но поради неизменното му теоретико- практично значение при оценката на кредитния риск, фактор X41 бе допълнително включен, с цел максимално подобряване на крайния модел.
  • 33. 32  Показатели характеризиращи рентабилността; Поради тази причина се поставя под въпрос значението и на факторите и от тези групи, в следствие на което е направен подбор на входящи променливи и по метода на „Най-добрия от всяка група“. Този метод се обуславя повече на теорията на финансите и банковото дело, и цели максималното обхващане на различните групи от фактори изследващи по един или друг начин финансовото състояние на дадена компания. Изхождайки от този метод се избират фактори, които отговарят едновременно на следните условия:  Да имат максимално висока корелация със зависимата променлива Y, като не е значително тя да е статистически значима съгласно корелационната матрица на Pearson;  Да се в включи само един фактор от всяка група;  Да има минимална корелация между избраните фактори. Въз основа на този метод са избрани общо 10 фактора 76 , отговарящи едновременно на горните две изисквания и те са посочени в Таблица 6, заедно с корелацията им спрямо зависимата променлива. 7.3. Оценка на трите метода за избор на входящи параметри и избор на окончателни входящи параметри за модела Най-простатата и елементарна оценка за качеството на избраните входящи променливи може да се направи като се сравни размера на средноаритметичната стойност на сумата от модулите на техните корелационни стойности спрямо независимата променлива Y. Видно от Таблица 2, Таблица 4, Таблица 5 и Таблица 6, тази стойност за всички предварително избрани 41 фактора е 0.1090, съответно при модела на изчистената матрица тя е 0,2312, при модела на най- добрия показател от всяка група тя е 0,2037 , докато при сравнителната таблица на Student тя е 0,2850. Съответно предположението, е че която група от фактори има по-голяма корелация с независимата Y, съответно тази група от фактори би имала най-голяма обяснителна способност. В случая това е групата избрана, чрез Student`s T-test. Друго заключение, което може да се направи все още на този етап, 76 По отношение показателя X4 следваше да бъде изключен, но поради изключително високата му корелация спрямо Y, фактор X4 бе допълнително включен, с цел максимално подобряване на крайния модел.