21. SK_ID_
CURR
NAME_
CONTRACT_
TYPE
CODE_
GENDER
FLAG_
OWN_CAR
FLAG_OWN_
REALTY
CNT_
CHILDREN
AMT_
INCOME_
TOTAL
AMT_
CREDIT
NAME_
INCOME_
TYPE
NAME_
EDUCATION_
TYPE
NAME_
HOUSING_
TYPE
…
EXT_
SOURCE_1
EXT_
SOURCE_2
EXT_
SOURCE_3
TARGET
100002
Cash
loans
M N Y 0 202,500 406,598 Working
Secondary /
secondary
special
House /
apartment
… 0.08304 0.26295 0.13938 1
100003
Cash
loans
F N N 0 270,000 1,293,503
State
servant
Higher
education
House /
apartment
… 0.31127 0.62225 nan 0
100004
Revolving
loans
M Y Y 0 67,500 135,000 Working
Secondary /
secondary
special
House /
apartment
… nan 0.55591 0.72957 0
Application_train データ : ローン申し込み情報(このようなデータが約30万⾏)
インプット
予測対象データの例(約5万⾏)
答え 1: 返済不可
0: 問題なし
Excelのシートで表現できるようなデータ(テーブルデータ)。機械学習に応⽤する際はここからインプットとな
る学習データと、予測対象のデータでデータセットを作る。
100001
Cash
loans
F N Y 0 135,000 568800 Working
Higher
education
House /
apartment
… 0.75261 0.78965 0.15952 ???
100005
Cash
loans
M N Y 0 99,000 222768 Working
Secondary /
secondary
special
House /
apartment
… 0.56499 0.29166 0.43296 ???
100013
Cash
loans
M Y Y 0 202,500 663264 Working
Higher
education
House /
apartment
… nan 0.69979 0.61099 ???
まだ答えがわかっていない
データを予測したい
ID 契約種別 性別 ⾞所有
不動産
所有
⼦供の数 収⼊ ローン額 収⼊種別 教育種別 家種別 外部信⽤機関スコア 貸倒れ有無
出典︓ https://www.kaggle.com/kenmatsu4/home-credit-eda-001
21
申込データイメージ