Contenu connexe
Similaire à ZoZei - アイデア賞スライド (20)
ZoZei - アイデア賞スライド
- 2. 目次
● 概要
● モデル構成
● Preprocess and Feature Engineering
● Building Identification
● Internal Regression
● CatBoost
○ Feature Importance
● Stratified Stacking
● Adaptive Stacking
- 5. Preprocess and Feature Engineering
以下のような前処理と特徴量の追加を行なった。
● 住所や間取り、最寄り駅、路線等の表記揺れの修正と名寄せ
○ 最寄り駅と徒歩分をエンコーディングする方法として三点測位の座標を採用
● Google Map API を利用した物件の正確な緯度・経度情報の取得
● 公示地価情報の追加
● 最寄り駅の利用者数の情報の追加
● 区ポテンシャル
○ 各物件の各区からの距離の逆比 (e.g. 港区ポテンシャル)
後のCatBoostの学習結果のスライドで見るように、これら特徴量の寄与は大きくスコア
向上につながった。
- 9. CatBoost - Feature Importance
feature importance
港区ポテンシャル
公示地価情報
緯度・経度情報
最寄駅利用者数
右図はCatBoostの学習を行なった
際の各特徴量の重要度を表したグ
ラフである。
Feature Engineering で追加した特
徴量が重要になっていることが確
認できる。