こんな分析〇〇はイヤだ -Platium Data meetup vol1 LT-
- 12. 100
75
4月 5月 6月 7月
Actual Pred(Before) Pred(After)
50
Improve
25
0
予測誤差が±30本から±20本 に
収まるようになりました!!
(ドヤァァ)
へぇ!!凄いですね!!
でもウチ、発注する時は
100本単位でしか発注できないんで
現行の発注業務の1%にしか
関係しないっすね
Improve
- 13. 検証時にしか使えない前処理メソッドを使っちゃう
import pandas as pd
df_train = pd.read_csv(‘sample_train.csv’)
df_test = pd.read_csv(‘sample_test.csv’)
df = pd.concat([df_train,df_test])
#item_categoryのユニーク数分One-Hotに行列を展開する
df_item_category = pd.get_dummies(df[‘item_category’])
実際に予測する時にget_dummies()使っちゃうと
モデリング時と階数変わっちゃうの忘れてたわ