8. 予測モデル
目的変数 説明変数
xy
)(xfy =
予測モデル f
説明変数 x から目的変数 y を予測する
結果 原因
未知のデータに対する高い
予測力と安定性(汎化性能)
が求められる
目的変数 y 予測の例
回帰 連続値 売上予測,電力量予測, etc.
クラス分類 離散値 退会者予測,故障予測, etc.
17. カテゴリ変数のダミー変数への変換
function getdummy{R}(df::DataFrame, cname::Symbol, ::Type{R})
darr = df[cname]
vals = sort(levels(darr))[2:end]
namedict = Dict(vals, 1:length(vals))
arr = zeros(R, length(darr), length(namedict))
for i=1:length(darr)
if haskey(namedict, darr[i])
arr[i, namedict[darr[i]]] = 1
end
end
newdf = convert(DataFrame, arr)
names!(newdf, [symbol("$(cname)_$k") for k in vals])
return newdf
end
• Julia Usersに掲載されている方法に従って変換
※ DataFrames: convert categorical variables to dummy ones?
https://groups.google.com/forum/#!topic/julia-users/7-Vtpi8w4YI
18. カテゴリ変数のダミー変数への変換
function convertdummy{R}(df::DataFrame, names::Array{Symbol}, ::Type{R})
# consider every variable from cnames as categorical
# and convert them into set of dummy variables,
# return new dataframe
newdf = DataFrame()
for cname in names(df)
if !in(cname, cnames)
newdf[cname] = df[cname]
else
dummydf = getdummy(df, cname, R)
for dummyname in names(dummydf)
newdf[dummyname] = dummydf[dummyname]
end
end
end
return newdf
end
convertdummy(df::DataFrame, cnames::Array{Symbol}) =
convertdummy(df, cnames, Int32)
• Julia Usersに掲載されている方法に従って変換
※ DataFrames: convert categorical variables to dummy ones?
https://groups.google.com/forum/#!topic/julia-users/7-Vtpi8w4YI