動画タグネットワーク分析を用いた ニコニコ動画における萌芽文化発見の試み ~”ゆっくり関連タグ”を例として~
- 24. トレーニングセット(学習・テスト)の作成_2
ランキング総合ポイントで上位100、下位100くらいになるように
データを選別して半々に分けます
# 予め作成したノードリストを読み込む
set<-read.csv(“taggraph_nodes.csv”,fileEncoding = “CP932”)
#再生数などの情報は既にポイントで反映していると考え削除しておく。計算結果を最終
的にsetに貼って出力しGephiでまた使う
set1<-set[,c(-2,-3,-10,-17,-18,-19)]
plus<-subset(set1,set1$Points>2.5*mean(set1$Points))
minus<-subset(set1,set1$Points<0.05*mean(set1$Points))
plus$culture<-as.factor(1)
minus$culture<-as.factor(0)
# チューニング用とテスト用に分ける
plus1<-plus[c(1:47),]
plus2<-plus[c(48:93),]
minus1<-minus[c(1:46),]
minus2<-minus[c(47:93),]
learning<-data.frame(rbind(plus1,minus1))
test<-data.frame(rbind(plus2,minus2))
実際には100じゃなくて
93ですが
- 27. 分類器のチューニング_1
# ここからはチューニング。一回目。
gammaRange = 10^(-5:5)
costRange = 10^(-2:2)
t <- tune.svm(culture ~ ., data = learning1, gamma=gammaRange,
cost=costRange,
tunecontrol = tune.control(sampling="cross",
cross=8))
cat(“- best parameters:n”)
cat("gamma =", t$best.parameters$gamma, "; cost =",
t$best.parameters$cost, ";n")
cat("accuracy:", 100 - t$best.performance * 100, "%nn")
plot(t, transform.x=log10, transform.y=log10)
- 29. 分類器のチューニング_3
#二回目のチューニング。色が濃いところにグリッドサーチを絞る
gamma <- 10^(-1)
cost <- 10^(1)
gammaRange <- 10^seq(log10(gamma)-
1,log10(gamma)+1,length=11)[2:10]
costRange <- 10^seq(log10(cost)-
1 ,log10(cost)+1 ,length=11)[2:10]
t <- tune.svm(Species ~ ., data = iris, gamma=gammaRange,
cost=costRange,
tunecontrol = tune.control(sampling="cross",
cross=8))
cat("gamma =", t$best.parameters$gamma, "; cost =",
t$best.parameters$cost, ";n")
cat("accuracy:", 100 - t$best.performance * 100, "%nn")
plot(t, transform.x=log10, transform.y=log10)
- 63. “文化”として定着しつつある
“ゆっくり”関連タグとは_3
全体のネットワークにおいて高いものから表にしてみた
ここはほぼ
ゲーム実況か
東方
コミュニティ
name ave_view ave_comment ave_mylistave_length
modify_prob
ability
まんじゅうこわい 24930.5 511.5 433.5 1504.0 99.691%
ACE2 34896.0 1517.5 81.5 1658.0 99.529%
ウルヲイ 52591.5 4787.5 154.5 1327.5 99.524%
綺麗な我様 11705.0 497.0 56.0 1632.0 99.493%
紡がれ続けた物語の終わ
り 11705.0 497.0 56.0 1632.0 99.493%
タイトルに偽り無し 11705.0 497.0 56.0 1632.0 99.493%
物語は紡ぎ紡がれていく 11705.0 497.0 56.0 1632.0 99.493%
聞くだけ動画 23658.5 422.5 431.0 1054.0 99.197%
壷算 13365.0 231.0 55.0 1212.0 99.161%
へうげもの 13365.0 231.0 55.0 1212.0 99.161%
化け物つかい 15909.0 409.0 60.0 2112.0 99.125%
ハロワ 15909.0 409.0 60.0 2112.0 99.125%
変態包囲網 51482.0 2326.0 123.0 1429.0 99.026%
ツーリング 51482.0 2326.0 123.0 1429.0 99.026%
- 64. “文化”として定着しつつある
“ゆっくり”関連タグとは_4
「まんじゅうこわい」が一番高い確率を叩き出す
解せぬ
name ave_view ave_comment ave_mylistave_length
modify_prob
ability
まんじゅうこわい 24930.5 511.5 433.5 1504.0 99.691%
ACE2 34896.0 1517.5 81.5 1658.0 99.529%
ウルヲイ 52591.5 4787.5 154.5 1327.5 99.524%
綺麗な我様 11705.0 497.0 56.0 1632.0 99.493%
紡がれ続けた物語の終わ
り 11705.0 497.0 56.0 1632.0 99.493%
タイトルに偽り無し 11705.0 497.0 56.0 1632.0 99.493%
物語は紡ぎ紡がれていく 11705.0 497.0 56.0 1632.0 99.493%
聞くだけ動画 23658.5 422.5 431.0 1054.0 99.197%
壷算 13365.0 231.0 55.0 1212.0 99.161%
へうげもの 13365.0 231.0 55.0 1212.0 99.161%
化け物つかい 15909.0 409.0 60.0 2112.0 99.125%
ハロワ 15909.0 409.0 60.0 2112.0 99.125%
変態包囲網 51482.0 2326.0 123.0 1429.0 99.026%
ツーリング 51482.0 2326.0 123.0 1429.0 99.026%
- 66. “文化”として定着しつつある
“ゆっくり”関連タグとは_6
「”ゆっくり,科学系解説”コミュニティ」で確率が高いタグ
解説系では
定番の反応
ですね
name ave_view
ave_com
ment ave_mylist ave_length
modify_prob
ability
動画には本文を書けば
どうか 4662 170 26 578 93.746%
ひらがなでしゃべらせ
て 4662 170 26 578 93.746%
分からんということが
分かった. 40737.5 898.7 151.8 720.5 93.602%
FMEAutomator 13267 417 420 372 92.169%
ニコ生 13267 417 420 372 92.169%
FME 13267 417 420 372 92.169%
ニコ生講座 13267 417 420 372 92.169%
ヤンデレ 58156.8 4258.8 173.4 820.2 91.928%
AxisPowersヘタリア 6369.5 191 29.5 463 91.315%
がんばりましょう 6369.5 191 29.5 463 91.315%