SlideShare une entreprise Scribd logo
1  sur  20
Télécharger pour lire hors ligne
//2 44/2 7 & 2 /
0 427 4
8 8 & Q
& A IQ LA
K G
2
2
4
3
1
)(
3
C Te TC a
C RTs Ci Ci C C
ü t t p s a s g C
• (/ 2) / H N Cs L
• s C C N
• Nv
• ( - N
• . N
• coRh C L (/ 2) /
• D V s m LirgS nd I GN C
dpa V E
A :
4
Kaggle 6 3 3 Master !
SIGNATE
ü 2
https://www.slideshare.net/matsukenbook/signate-108228406
2015 02016 9
( )
b 1 9
9
c 2 P 9
6
2
4
3
1
7
1 4
2 4 78!
8
qa_id
question_title
ü tq R a
ü th R U
question_body ü th
question_user_name ü th m
question_user_page ü th o
answer ü th a ex
answer_user_name ü ex m
answer_user_page ü ex o
url ü tq
category ü tq
host ü tq i Um
LI cp
1, 2, 3 D
What am I losing when using extension …
After playing around with macro …
ysap
https://photo.stackexchange.com/users/1024
I just got extension tubes, so here's the skinny. …
rfusca
https://photo.stackexchange.com/users/1917
1 1 . 1/ 1 :
LIFE_ARTS
photo.stackexchange.com
train data 6079n public data g476n (13%)
private data g3186n (87%)
ku L s
9
10
ü
ü
11
2
4
3
1
12
• A : :BD GC FK
• K B K :F D:K : G P B D F@ A P E:P K D F@ A
• https://arxiv.org/abs/1905.05583
• + :@BF@ ( :K MF :K EG D
• 4GK G KKBF@) 0B : @ BK B M BGF B A :BF : : !: : G : @ GDMEFK
• . :BD BK BF A GDDG BF@ :@
• -GF : F: GGD GM M K M F GM M GE D: G
1DG :D+ :@ 4GGDBF@ .
• & GD B A MD BD: D : B B 0GD ! A:FCK : A: A:
• GF@ A : G KGDG : B B : BGF
https://www.kaggle.com/c/google-quest-challenge/discussion/129885
+ +
13
L J E7 C
)
5403 L J E79
()-
5/24 5403 EJ
()-
5403
C (
L J E79
LCC
EJ
LCC
L J E7 C
LCC
fq]pra . _lk s b J LE_1 J J CL E ajh oeS
iJ : E_c Pgm E C]d C . ) L J E. ()- EJ . ()- n [
. J. C : : J LE E E 9 J E : :C JJ : E J:LJJ E -,*,
14
-. N T X aN -.N1 :26:4 E - 1 0 / Rb
NN 6 0 L
BBB 62 0 : 90 7 :1 7 1
15
0 R T G P 3 6
0
6
B B
A6 6 46
B B
0
6
B B
A6 6 46
B B
0
6
B B
A6 6 46
B B
6 1 B B
A6 6 461 B B AB &
E A
6 1 B B
A6 6 461 B B AB (
E A
2 A6 6 461 B B
32 )D6 2 6.
B
6 A6
32 )D6 2 6.
B
6 A6
32 )D6 2 6.
B
6 A6
0
6
B B
A6 6 46
B B
32 )D6 2 6.
B
6 A6
6 1 B B
A6 6 461 B B AB (
E A E B B B
16
def rank_average(preds):
ranked_pred = rankdata(preds)
return (ranked_pred - np.min(ranked_pred)) / (np.max(ranked_pred) - np.min(ranked_pred))
class OptimPreds(object):
def __init__(self, df_train):
self.score_range_dict = {}
for i, c in enumerate(df_train.columns[11:]):
cnt = df_train[c].value_counts(normalize=True).sort_index()
self.score_range_dict[i] = [cnt.index.values.tolist(), cnt.values.tolist()]
def predict(self, preds, i):
return pd.cut(rank_average(preds),
[-np.inf] + np.cumsum(self.score_range_dict[i][1])[:-1].tolist() +
[np.inf], labels = self.score_range_dict[i][0])
def optim_predict(pred):
for i in range(pred.shape[1]):
if i in [2,5,12,13,14,15,19]:
pred[:,i] = optim.predict(pred[:,i], i)
return pred
optim = OptimPreds(df_train)
valid_pred = optim_predict(valid_pred_org.copy())
V train targetV C>
V
01. - + ( ( )+
896 2:5 - - )
8 3764 -( () ) ) (
17
https://www.kaggle.com/c/google-quest-challenge/discussion/120368
- !
18
2
4
3
1
Didn’t work for me
19
ü Pre-training with stackoverflow data (150,000 sentences)
ü Multi sample dropout
ü The other models
ü Roberta
ü Albert
ü XLNet
ü Concatenate question only output & answer only model
ü Concatenate category MLP with BERT model
ü LSTM head instead of Dense with BERT model
ü Freeze half of BertLayer for reducing model complexity
ü Skip half of BertLayer for reducing model complexity
ü USE(Universal Sequence Encorder) + MLP
ü LSTM model with gensim embedding
ü custom loss
ü BCE & MSE
ü focal loss
ü Word count feature
ü Concat title and question_body as a one block (removing ["SEP"] between them)
ü Up-sampling for imbalance target column
https://www.kaggle.com/c/google-quest-challenge/discussion/129885
B
B
L B 1
20

Contenu connexe

Tendances

Frontiers of data-driven property prediction: molecular machine learning
Frontiers of data-driven property prediction: molecular machine learningFrontiers of data-driven property prediction: molecular machine learning
Frontiers of data-driven property prediction: molecular machine learning
Ichigaku Takigawa
 

Tendances (19)

AtCoder Regular Contest 038 解説
AtCoder Regular Contest 038 解説AtCoder Regular Contest 038 解説
AtCoder Regular Contest 038 解説
 
Physique révision
Physique révisionPhysique révision
Physique révision
 
communication-systems-4th-edition-2002-carlson-solution-manual
communication-systems-4th-edition-2002-carlson-solution-manualcommunication-systems-4th-edition-2002-carlson-solution-manual
communication-systems-4th-edition-2002-carlson-solution-manual
 
Communication systems solution manual 5th edition
Communication systems solution manual 5th editionCommunication systems solution manual 5th edition
Communication systems solution manual 5th edition
 
Predicting the Wind: Data Science in Wind Resource Assessment
Predicting the Wind: Data Science in Wind Resource AssessmentPredicting the Wind: Data Science in Wind Resource Assessment
Predicting the Wind: Data Science in Wind Resource Assessment
 
CODE FESTIVAL 2015 予選A 解説
CODE FESTIVAL 2015 予選A 解説CODE FESTIVAL 2015 予選A 解説
CODE FESTIVAL 2015 予選A 解説
 
Program Language - Fall 2013
Program Language - Fall 2013 Program Language - Fall 2013
Program Language - Fall 2013
 
imager package in R and examples..
imager package in R and examples..imager package in R and examples..
imager package in R and examples..
 
CSS Grid Layout is Just Around the Corner (CSSConf US 2015)
CSS Grid Layout is Just Around the Corner (CSSConf US 2015)CSS Grid Layout is Just Around the Corner (CSSConf US 2015)
CSS Grid Layout is Just Around the Corner (CSSConf US 2015)
 
Frontiers of data-driven property prediction: molecular machine learning
Frontiers of data-driven property prediction: molecular machine learningFrontiers of data-driven property prediction: molecular machine learning
Frontiers of data-driven property prediction: molecular machine learning
 
合同数問題と保型形式
合同数問題と保型形式合同数問題と保型形式
合同数問題と保型形式
 
End sem solution
End sem solutionEnd sem solution
End sem solution
 
RではじめるTwitter解析
RではじめるTwitter解析RではじめるTwitter解析
RではじめるTwitter解析
 
DevOps導入支援サービス
DevOps導入支援サービスDevOps導入支援サービス
DevOps導入支援サービス
 
ゲーム理論BASIC 演習37 -3人ゲームの混合戦略ナッシュ均衡を求める-
ゲーム理論BASIC 演習37 -3人ゲームの混合戦略ナッシュ均衡を求める-ゲーム理論BASIC 演習37 -3人ゲームの混合戦略ナッシュ均衡を求める-
ゲーム理論BASIC 演習37 -3人ゲームの混合戦略ナッシュ均衡を求める-
 
twitteRで快適Rライフ!
twitteRで快適Rライフ!twitteRで快適Rライフ!
twitteRで快適Rライフ!
 
Key pat1 3-52 math
Key pat1 3-52 mathKey pat1 3-52 math
Key pat1 3-52 math
 
DevOps導入支援サービス(Ver.2)
DevOps導入支援サービス(Ver.2)DevOps導入支援サービス(Ver.2)
DevOps導入支援サービス(Ver.2)
 
CODE FESTIVAL 2015 解説
CODE FESTIVAL 2015 解説CODE FESTIVAL 2015 解説
CODE FESTIVAL 2015 解説
 

Similaire à Kaggle Google Quest Q&A Labeling 反省会 LT資料 47th place solution

Argoによる機械学習実行基盤の構築・運用からみえてきたこと
Argoによる機械学習実行基盤の構築・運用からみえてきたことArgoによる機械学習実行基盤の構築・運用からみえてきたこと
Argoによる機械学習実行基盤の構築・運用からみえてきたこと
Shinsaku Kono
 

Similaire à Kaggle Google Quest Q&A Labeling 反省会 LT資料 47th place solution (20)

Google Polymer in Action
Google Polymer in ActionGoogle Polymer in Action
Google Polymer in Action
 
Argoによる機械学習実行基盤の構築・運用からみえてきたこと
Argoによる機械学習実行基盤の構築・運用からみえてきたことArgoによる機械学習実行基盤の構築・運用からみえてきたこと
Argoによる機械学習実行基盤の構築・運用からみえてきたこと
 
kintone on EKS ― EKS で実現するインフラ自動構築パイプライン
kintone on EKS ― EKS で実現するインフラ自動構築パイプライン kintone on EKS ― EKS で実現するインフラ自動構築パイプライン
kintone on EKS ― EKS で実現するインフラ自動構築パイプライン
 
Google Cloud Dataflowによる データ変換処理入門
Google Cloud Dataflowによる データ変換処理入門Google Cloud Dataflowによる データ変換処理入門
Google Cloud Dataflowによる データ変換処理入門
 
Attention-Based Adaptive Selection of Operations for Image Restoration in the...
Attention-Based Adaptive Selection of Operations for Image Restoration in the...Attention-Based Adaptive Selection of Operations for Image Restoration in the...
Attention-Based Adaptive Selection of Operations for Image Restoration in the...
 
[AWS Dev Day] 인공지능 / 기계 학습 | 개발자를 위한 수백만 사용자 대상 기계 학습 서비스 확장 하기 - 윤석찬 AWS 수석테...
[AWS Dev Day] 인공지능 / 기계 학습 | 개발자를 위한 수백만 사용자 대상 기계 학습 서비스 확장 하기 - 윤석찬 AWS 수석테...[AWS Dev Day] 인공지능 / 기계 학습 | 개발자를 위한 수백만 사용자 대상 기계 학습 서비스 확장 하기 - 윤석찬 AWS 수석테...
[AWS Dev Day] 인공지능 / 기계 학습 | 개발자를 위한 수백만 사용자 대상 기계 학습 서비스 확장 하기 - 윤석찬 AWS 수석테...
 
第5回NIPS読み会・関西発表資料
第5回NIPS読み会・関西発表資料第5回NIPS読み会・関西発表資料
第5回NIPS読み会・関西発表資料
 
Game Day in Action for Chaos Engineering - 윤석찬 (AWS 테크에반젤리스트) :: 한국 카오스엔지니어링 밋업
Game Day in Action for Chaos Engineering - 윤석찬 (AWS 테크에반젤리스트) ::  한국 카오스엔지니어링 밋업Game Day in Action for Chaos Engineering - 윤석찬 (AWS 테크에반젤리스트) ::  한국 카오스엔지니어링 밋업
Game Day in Action for Chaos Engineering - 윤석찬 (AWS 테크에반젤리스트) :: 한국 카오스엔지니어링 밋업
 
TensorFlow 2: New Era of Developing Deep Learning Models
TensorFlow 2: New Era of Developing Deep Learning ModelsTensorFlow 2: New Era of Developing Deep Learning Models
TensorFlow 2: New Era of Developing Deep Learning Models
 
[DL輪読会]A Probabilistic U-Net for Segmentation of Ambiguous Images
[DL輪読会]A Probabilistic U-Net for Segmentation of Ambiguous Images[DL輪読会]A Probabilistic U-Net for Segmentation of Ambiguous Images
[DL輪読会]A Probabilistic U-Net for Segmentation of Ambiguous Images
 
katagaitai CTF workshop #10 AESに対する相関電力解析
katagaitai CTF workshop #10 AESに対する相関電力解析katagaitai CTF workshop #10 AESに対する相関電力解析
katagaitai CTF workshop #10 AESに対する相関電力解析
 
Edge trends mizuno-template
Edge trends mizuno-templateEdge trends mizuno-template
Edge trends mizuno-template
 
Python And GIS - Beyond Modelbuilder And Pythonwin
Python And GIS - Beyond Modelbuilder And PythonwinPython And GIS - Beyond Modelbuilder And Pythonwin
Python And GIS - Beyond Modelbuilder And Pythonwin
 
OpenStack Summit & KubeConからみるコンテナ技術の最新トレンド (更新版) - OpenStack Day Tokyo 2018講演資料
OpenStack Summit & KubeConからみるコンテナ技術の最新トレンド (更新版) - OpenStack Day Tokyo 2018講演資料OpenStack Summit & KubeConからみるコンテナ技術の最新トレンド (更新版) - OpenStack Day Tokyo 2018講演資料
OpenStack Summit & KubeConからみるコンテナ技術の最新トレンド (更新版) - OpenStack Day Tokyo 2018講演資料
 
Explain this!
Explain this!Explain this!
Explain this!
 
[OpenInfra Days Korea 2018] (Track 4) - Backend.AI: 오픈소스 머신러닝 인프라 프레임워크
[OpenInfra Days Korea 2018] (Track 4) - Backend.AI: 오픈소스 머신러닝 인프라 프레임워크[OpenInfra Days Korea 2018] (Track 4) - Backend.AI: 오픈소스 머신러닝 인프라 프레임워크
[OpenInfra Days Korea 2018] (Track 4) - Backend.AI: 오픈소스 머신러닝 인프라 프레임워크
 
GCC
GCCGCC
GCC
 
Db2 Warehouse v3.0 SMP 導入ガイド 20190104 Db2 Warehouse SMP v3.0 configration Ins...
Db2 Warehouse v3.0 SMP 導入ガイド 20190104 Db2 Warehouse SMP v3.0 configration Ins...Db2 Warehouse v3.0 SMP 導入ガイド 20190104 Db2 Warehouse SMP v3.0 configration Ins...
Db2 Warehouse v3.0 SMP 導入ガイド 20190104 Db2 Warehouse SMP v3.0 configration Ins...
 
[DL輪読会]Addressing Failure Prediction by Learning Model Confidence
[DL輪読会]Addressing Failure Prediction by Learning Model Confidence[DL輪読会]Addressing Failure Prediction by Learning Model Confidence
[DL輪読会]Addressing Failure Prediction by Learning Model Confidence
 
Spark MLlib ML Pipelines の概要 及びpysparkからの扱い方
Spark MLlib ML Pipelines の概要 及びpysparkからの扱い方Spark MLlib ML Pipelines の概要 及びpysparkからの扱い方
Spark MLlib ML Pipelines の概要 及びpysparkからの扱い方
 

Plus de Ken'ichi Matsui

Plus de Ken'ichi Matsui (20)

ベータ分布の謎に迫る
ベータ分布の謎に迫るベータ分布の謎に迫る
ベータ分布の謎に迫る
 
音楽波形データからコードを推定してみる
音楽波形データからコードを推定してみる音楽波形データからコードを推定してみる
音楽波形データからコードを推定してみる
 
データサイエンティストの仕事とデータ分析コンテスト
データサイエンティストの仕事とデータ分析コンテストデータサイエンティストの仕事とデータ分析コンテスト
データサイエンティストの仕事とデータ分析コンテスト
 
分析コンペティションの光と影
分析コンペティションの光と影分析コンペティションの光と影
分析コンペティションの光と影
 
データ分析コンテストとデータサイエンティストの働きかた
データ分析コンテストとデータサイエンティストの働きかたデータ分析コンテストとデータサイエンティストの働きかた
データ分析コンテストとデータサイエンティストの働きかた
 
確率分布の成り立ちを理解してスポーツにあてはめてみる
確率分布の成り立ちを理解してスポーツにあてはめてみる確率分布の成り立ちを理解してスポーツにあてはめてみる
確率分布の成り立ちを理解してスポーツにあてはめてみる
 
SIGNATE 産業技術総合研究所 衛星画像分析コンテスト 2位入賞モデルの工夫点
SIGNATE産業技術総合研究所 衛星画像分析コンテスト2位入賞モデルの工夫点SIGNATE産業技術総合研究所 衛星画像分析コンテスト2位入賞モデルの工夫点
SIGNATE 産業技術総合研究所 衛星画像分析コンテスト 2位入賞モデルの工夫点
 
Introduction of VAE
Introduction of VAEIntroduction of VAE
Introduction of VAE
 
Variational Autoencoderの紹介
Variational Autoencoderの紹介Variational Autoencoderの紹介
Variational Autoencoderの紹介
 
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」数学カフェ 確率・統計・機械学習回 「速習 確率・統計」
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」
 
DS LT祭り 「AUCが0.01改善したって どういうことですか?」
DS LT祭り 「AUCが0.01改善したって どういうことですか?」DS LT祭り 「AUCが0.01改善したって どういうことですか?」
DS LT祭り 「AUCが0.01改善したって どういうことですか?」
 
統計的学習の基礎 4章 前半
統計的学習の基礎 4章 前半統計的学習の基礎 4章 前半
統計的学習の基礎 4章 前半
 
基礎からのベイズ統計学 輪読会資料 第8章 「比率・相関・信頼性」
基礎からのベイズ統計学 輪読会資料  第8章 「比率・相関・信頼性」基礎からのベイズ統計学 輪読会資料  第8章 「比率・相関・信頼性」
基礎からのベイズ統計学 輪読会資料 第8章 「比率・相関・信頼性」
 
第13回数学カフェ「素数!!」二次会 LT資料「乱数!!」
第13回数学カフェ「素数!!」二次会 LT資料「乱数!!」第13回数学カフェ「素数!!」二次会 LT資料「乱数!!」
第13回数学カフェ「素数!!」二次会 LT資料「乱数!!」
 
「ベータ分布の謎に迫る」第6回 プログラマのための数学勉強会 LT資料
「ベータ分布の謎に迫る」第6回 プログラマのための数学勉強会 LT資料「ベータ分布の謎に迫る」第6回 プログラマのための数学勉強会 LT資料
「ベータ分布の謎に迫る」第6回 プログラマのための数学勉強会 LT資料
 
15分でわかる(範囲の)ベイズ統計学
15分でわかる(範囲の)ベイズ統計学15分でわかる(範囲の)ベイズ統計学
15分でわかる(範囲の)ベイズ統計学
 
Random Forest による分類
Random Forest による分類Random Forest による分類
Random Forest による分類
 
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
 
「全ての確率はコイン投げに通ず」 Japan.R 発表資料
「全ての確率はコイン投げに通ず」 Japan.R 発表資料「全ての確率はコイン投げに通ず」 Japan.R 発表資料
「全ての確率はコイン投げに通ず」 Japan.R 発表資料
 
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料 「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
 

Dernier

Sealdah % High Class Call Girls Kolkata - 450+ Call Girl Cash Payment 8005736...
Sealdah % High Class Call Girls Kolkata - 450+ Call Girl Cash Payment 8005736...Sealdah % High Class Call Girls Kolkata - 450+ Call Girl Cash Payment 8005736...
Sealdah % High Class Call Girls Kolkata - 450+ Call Girl Cash Payment 8005736...
HyderabadDolls
 
Top profile Call Girls In dimapur [ 7014168258 ] Call Me For Genuine Models W...
Top profile Call Girls In dimapur [ 7014168258 ] Call Me For Genuine Models W...Top profile Call Girls In dimapur [ 7014168258 ] Call Me For Genuine Models W...
Top profile Call Girls In dimapur [ 7014168258 ] Call Me For Genuine Models W...
gajnagarg
 
Abortion pills in Jeddah | +966572737505 | Get Cytotec
Abortion pills in Jeddah | +966572737505 | Get CytotecAbortion pills in Jeddah | +966572737505 | Get Cytotec
Abortion pills in Jeddah | +966572737505 | Get Cytotec
Abortion pills in Riyadh +966572737505 get cytotec
 
Top profile Call Girls In Begusarai [ 7014168258 ] Call Me For Genuine Models...
Top profile Call Girls In Begusarai [ 7014168258 ] Call Me For Genuine Models...Top profile Call Girls In Begusarai [ 7014168258 ] Call Me For Genuine Models...
Top profile Call Girls In Begusarai [ 7014168258 ] Call Me For Genuine Models...
nirzagarg
 
In Riyadh ((+919101817206)) Cytotec kit @ Abortion Pills Saudi Arabia
In Riyadh ((+919101817206)) Cytotec kit @ Abortion Pills Saudi ArabiaIn Riyadh ((+919101817206)) Cytotec kit @ Abortion Pills Saudi Arabia
In Riyadh ((+919101817206)) Cytotec kit @ Abortion Pills Saudi Arabia
ahmedjiabur940
 
Jodhpur Park | Call Girls in Kolkata Phone No 8005736733 Elite Escort Service...
Jodhpur Park | Call Girls in Kolkata Phone No 8005736733 Elite Escort Service...Jodhpur Park | Call Girls in Kolkata Phone No 8005736733 Elite Escort Service...
Jodhpur Park | Call Girls in Kolkata Phone No 8005736733 Elite Escort Service...
HyderabadDolls
 
Sonagachi * best call girls in Kolkata | ₹,9500 Pay Cash 8005736733 Free Home...
Sonagachi * best call girls in Kolkata | ₹,9500 Pay Cash 8005736733 Free Home...Sonagachi * best call girls in Kolkata | ₹,9500 Pay Cash 8005736733 Free Home...
Sonagachi * best call girls in Kolkata | ₹,9500 Pay Cash 8005736733 Free Home...
HyderabadDolls
 
如何办理英国诺森比亚大学毕业证(NU毕业证书)成绩单原件一模一样
如何办理英国诺森比亚大学毕业证(NU毕业证书)成绩单原件一模一样如何办理英国诺森比亚大学毕业证(NU毕业证书)成绩单原件一模一样
如何办理英国诺森比亚大学毕业证(NU毕业证书)成绩单原件一模一样
wsppdmt
 
Top profile Call Girls In Chandrapur [ 7014168258 ] Call Me For Genuine Model...
Top profile Call Girls In Chandrapur [ 7014168258 ] Call Me For Genuine Model...Top profile Call Girls In Chandrapur [ 7014168258 ] Call Me For Genuine Model...
Top profile Call Girls In Chandrapur [ 7014168258 ] Call Me For Genuine Model...
gajnagarg
 
+97470301568>>weed for sale in qatar ,weed for sale in dubai,weed for sale in...
+97470301568>>weed for sale in qatar ,weed for sale in dubai,weed for sale in...+97470301568>>weed for sale in qatar ,weed for sale in dubai,weed for sale in...
+97470301568>>weed for sale in qatar ,weed for sale in dubai,weed for sale in...
Health
 

Dernier (20)

Sealdah % High Class Call Girls Kolkata - 450+ Call Girl Cash Payment 8005736...
Sealdah % High Class Call Girls Kolkata - 450+ Call Girl Cash Payment 8005736...Sealdah % High Class Call Girls Kolkata - 450+ Call Girl Cash Payment 8005736...
Sealdah % High Class Call Girls Kolkata - 450+ Call Girl Cash Payment 8005736...
 
5CL-ADBA,5cladba, Chinese supplier, safety is guaranteed
5CL-ADBA,5cladba, Chinese supplier, safety is guaranteed5CL-ADBA,5cladba, Chinese supplier, safety is guaranteed
5CL-ADBA,5cladba, Chinese supplier, safety is guaranteed
 
Top profile Call Girls In dimapur [ 7014168258 ] Call Me For Genuine Models W...
Top profile Call Girls In dimapur [ 7014168258 ] Call Me For Genuine Models W...Top profile Call Girls In dimapur [ 7014168258 ] Call Me For Genuine Models W...
Top profile Call Girls In dimapur [ 7014168258 ] Call Me For Genuine Models W...
 
Top Call Girls in Balaghat 9332606886Call Girls Advance Cash On Delivery Ser...
Top Call Girls in Balaghat  9332606886Call Girls Advance Cash On Delivery Ser...Top Call Girls in Balaghat  9332606886Call Girls Advance Cash On Delivery Ser...
Top Call Girls in Balaghat 9332606886Call Girls Advance Cash On Delivery Ser...
 
Abortion pills in Jeddah | +966572737505 | Get Cytotec
Abortion pills in Jeddah | +966572737505 | Get CytotecAbortion pills in Jeddah | +966572737505 | Get Cytotec
Abortion pills in Jeddah | +966572737505 | Get Cytotec
 
Top profile Call Girls In Begusarai [ 7014168258 ] Call Me For Genuine Models...
Top profile Call Girls In Begusarai [ 7014168258 ] Call Me For Genuine Models...Top profile Call Girls In Begusarai [ 7014168258 ] Call Me For Genuine Models...
Top profile Call Girls In Begusarai [ 7014168258 ] Call Me For Genuine Models...
 
In Riyadh ((+919101817206)) Cytotec kit @ Abortion Pills Saudi Arabia
In Riyadh ((+919101817206)) Cytotec kit @ Abortion Pills Saudi ArabiaIn Riyadh ((+919101817206)) Cytotec kit @ Abortion Pills Saudi Arabia
In Riyadh ((+919101817206)) Cytotec kit @ Abortion Pills Saudi Arabia
 
Jodhpur Park | Call Girls in Kolkata Phone No 8005736733 Elite Escort Service...
Jodhpur Park | Call Girls in Kolkata Phone No 8005736733 Elite Escort Service...Jodhpur Park | Call Girls in Kolkata Phone No 8005736733 Elite Escort Service...
Jodhpur Park | Call Girls in Kolkata Phone No 8005736733 Elite Escort Service...
 
Predicting HDB Resale Prices - Conducting Linear Regression Analysis With Orange
Predicting HDB Resale Prices - Conducting Linear Regression Analysis With OrangePredicting HDB Resale Prices - Conducting Linear Regression Analysis With Orange
Predicting HDB Resale Prices - Conducting Linear Regression Analysis With Orange
 
Digital Advertising Lecture for Advanced Digital & Social Media Strategy at U...
Digital Advertising Lecture for Advanced Digital & Social Media Strategy at U...Digital Advertising Lecture for Advanced Digital & Social Media Strategy at U...
Digital Advertising Lecture for Advanced Digital & Social Media Strategy at U...
 
Nirala Nagar / Cheap Call Girls In Lucknow Phone No 9548273370 Elite Escort S...
Nirala Nagar / Cheap Call Girls In Lucknow Phone No 9548273370 Elite Escort S...Nirala Nagar / Cheap Call Girls In Lucknow Phone No 9548273370 Elite Escort S...
Nirala Nagar / Cheap Call Girls In Lucknow Phone No 9548273370 Elite Escort S...
 
Charbagh + Female Escorts Service in Lucknow | Starting ₹,5K To @25k with A/C...
Charbagh + Female Escorts Service in Lucknow | Starting ₹,5K To @25k with A/C...Charbagh + Female Escorts Service in Lucknow | Starting ₹,5K To @25k with A/C...
Charbagh + Female Escorts Service in Lucknow | Starting ₹,5K To @25k with A/C...
 
Sonagachi * best call girls in Kolkata | ₹,9500 Pay Cash 8005736733 Free Home...
Sonagachi * best call girls in Kolkata | ₹,9500 Pay Cash 8005736733 Free Home...Sonagachi * best call girls in Kolkata | ₹,9500 Pay Cash 8005736733 Free Home...
Sonagachi * best call girls in Kolkata | ₹,9500 Pay Cash 8005736733 Free Home...
 
20240412-SmartCityIndex-2024-Full-Report.pdf
20240412-SmartCityIndex-2024-Full-Report.pdf20240412-SmartCityIndex-2024-Full-Report.pdf
20240412-SmartCityIndex-2024-Full-Report.pdf
 
如何办理英国诺森比亚大学毕业证(NU毕业证书)成绩单原件一模一样
如何办理英国诺森比亚大学毕业证(NU毕业证书)成绩单原件一模一样如何办理英国诺森比亚大学毕业证(NU毕业证书)成绩单原件一模一样
如何办理英国诺森比亚大学毕业证(NU毕业证书)成绩单原件一模一样
 
TrafficWave Generator Will Instantly drive targeted and engaging traffic back...
TrafficWave Generator Will Instantly drive targeted and engaging traffic back...TrafficWave Generator Will Instantly drive targeted and engaging traffic back...
TrafficWave Generator Will Instantly drive targeted and engaging traffic back...
 
Aspirational Block Program Block Syaldey District - Almora
Aspirational Block Program Block Syaldey District - AlmoraAspirational Block Program Block Syaldey District - Almora
Aspirational Block Program Block Syaldey District - Almora
 
Top profile Call Girls In Chandrapur [ 7014168258 ] Call Me For Genuine Model...
Top profile Call Girls In Chandrapur [ 7014168258 ] Call Me For Genuine Model...Top profile Call Girls In Chandrapur [ 7014168258 ] Call Me For Genuine Model...
Top profile Call Girls In Chandrapur [ 7014168258 ] Call Me For Genuine Model...
 
Vadodara 💋 Call Girl 7737669865 Call Girls in Vadodara Escort service book now
Vadodara 💋 Call Girl 7737669865 Call Girls in Vadodara Escort service book nowVadodara 💋 Call Girl 7737669865 Call Girls in Vadodara Escort service book now
Vadodara 💋 Call Girl 7737669865 Call Girls in Vadodara Escort service book now
 
+97470301568>>weed for sale in qatar ,weed for sale in dubai,weed for sale in...
+97470301568>>weed for sale in qatar ,weed for sale in dubai,weed for sale in...+97470301568>>weed for sale in qatar ,weed for sale in dubai,weed for sale in...
+97470301568>>weed for sale in qatar ,weed for sale in dubai,weed for sale in...
 

Kaggle Google Quest Q&A Labeling 反省会 LT資料 47th place solution

  • 1. //2 44/2 7 & 2 / 0 427 4 8 8 & Q & A IQ LA K G
  • 3. )( 3 C Te TC a C RTs Ci Ci C C ü t t p s a s g C • (/ 2) / H N Cs L • s C C N • Nv • ( - N • . N • coRh C L (/ 2) / • D V s m LirgS nd I GN C dpa V E A :
  • 4. 4 Kaggle 6 3 3 Master ! SIGNATE ü 2 https://www.slideshare.net/matsukenbook/signate-108228406
  • 5. 2015 02016 9 ( ) b 1 9 9 c 2 P 9
  • 7. 7 1 4 2 4 78!
  • 8. 8 qa_id question_title ü tq R a ü th R U question_body ü th question_user_name ü th m question_user_page ü th o answer ü th a ex answer_user_name ü ex m answer_user_page ü ex o url ü tq category ü tq host ü tq i Um LI cp 1, 2, 3 D What am I losing when using extension … After playing around with macro … ysap https://photo.stackexchange.com/users/1024 I just got extension tubes, so here's the skinny. … rfusca https://photo.stackexchange.com/users/1917 1 1 . 1/ 1 : LIFE_ARTS photo.stackexchange.com train data 6079n public data g476n (13%) private data g3186n (87%) ku L s
  • 9. 9
  • 12. 12 • A : :BD GC FK • K B K :F D:K : G P B D F@ A P E:P K D F@ A • https://arxiv.org/abs/1905.05583 • + :@BF@ ( :K MF :K EG D • 4GK G KKBF@) 0B : @ BK B M BGF B A :BF : : !: : G : @ GDMEFK • . :BD BK BF A GDDG BF@ :@ • -GF : F: GGD GM M K M F GM M GE D: G 1DG :D+ :@ 4GGDBF@ . • & GD B A MD BD: D : B B 0GD ! A:FCK : A: A: • GF@ A : G KGDG : B B : BGF https://www.kaggle.com/c/google-quest-challenge/discussion/129885
  • 13. + + 13 L J E7 C ) 5403 L J E79 ()- 5/24 5403 EJ ()- 5403 C ( L J E79 LCC EJ LCC L J E7 C LCC fq]pra . _lk s b J LE_1 J J CL E ajh oeS iJ : E_c Pgm E C]d C . ) L J E. ()- EJ . ()- n [ . J. C : : J LE E E 9 J E : :C JJ : E J:LJJ E -,*,
  • 14. 14 -. N T X aN -.N1 :26:4 E - 1 0 / Rb NN 6 0 L BBB 62 0 : 90 7 :1 7 1
  • 15. 15 0 R T G P 3 6 0 6 B B A6 6 46 B B 0 6 B B A6 6 46 B B 0 6 B B A6 6 46 B B 6 1 B B A6 6 461 B B AB & E A 6 1 B B A6 6 461 B B AB ( E A 2 A6 6 461 B B 32 )D6 2 6. B 6 A6 32 )D6 2 6. B 6 A6 32 )D6 2 6. B 6 A6 0 6 B B A6 6 46 B B 32 )D6 2 6. B 6 A6 6 1 B B A6 6 461 B B AB ( E A E B B B
  • 16. 16 def rank_average(preds): ranked_pred = rankdata(preds) return (ranked_pred - np.min(ranked_pred)) / (np.max(ranked_pred) - np.min(ranked_pred)) class OptimPreds(object): def __init__(self, df_train): self.score_range_dict = {} for i, c in enumerate(df_train.columns[11:]): cnt = df_train[c].value_counts(normalize=True).sort_index() self.score_range_dict[i] = [cnt.index.values.tolist(), cnt.values.tolist()] def predict(self, preds, i): return pd.cut(rank_average(preds), [-np.inf] + np.cumsum(self.score_range_dict[i][1])[:-1].tolist() + [np.inf], labels = self.score_range_dict[i][0]) def optim_predict(pred): for i in range(pred.shape[1]): if i in [2,5,12,13,14,15,19]: pred[:,i] = optim.predict(pred[:,i], i) return pred optim = OptimPreds(df_train) valid_pred = optim_predict(valid_pred_org.copy()) V train targetV C> V 01. - + ( ( )+ 896 2:5 - - ) 8 3764 -( () ) ) (
  • 19. Didn’t work for me 19 ü Pre-training with stackoverflow data (150,000 sentences) ü Multi sample dropout ü The other models ü Roberta ü Albert ü XLNet ü Concatenate question only output & answer only model ü Concatenate category MLP with BERT model ü LSTM head instead of Dense with BERT model ü Freeze half of BertLayer for reducing model complexity ü Skip half of BertLayer for reducing model complexity ü USE(Universal Sequence Encorder) + MLP ü LSTM model with gensim embedding ü custom loss ü BCE & MSE ü focal loss ü Word count feature ü Concat title and question_body as a one block (removing ["SEP"] between them) ü Up-sampling for imbalance target column https://www.kaggle.com/c/google-quest-challenge/discussion/129885 B B L B 1
  • 20. 20