SlideShare une entreprise Scribd logo
1  sur  21
Télécharger pour lire hors ligne
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Self-supervised Learning of Adversarial Example:
Towards Good Generalizations for Deepfake Detection
Liang Chen1 Yong Zhang2 Yibing Song2 Lingqiao Liu1 Jue Wang2
1 The University of Adelaide 2 Tencent AI Lab
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
2
論文概要
目的
• DeepFakeの検出器をより一般化するための学習手法を提案
手法
• モデルの学習にフェイクの構成を推定するアプローチを組み込む
ことで、汎化性能の向上を狙う
結果
• 学習とは異なるデータセットでテストを行い、従来手法より精度
向上したことから、提案手法が汎化性能向上に貢献している
発表学会
• CVPR2022
論文URL
https://openaccess.thecvf.com/content/CVPR2022/papers/Chen_Self-
Supervised_Learning_of_Adversarial_Example_Towards_Good_Generaliza
tions_for_Deepfake_CVPR_2022_paper.pdf
コード
https://github.com/liangchen527/SLADD.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
3
背景
• DeepFakeとは
深層学習モデルを用いて合成されたFake画像のこと
実際には行っていない、言ってない発言を捏造されるな
ど、社会上の問題となっている
例)2つの入力からFake画像が生成するDeepFake
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
4
先行研究
• DeepFakeを検出するDeepFakeDetectionの研究が盛ん
• 課題
従来研究の一般的な実験では学習・テストが同じデータセット
→論文内では精度が高いが、汎化性能の点に課題がある
実際に利用する場合、多様な画像のフェイクに敏感である必要がある
→本論文では、人物画像のFakeに着目した汎化性能のある検出器の作
成を行う
Detection
Model
Reak?Fake? 分類モデル
Fake!
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
5
提案手法の概要
adversarial data augmentationを用いたDeepFake検出器を提案
• 偽造の種類、構成の補助タスクも同時に学習する自己教師あり学習
• Fakeの領域やタイプも同時に学習することでよりFake部分への感度が高い
モデルを作成
DeepFake(4種)が適用された4パターンの学
習データセットに、学習時とは異なるデー
タセットで評価した実験の結果、提案手法
はベースラインから大きく精度が向上した
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
6
提案手法
生成器
・入力:2枚の画像
・出力:合成する領域(10パターン)、合成手法(3+1)、合成の強度
領域
・右目、左目、鼻、口と6パターンの組み合わせの全10パターン
→ほとんどのDeepFakeが、上記の顔の特徴に着目しているから
合成方法
・alpha blending・Poission blending・mixup・do nothing
合成の強度
・ Mixup選択時の0~1の連続値
生成器
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
7
画像合成の例
• 各顔パーツとその組み合わせ、合成手法を適
用した例
𝐼:3チャネルの画像
𝑝:元画像(pristine)
𝑓:reference
𝐴𝑔:blending ratio
𝑀𝑑:最終的なマスク画像
I𝑎:合成された画像
画像合成の計算
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
8
提案手法
検出器
𝐿𝑅:推定マスク領域の損失関数
検出器
𝑀𝑔𝑡:マスク画像のGT
𝑀𝑒:推論されたマスク画像
𝐻:画像の縦サイズ
𝑊:画像の横サイズ
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
9
提案手法
検出器
LT :blending type推定のロス
4つに加え、すでにFakeが含まれている学習データセットの場合や、
想定外の合成手法に対応するためのクラスを一つ加えた5クラスと
している
損失関数はAMSoftmaxLoss[49]を使用
検出器
[49] Feng Wang, Jian Cheng, Weiyang Liu, and Haijun Liu. Additive margin
softmax for face verification. IEEE SPL, 25(7):926–930, 2018.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
10
提案手法
検出器
𝐴𝑔t:blending ratioのGT
𝐴𝑒 :推定されたratio
検出器
LA :blending ratio 推定のロス
Mixupの場合はΓ = 1、それ以外はゼロとされており、Mixupが選択さ
れていた場合のみ有効となる
LMain : Fake判定のメインタスクのロス.損失関数はCrossentropy使用
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
11
提案手法
MinMax法で学習
α, μ, γ:ハイパーパラメータ
𝜂:学習率
Ln :n番目のミニバッチ
𝑁:バッチサイズ
Θ:生成モデルのパラメータ
𝑤:識別モデルのパラメータ
生成器は識別器を騙す(損失最大化)するようパラメータを学習し、
識別器は損失を最小化するような敵対的学習を行う
式(4)のハイパーパラメータ:α = 0.1,μ = 0.05,γ = 0.1としている
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
12
実験設定
• 学習データセット
・Faceforencis++ (FF++) データセット [41]
1000のReal動画を740を学習、140を検証、140をテストに使用。
すべての動画はDeepfakes (DF) [11], Face2Face (F2F) [45], FaceSwap (FS) [15],
NeuralTextures (NT) [44]の4つのFake手法によってFakeが作成される。
最終的な出力は,RAW,HQ(デフォルト),LQの異なる圧縮レベルでそれぞ
れ生成される
• テストデータセット
・CelebDF [28]:408の実ビデオと795の合成ビデオ
・Depfake Detection Challenge (DFDC) [12] :1000以上のReal動画と4000
以上のFake動画
Deepfake、GANbased、非learnedメソッドによって操作されたもの。
・Deeperforensics-1.0(DF1.0)[20]:DF-VAE手法による11000以上のFake動画
• 前処理
顔抽出と位置合わせにはDLIB[42]を用い,学習データセットとテストデー
タセットのすべてのサンプルについて,位置合わせされた顔を256×256に
リサイズしている.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
13
実験設定
• モデル
・生成器、検出器はXception[8]
パラメータはImageNetで事前に学習されたXceptionによって初期化
最適化手法:Adam(β1 = 0.9, β2 = 0.999)
バッチサイズ:32
学習率:検出器2×10-4、生成器5×10-5
[8] Franc,ois Chollet. Xception: Deep learning with depthwise separable convolutions. In CVPR, 2017
[11] DeepFakes. www . github . com / deepfakes /faceswap Accessed 2021-04-24.
[12] Deepfake detection challenge. https://www.kaggle.com / c / deepfake - detection - challenge Accessed 2021-04-24.
[15] FaceSwap. www.github.com/MarekKowalski/FaceSwap Accessed 2021-04-24.
[20] Liming Jiang, Ren Li, Wayne Wu, Chen Qian, and Chen Change Loy. Deeperforensics-1.0: A large-scale dataset for real-world face forgery detection. In CVPR, 2020.
[28] Yuezun Li, Xin Yang, Pu Sun, Honggang Qi, and Siwei Lyu. Celeb-df: A new dataset for deepfake forensics. In CVPR, 2020.
[41] Andreas Rossler, Davide Cozzolino, Luisa Verdoliva, Christian Riess, Justus Thies, and Matthias Niesner. Faceforensics++: Learning to detect manipulated facial
images. In ICCV, 2019
[42] Christos Sagonas, Epameinondas Antonakos, Georgios Tzimiropoulos, Stefanos Zafeiriou, and Maja Pantic. 300 faces in-the-wild challenge: database and results. IVC,
47:3–18, 2016.
[44] Justus Thies, Michael Zollh¨ofer, and Matthias Niesner. Deferred neural rendering: Image synthesis using neural textures. TOG, 38(4):1–12, 2019.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
14
DeepFakeの例
Face2Face[45]を使用したDeepFakeの例
[45] Justus Thies, Michael Zollhofer, Marc Stamminger, Christian Theobalt, and Matthias
Niesner. Face2face: Real-time face capture and reenactment of rgb videos. In CVPR, 2016.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
15
実験結果
• FF++データセットに各DeepFake手法を適用し、
異なるテストデータセットで従来手法と比較
• 提案した敵対的学習と自己教師あり学習が有効
• 学習に使用したFF++に有効な特徴抽出も、他データセットで精度が低下してい
ることから一般化できていない可能性を示唆
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
16
実験結果
• 合成が画像の品質と精度の比較
• 品質が低い(粗い)場合でも、提案モデルは
他モデルより高精度
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
17
実験結果
• Fake領域とFake検出のマルチタスクモデルと比較
• 他手法より高精度
• 他手法はアノテーションが必要であるが、提案手法は
生成器による自己教師あり学習を行うため不要
• Fakeの一般的な構成を簡単に変更可能
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
18
実験結果
• FF++で学習・テストした結果と、FF++で学習・CelebDFでテス
トした結果
→ 学習していないデータセットに対して汎化性能があることを示し
ている
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
19
実験結果
アブレーションスタディ
w/ adv 敵対的学習による生成(自己教師あり学習の補助タスクはなし)
w/ ran ランダム生成
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
20
実験結果
• アブレーションスタディ
自己教師あり学習のLoss関数の組み合わせを比
較
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
21
まとめ
• 自己教師あり学習とGANを用いたDeepFakeの
検出器を提案
• Fakeの領域やタイプも同時に学習することで
よりFake部分への感度が高いモデルを作成
• 結果、学習に使用したデータセット以外の分
布のデータに対しても汎化性能があることを
明らかにした

Contenu connexe

Similaire à Self-supervised Learning of Adversarial Example: Towards Good Generalizations for Deepfake Detection

Similaire à Self-supervised Learning of Adversarial Example: Towards Good Generalizations for Deepfake Detection (20)

Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
 
Personalized Fashion Recommendation from Personal Social Media Data An Item t...
Personalized Fashion Recommendation from Personal Social Media Data An Item t...Personalized Fashion Recommendation from Personal Social Media Data An Item t...
Personalized Fashion Recommendation from Personal Social Media Data An Item t...
 
ArcFace: Additive Angular Margin Loss for Deep Face Recognition
ArcFace: Additive Angular Margin Loss for Deep Face RecognitionArcFace: Additive Angular Margin Loss for Deep Face Recognition
ArcFace: Additive Angular Margin Loss for Deep Face Recognition
 
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
 
Semi-Supervised Neural Architecture Search
Semi-Supervised Neural Architecture SearchSemi-Supervised Neural Architecture Search
Semi-Supervised Neural Architecture Search
 
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
 
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
 
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated TextAll That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
 
Feature Erasing and Diffusion Network for Occluded Person Re-Identification
Feature Erasing and Diffusion Network for Occluded Person Re-IdentificationFeature Erasing and Diffusion Network for Occluded Person Re-Identification
Feature Erasing and Diffusion Network for Occluded Person Re-Identification
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
Emotionally Intelligent Fashion Design Using CNN and GAN
Emotionally Intelligent Fashion Design Using CNN and GANEmotionally Intelligent Fashion Design Using CNN and GAN
Emotionally Intelligent Fashion Design Using CNN and GAN
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
 
修士論文
修士論文修士論文
修士論文
 
2021 haizoku
2021 haizoku2021 haizoku
2021 haizoku
 
2021 haizoku
2021 haizoku2021 haizoku
2021 haizoku
 
RAPiD
RAPiDRAPiD
RAPiD
 
Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image S...
Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image S...Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image S...
Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image S...
 
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic ArithmeticZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
 
深層学習を用いたバス乗客画像の属性推定 に関する研究
深層学習を用いたバス乗客画像の属性推定 に関する研究深層学習を用いたバス乗客画像の属性推定 に関する研究
深層学習を用いたバス乗客画像の属性推定 に関する研究
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Models
 

Plus de harmonylab

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
harmonylab
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
harmonylab
 

Plus de harmonylab (20)

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
 
A Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear GridA Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear Grid
 
A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...
 
A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...
 
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
 
2022年度調和系工学研究室配属説明会資料
2022年度調和系工学研究室配属説明会資料2022年度調和系工学研究室配属説明会資料
2022年度調和系工学研究室配属説明会資料
 

Self-supervised Learning of Adversarial Example: Towards Good Generalizations for Deepfake Detection

  • 1. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Self-supervised Learning of Adversarial Example: Towards Good Generalizations for Deepfake Detection Liang Chen1 Yong Zhang2 Yibing Song2 Lingqiao Liu1 Jue Wang2 1 The University of Adelaide 2 Tencent AI Lab
  • 2. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 2 論文概要 目的 • DeepFakeの検出器をより一般化するための学習手法を提案 手法 • モデルの学習にフェイクの構成を推定するアプローチを組み込む ことで、汎化性能の向上を狙う 結果 • 学習とは異なるデータセットでテストを行い、従来手法より精度 向上したことから、提案手法が汎化性能向上に貢献している 発表学会 • CVPR2022 論文URL https://openaccess.thecvf.com/content/CVPR2022/papers/Chen_Self- Supervised_Learning_of_Adversarial_Example_Towards_Good_Generaliza tions_for_Deepfake_CVPR_2022_paper.pdf コード https://github.com/liangchen527/SLADD.
  • 3. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 3 背景 • DeepFakeとは 深層学習モデルを用いて合成されたFake画像のこと 実際には行っていない、言ってない発言を捏造されるな ど、社会上の問題となっている 例)2つの入力からFake画像が生成するDeepFake
  • 4. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 4 先行研究 • DeepFakeを検出するDeepFakeDetectionの研究が盛ん • 課題 従来研究の一般的な実験では学習・テストが同じデータセット →論文内では精度が高いが、汎化性能の点に課題がある 実際に利用する場合、多様な画像のフェイクに敏感である必要がある →本論文では、人物画像のFakeに着目した汎化性能のある検出器の作 成を行う Detection Model Reak?Fake? 分類モデル Fake!
  • 5. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 5 提案手法の概要 adversarial data augmentationを用いたDeepFake検出器を提案 • 偽造の種類、構成の補助タスクも同時に学習する自己教師あり学習 • Fakeの領域やタイプも同時に学習することでよりFake部分への感度が高い モデルを作成 DeepFake(4種)が適用された4パターンの学 習データセットに、学習時とは異なるデー タセットで評価した実験の結果、提案手法 はベースラインから大きく精度が向上した
  • 6. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 6 提案手法 生成器 ・入力:2枚の画像 ・出力:合成する領域(10パターン)、合成手法(3+1)、合成の強度 領域 ・右目、左目、鼻、口と6パターンの組み合わせの全10パターン →ほとんどのDeepFakeが、上記の顔の特徴に着目しているから 合成方法 ・alpha blending・Poission blending・mixup・do nothing 合成の強度 ・ Mixup選択時の0~1の連続値 生成器
  • 7. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 7 画像合成の例 • 各顔パーツとその組み合わせ、合成手法を適 用した例 𝐼:3チャネルの画像 𝑝:元画像(pristine) 𝑓:reference 𝐴𝑔:blending ratio 𝑀𝑑:最終的なマスク画像 I𝑎:合成された画像 画像合成の計算
  • 8. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 8 提案手法 検出器 𝐿𝑅:推定マスク領域の損失関数 検出器 𝑀𝑔𝑡:マスク画像のGT 𝑀𝑒:推論されたマスク画像 𝐻:画像の縦サイズ 𝑊:画像の横サイズ
  • 9. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 9 提案手法 検出器 LT :blending type推定のロス 4つに加え、すでにFakeが含まれている学習データセットの場合や、 想定外の合成手法に対応するためのクラスを一つ加えた5クラスと している 損失関数はAMSoftmaxLoss[49]を使用 検出器 [49] Feng Wang, Jian Cheng, Weiyang Liu, and Haijun Liu. Additive margin softmax for face verification. IEEE SPL, 25(7):926–930, 2018.
  • 10. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 10 提案手法 検出器 𝐴𝑔t:blending ratioのGT 𝐴𝑒 :推定されたratio 検出器 LA :blending ratio 推定のロス Mixupの場合はΓ = 1、それ以外はゼロとされており、Mixupが選択さ れていた場合のみ有効となる LMain : Fake判定のメインタスクのロス.損失関数はCrossentropy使用
  • 11. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 11 提案手法 MinMax法で学習 α, μ, γ:ハイパーパラメータ 𝜂:学習率 Ln :n番目のミニバッチ 𝑁:バッチサイズ Θ:生成モデルのパラメータ 𝑤:識別モデルのパラメータ 生成器は識別器を騙す(損失最大化)するようパラメータを学習し、 識別器は損失を最小化するような敵対的学習を行う 式(4)のハイパーパラメータ:α = 0.1,μ = 0.05,γ = 0.1としている
  • 12. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 12 実験設定 • 学習データセット ・Faceforencis++ (FF++) データセット [41] 1000のReal動画を740を学習、140を検証、140をテストに使用。 すべての動画はDeepfakes (DF) [11], Face2Face (F2F) [45], FaceSwap (FS) [15], NeuralTextures (NT) [44]の4つのFake手法によってFakeが作成される。 最終的な出力は,RAW,HQ(デフォルト),LQの異なる圧縮レベルでそれぞ れ生成される • テストデータセット ・CelebDF [28]:408の実ビデオと795の合成ビデオ ・Depfake Detection Challenge (DFDC) [12] :1000以上のReal動画と4000 以上のFake動画 Deepfake、GANbased、非learnedメソッドによって操作されたもの。 ・Deeperforensics-1.0(DF1.0)[20]:DF-VAE手法による11000以上のFake動画 • 前処理 顔抽出と位置合わせにはDLIB[42]を用い,学習データセットとテストデー タセットのすべてのサンプルについて,位置合わせされた顔を256×256に リサイズしている.
  • 13. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 13 実験設定 • モデル ・生成器、検出器はXception[8] パラメータはImageNetで事前に学習されたXceptionによって初期化 最適化手法:Adam(β1 = 0.9, β2 = 0.999) バッチサイズ:32 学習率:検出器2×10-4、生成器5×10-5 [8] Franc,ois Chollet. Xception: Deep learning with depthwise separable convolutions. In CVPR, 2017 [11] DeepFakes. www . github . com / deepfakes /faceswap Accessed 2021-04-24. [12] Deepfake detection challenge. https://www.kaggle.com / c / deepfake - detection - challenge Accessed 2021-04-24. [15] FaceSwap. www.github.com/MarekKowalski/FaceSwap Accessed 2021-04-24. [20] Liming Jiang, Ren Li, Wayne Wu, Chen Qian, and Chen Change Loy. Deeperforensics-1.0: A large-scale dataset for real-world face forgery detection. In CVPR, 2020. [28] Yuezun Li, Xin Yang, Pu Sun, Honggang Qi, and Siwei Lyu. Celeb-df: A new dataset for deepfake forensics. In CVPR, 2020. [41] Andreas Rossler, Davide Cozzolino, Luisa Verdoliva, Christian Riess, Justus Thies, and Matthias Niesner. Faceforensics++: Learning to detect manipulated facial images. In ICCV, 2019 [42] Christos Sagonas, Epameinondas Antonakos, Georgios Tzimiropoulos, Stefanos Zafeiriou, and Maja Pantic. 300 faces in-the-wild challenge: database and results. IVC, 47:3–18, 2016. [44] Justus Thies, Michael Zollh¨ofer, and Matthias Niesner. Deferred neural rendering: Image synthesis using neural textures. TOG, 38(4):1–12, 2019.
  • 14. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 14 DeepFakeの例 Face2Face[45]を使用したDeepFakeの例 [45] Justus Thies, Michael Zollhofer, Marc Stamminger, Christian Theobalt, and Matthias Niesner. Face2face: Real-time face capture and reenactment of rgb videos. In CVPR, 2016.
  • 15. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 15 実験結果 • FF++データセットに各DeepFake手法を適用し、 異なるテストデータセットで従来手法と比較 • 提案した敵対的学習と自己教師あり学習が有効 • 学習に使用したFF++に有効な特徴抽出も、他データセットで精度が低下してい ることから一般化できていない可能性を示唆
  • 16. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 16 実験結果 • 合成が画像の品質と精度の比較 • 品質が低い(粗い)場合でも、提案モデルは 他モデルより高精度
  • 17. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 17 実験結果 • Fake領域とFake検出のマルチタスクモデルと比較 • 他手法より高精度 • 他手法はアノテーションが必要であるが、提案手法は 生成器による自己教師あり学習を行うため不要 • Fakeの一般的な構成を簡単に変更可能
  • 18. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 18 実験結果 • FF++で学習・テストした結果と、FF++で学習・CelebDFでテス トした結果 → 学習していないデータセットに対して汎化性能があることを示し ている
  • 19. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 19 実験結果 アブレーションスタディ w/ adv 敵対的学習による生成(自己教師あり学習の補助タスクはなし) w/ ran ランダム生成
  • 20. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 20 実験結果 • アブレーションスタディ 自己教師あり学習のLoss関数の組み合わせを比 較
  • 21. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 21 まとめ • 自己教師あり学習とGANを用いたDeepFakeの 検出器を提案 • Fakeの領域やタイプも同時に学習することで よりFake部分への感度が高いモデルを作成 • 結果、学習に使用したデータセット以外の分 布のデータに対しても汎化性能があることを 明らかにした