11. Full Resolution Image Compression With
Recurrent Neural Networks, George Toderici et al.
• 画像圧縮をRNNでやる→なんでこれをCVPRに出したの?→DNN使ってて,
査読プロセスに合いそうだったから. (逆に元のコミュニティでは通らな
い??)
• Neural Image Compression Wishlist
• outperform, single model, progressive(画像を部分毎に圧縮可能)
• One Shot Reconstruction: オリジナル画像をCov-RNNに入れて二値化.
• 復元したものと元画像のresidualを計算→resnet様に何回も繰り返す.
• Additive Reconstruction; 前の結果に対して,残差に基づいて修正パッチ
みたいなものを学習するようにネットワークを作成.
• # これで本当に良くなるのか???
• さらに,出力に対してentropy lossを入れる?
• Kodak Dataset
• Arithmetic CodingやResidual GRU (One Shot) Entropy Codingが精度向上に寄与
• 精度をかなり改善することができた.
12. Neural Face Editing With Intrinsic Image
Disentangling, Zhixin Shu et al.
• 入力画像からshadeとnormalsをalbedoをCNNで推定
→これらに関する演算が可能に.
• 表情とか様々なコントロールパラメタで顔を編集可能にする by
Adversarial loss
• 本当に,googleがGANでお絵描きしているのをみてもピンと来なかっ
た自分が恥ずかしい.
• 結果,確かに表情などが操作できていて凄い.
• 凄い…が,しかし,目元の印象が大分変わってしまって,別人になっ
ているんですが,それは…w.
13. Generalized Deep Image to Image Regression,
Venkataraman Santhanam, Vlad I. Morariu, Larry S. Davis
• RGB→Depth,モノクロ→カラーみたいな回帰
浅い層で解像度が半分になった画像に対して
conv→pooling→upsamplingを繰り返して,多重解像度でやる
と精度が上がる,ということ?
• それぞれ画像サイズが半分以下になるので,合計でもパラメタ
は2倍程度
26. 続き
• 希望があれば関西CVPRML勉強会で解説
• 良く見て聴いてきたリスト(面白いと思ったもののみ掲載)
• Online Graph Completion: Multivariate Signal Recovery in Computer Vision, Won Hwa Kim,
Mona Jalal, Seongjae Hwang, Sterling C. Johnson, Vikas Singh
• グラフ信号処理を利用しているように思える.
• 点群の欠損を上手く保管しているみたい.
• やはり,グラフ信号処理の勉強が足りない….
• A Message Passing Algorithm for the Minimum Cost Multicut Problem, Paul Swoboda,
Bjoern Andres
• 普通のgraph cutはグラフを2つにしか分けられない.multicut(3つ以上に分ける)はNP-hard
• 近似非(lower bound)などの詳細がポスターにはなかったが,linearで動くらしい.
• Depth from Defocus in the Wild, Huixuan Tang, Scott Cohen, Brian Price, Stephen Schiller,
Kiriakos N. Kutulakos
• 手法の詳細は不明だが,CNN使ってない!?しかし,かなり出来ていそうだった.スマホ画像に対して動作さ
せていた模様.一見すると,そこまでdefocusが目立つようには見えない画像.