Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.

【DLL3】20170904_AIガイドライン_PFN丸山宏

3 017 vues

Publié le

機械学習・深層学習の知財をめぐる動きについて

  • Soyez le premier à commenter

【DLL3】20170904_AIガイドライン_PFN丸山宏

  1. 1. AIガイドラインセッション ~法務編~ Preferred Networks 丸山宏
  2. 2. 2 ビジネスインサイダー, 8/24/2017, https://www.businessinsider.jp/post-102878
  3. 3. 3 AI生成物の共有・再利用に関するワークショップ ● 産総研・経産省・PFN・UEIなどが中心となって議論し てきたもの — https://sites.google.com/view/srai-2017/ — 学習済みモデルの共有・再利用に必要な技術・ルールは何か? — 画期的な日本の著作権法47条7
  4. 4. 4 日本では著作権法に抵触せずに学習が可能 (情報解析のための複製等) 第四十七条の七 著作物は、電子計算機による情報解 析(多数の著作物その他の大量の情報から、当該情報を 構成する言語、音、影像その他の要素に係る情報を抽出 し、比較、分類その他の統計的な解析を行うことをいう。 以下この条において同じ。)を行うことを目的とする場合 には、必要と認められる限度において、記録媒体への記 録又は翻案(これにより創作した二次的著作物の記録を 含む。)を行うことができる。ただし、情報解析を行う者の 用に供するために作成されたデータベースの著作物につ いては、この限りでない。 著作権法47条7項 (2009年改正) 日本は「機械学習のパラダイス」!
  5. 5. 学習済みモデルの再利用パターン 5 同タスク 新タスク 同タスク 2. Fine Tuning White box再利用 1. Copy : 3. Distillation Black box再利用 同タスク 4. Ensemble 元モデルをそのまま使う NNの一部あるいは全部を再利用、 新たな訓練データを加えて、似た 領域の異なるタスクに利用する 元モデルを教師として、新 たなモデルを訓練する 複数の元モデルの出力を組 み合わせて精度を向上させ る
  6. 6. 機械学習の知財をめぐる動き ● RIETI, 企業において発生するデータの管理と活用に関する実証研究, 「IoT,BD,AIデータ知財に関する研究会」 — http://www.rieti.go.jp/jp/projects/program_2016/pg-04/005.html ● 内閣府 知的財産戦略本部「新たな情報財検討委員会」 — http://www.kantei.go.jp/jp/singi/titeki2/tyousakai/kensho_hyoka_kikaku/2017/joho zai/dai1/gijisidai.html ● 経済産業省、「第四次産業革命を視野に入れた知財システムの在り方に関 する検討会」 — http://www.meti.go.jp/committee/kenkyukai/sansei/daiyoji_sangyo_chizai/001_hai fu.html ● MLEP (機械学習利用促進勉強会) ● Deep Learning懇談会(松尾先生)
  7. 7. 7 学習済みモデル標準化の動き
  8. 8. 8 総務省「AI開発ガイドライン」の議論(2016年12月) ● トロッコ問題、「野良AI」、などの問題意識からスタート ● 「実効性のある」ガイドラインとして「開発者」に責任を負わせる ● ただし「AI」を定義せず — 機械学習など「人工知能技術」と、それを応用した「システム」を区 別せず ● 「透明性(説明可能性)」を要求 — 深層学習には無理 ● 「開発者」と「利用者」の二元論(ものづくりパラダイム) ● 深層学習の開発・利用を萎縮させる効果を考慮せず ● :
  9. 9. 9 http://itpro.nikkeibp.co.jp/atcl/column/14/346926/040600923/?rt=nocnt
  10. 10. 10 2017年7月 ● 国際的な議論のための AI開発ガイドライン案 ● 「開発者が遵守すべき基準を定めるものとしてではなく、開発者が留意し て対応し、対応状況について利用者等に対しアカウンタビリティを果たす ことが期待される事項に関し国際的に共有されることが期待される非拘束 的な指針」 ● AIとは、「学習等により自らの出力やプログラムを変化させるソフトウェ ア」 ● Googleやamazon.comがまずガイドラインを守ってくれるのなら歓迎
  11. 11. 「人工知能」に対する過度の期待と、その裏返しである脅威論 11 NHKニュース、3/31/2017, https://www3.nhk.or.jp/news/business_tokushu/2017_0331.html
  12. 12. 「人工知能」の2つの語義 ● 汎用人工知能(「強い人工知能」) — あらゆる状況で人間と同等以上の知性を示す機械 — ターミネーター、HAL9000、鉄腕アトム… ● 特化型人工知能(「弱い人工知能」) — (それまで自動化が困難であった)特定のタスクを解くシステム — 経路探索、かな漢字変換、物流最適化、売上予測、…、機械翻訳、画像認識、 — 現在注目されている要素技術は 深層学習 (統計的機械学習の一分野) 12 大きなギャップ
  13. 13. 13 IJCAIにおける自律性に関する議論 ● Keynote by Stuart Russell, “Provably Beneficial AI” — ロボットにキルスイッチをつけると? ◆ 人:「コーヒーをとってきて」 ◆ ロボット: “自分が動けなくなったら目的が達成できない” → まず キルスイッチを無効化 — 人の意図が常に曖昧であることを教えなければならない ● Tom Everitt, “Reinforcement Learning with a Corrupted Reward Channel” — “Wirehead”問題。強化学習において報酬関数が正しくなかったら何が起 きるか。 どちらも、最適化問題における「正しい仕様のあり方」の問題を提起
  14. 14. 14 機械学習工学に向けて
  15. 15. 機械学習システムは、高金利クレジット! • CACE (Changing Anything Changes Everything) 原理 – すべてが絡み合っ ている • グルーコード、試験的なコード片な ど、すべてが将来のメインテナスの 悪夢につながる • … https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/43146.pdf
  16. 16. パイプラインとインスツルメンテーション ETL Data prep Training Serving Data prep Data Source Raw Data Training data set Trained Model Pipeline Instrumentation
  17. 17. ハイパーパラメタのチューニング モデルの複雑さが足りない領域 - More layer / nodes 過学習の領域 - Reduce model size - More generalization (dropout etc.) - More training data “Typical relationship between capacity and error”, p. 115 of Goodfellow, I., Bengio, Y., and Courville, A.: Deep Learning, MIT Press, 2016
  18. 18. Learning Rate はいろいろ試してみるべき “If you have time to tune only one hyperparameter, tune the learning rate”, p. 431 of Goodfellow, I., Bengio, Y., and Courville, A.: Deep Learning, MIT Press, 2016
  19. 19. 19 5/8/2017 産経ニュース http://www.sankei.com/economy/news/170508/ecn1705080019-n1.html
  20. 20. 20 7/31/2017 MONOist http://monoist.atmarkit.co.jp/mn/articles/1707/31/news037.html
  21. 21. 21 ソフトウェア危機 (1960年代)  ソフトウェア工学の夜明け
  22. 22. 22 同様に、今こそ “機械学習工学” を! ● 要求工学 — 機械学習のメリット・限界をどのようにステークホルダと共有するか? — 目的関数をどのように設定するか ● ツール — 機械学習におけるIDEとは? — 機械学習の成果物、特に訓練データセットと学習済みモデルをどのようにリポ ジトリ管理するか? — 過度に自動化されたツールによる過学習をどのように避けるか? ● テスト — 機械学習における “リグレッション・テスト” とは? — テスト駆動開発(TDD)から学べることは何か? ● 運用 — 学習済みモデルの「賞味期限」をどのように検出するか?
  23. 23. 23 日本ソフトウェア科学会 (jssst.or.jp)大会@慶応日吉 PFN斎藤がChainerのチュートリアル 丸山が機械学習工学に関する一般講演

×