Contenu connexe
Similaire à TISにおける、研究開発の方針とメソッド 2018 (20)
Plus de Takahiro Kubo (19)
TISにおける、研究開発の方針とメソッド 2018
- 1. Copyright © 2017 TIS Inc. All rights reserved.
TIS株式会社
戦略技術センター/chakkiチームの取組紹介
戦略技術センター
久保隆宏
Team “chakki” at Strategic Technology Center
- 2. Copyright © 2017 TIS Inc. All rights reserved. 2
本文書の目的
TISとは
戦略技術センターとは
chakkiチームとは
chakkiチームでの活動
行動指針
マネジメント方針
活動内容
活動内容の詳細
研究開発
UX開発
広報活動
貢献活動
育成活動
おわりに
目次
- 3. Copyright © 2017 TIS Inc. All rights reserved. 3
本文書では、chakkiチームが何を目指していて、それを達成するためにど
のような研究開発活動をしているのかについて共有します。その前段とし
て、chakkiチームが所属する戦略技術センターが目指している所について
も共有します。
本文書の目的
- 5. Copyright © 2017 TIS Inc. All rights reserved. 5
TISはTISインテックグループの中核会社となる。
TISインテックグループは、多様な得意分野をもつ企業の総体。グルー
プ企業間のシナジーを活かし、「お客様に最適を」を実現する。
会社紹介
TIS INTEC GROUP(国内29社、海外21社、連結 20,206名)
お客様
- 7. Copyright © 2017 TIS Inc. All rights reserved. 7
2026年に向けてのTISのビジョン
Create Exciting Future
IT技術の革新が進むにつれ、顧客が使用する「IT」にもまた大きな革
新が起こっていく
この変化に対応できなければ、そもそも今後案件を受託、保守してい
くことすら難しくなる。
TISは、単なるキャッチアップにとどまるのでなく、自ら社会変化を加速
させ、社会を動かす存在になっていく。
- 9. Copyright © 2017 TIS Inc. All rights reserved. 9
TISの中で、中長期(3~10年)
でのビジネス化を見据えた技
術検証・サービスプロトタイ
プ開発を行う部署。
関連する部署
AIサービス事業部
実際にサービス化する部門
インキュベーションセン
ター
ベンチャーなどへの出資
テクノロジー&エンジニア
リング本部
社内の開発生産性の向上
を担う部門(研究もある)
戦略技術センター
- 10. Copyright © 2017 TIS Inc. All rights reserved. 10
新時代の社会インフラに必要なパーツをそろえる
戦略技術センターの構想と取り組み
接続機構
(Network)
知覚主体
(IoT)
行動主体
(Robotics)
認識・計画主体
(Machine Learning)
・知覚主体/行動主体
・認識・計画主体
各種主体機能の補助、また疑似体験
による主体機能の獲得/向上(XR)
労働人口が減る中で、人の仕事を代替あるいは補助すると共に、人の学習
効率を向上させ生産性を高める。
- 11. Copyright © 2017 TIS Inc. All rights reserved. 11
戦略技術センターの構想と取り組み
接続機構
(Network)
現在の取り組み状況
様々な大学、ベンチャー、顧客、自治体と共同で研究を推進
自ら社会変化を加速させ、社
会を動かす存在になっていく
- 13. Copyright © 2017 TIS Inc. All rights reserved. 13
chakkiチームの位置づけ
接続機構
(Network)
知覚主体
(IoT)
行動主体
(Robotics)
認識・計画主体
(Machine Learning)
・知覚主体/行動主体
・認識・計画主体
各種主体機能の補助、また疑似体験
による主体機能の獲得/向上(XR)
chakkiチームの担う箇所
- 14. Copyright © 2017 TIS Inc. All rights reserved. 14
情報の量が増える中で、それを認識するスピードは追いついていない。
業務システムには売上、計画等のデータがうず高く積まれている
社会全体でも、テキスト、センサー、動画とデータが増えている
人間側としては、要点だけ教えてほしい。
特にトラブルが起こったとき
例: 担当者が辞めた後の引継ぎ、障害前後のログ
chakkiチームの位置づけ
観点を指定した要約=観点要約に取り組む
人の「観点」を機械的に再現し、データを読むのにスケールさせる。
読み取った内容を人にとってわかりやすく「要約」する。
- 15. Copyright © 2017 TIS Inc. All rights reserved. 15
chakkiのミッション
Summarize data for human
あらゆるデータを、人間にとってわかりやすく要約
することを目指します。
chakkiが目指す機能:
要約の観点を、なるべく少ないデータで学習する
自然言語以外の、画像や数値データの要約も扱う
図や表といった表現形態にも挑戦する
この機能の実現を通じ、最終的にはいつでもティー
タイム(15:00)に帰れる(=茶帰)社会を目指します。
2018年度より具体化
- 16. Copyright © 2017 TIS Inc. All rights reserved. 16
chakkiのミッション
観点の学習・転移
(観点の)
情報抽出
要約(可視化)
その時々に指定される「観点」
を、素早く理解し学習する
抽出されたデータを、わかりや
すい形で表現する
指定された観点に基づき情報の
抽出を行う
- 17. Copyright © 2017 TIS Inc. All rights reserved. 17
chakkiのミッション
過去のプロジェクトで利用された技術を知りたい!
使用した言語・フレームワークごとに分類してくれ!
10件データがあれば
できるぜ!
ユーザーから頂いたアンケートについて、デザインや品
質といった観点から分析したいわ。明日までに!
10件データがあれば
できるぜ!
昨日、ビニールハウスの温度や湿度に大きな変化はな
かったかしら?
わかるぜ!
- 19. Copyright © 2017 TIS Inc. All rights reserved. 19
chakkiチームでは、以下の行動指針を設けている。
行動方針(1/2)
エンジニア精神を体現する
オープンであること
開発資産やノウハウはデフォルト公開していく
理屈よりソフトウェアによる体験を提供する
プロトタイプ・デモを重視する
仕事の仕方にこだわる
COOLに仕事をこなしTEIJIに帰る
- 20. Copyright © 2017 TIS Inc. All rights reserved. 20
行動方針(2/2)
ソフトウェアはGitHub、ノウハウ
はQiita、またイベントでの登壇な
どで積極的に情報の発信を行う
プレゼンスの向上は、STCのミッ
ションでもある
- 21. Copyright © 2017 TIS Inc. All rights reserved. 21
chakkiチームのマネジメントは以下の方針で行っている。
マネジメント方針
モチベーション第一主義
chakkiのチームマネージャーは、以下点に注力する。
取り組みがいのある課題を提供する
社会的意義・研究テーマとしての面白さ
メンバーの成長とビジネス価値を比例させる
訳: 給料に反映する
グローバルで活躍できるエンジニアまでの成長ステップを提供する
訳: この場で世界で戦えるようになれるようにする(したい)
※この背景については2017年の資料を参照
- 22. Copyright © 2017 TIS Inc. All rights reserved. 22
活動内容(1/2)
研究開発
コアとなる機械学習・自然言
語処理技術の開発
UX/インフラ開発
研究開発した機能とユーザー
をつなぐ部品の開発。またそ
れを促進するインフラの開発
Value
広報活動
研究開発した機能や、応用事
例を公開し、顧客獲得へとつ
なげる活動。
貢献活動
研究コミュニティ、ひいては
人類に貢献するための活動。
Feature
- 23. Copyright © 2017 TIS Inc. All rights reserved. 23
活動内容(2/2)
アウトプットの種類は以下5つとなる。どのアウトプットにどれくらい注
力するかは、半期ごとの目標設定において自由に決めることができる。
研究開発
選択した研究テーマに関するソフトウェア・データをリリースする
UX/インフラ開発
研究開発でリリースした機能の価値を、ユーザーに体験してもらう
ためのアプリケーション開発を行う。
研究開発、UX開発を行うためのインフラを整備する。
広報活動
作成したプロダクトの応用事例を紹介する
貢献活動
研究・開発コミュニティへの貢献活動
育成活動
チームメンバーの育成を行う
これ以外に、個人としての
OSS/対外発表が評価される
- 25. Copyright © 2017 TIS Inc. All rights reserved. 25
chakkiチームでの活動内容は、主に以下4つとなる。
研究開発
UX/インフラ開発
広報活動
貢献活動
育成活動
活動内容
- 26. Copyright © 2017 TIS Inc. All rights reserved. 26
観点要約を実現する、各機能を開発していく。
それらの機能は観点要約のため「だけ」の機能でなく、個々が独立して機
能するようにする(マイクロサービス的な構成)。
これにより、機能単体でも価値が出せるようにするほか、観点要約が実現
しなくても(or投資が打ち切られても)その後の開発に活きるようにする。
研究開発
観点要約
観点要約
- 27. Copyright © 2017 TIS Inc. All rights reserved. 27
観点指定要約(1/5)
ペンギンのサイズは小さくて、かわいくて、手触りは冷たい。
ライオンは温かくて大きい。顔がちょっと怖い。
ウサギのぬいぐるみは普通で、冷たくはない。
大きさと感触についてまとめてほしい
大きさ 感触
ペンギン 小さい 冷たい
ライオン 大きい 温かい
ウサギ 中くらい 常温
観点指定要約とは、「複数の文書」から、 「指定された観点」の情報を
抽出し、「表にまとめる」ことする。
- 28. Copyright © 2017 TIS Inc. All rights reserved. 28
ペンギンのサイズは小さくて、かわいくて、手触りは冷たい。
ライオンは温かくて大きい。顔がちょっと怖い。
ウサギのぬいぐるみは普通で、冷たくはない。
大きさと感触についてまとめてほしい
大きさ 感触
ペンギン 小さい 冷たい
ライオン 大きい 温かい
ウサギ 中くらい 常温
観点指定要約(2/5)
観点情報の検索
大きさ 感触
ペンギンのサイズは小さくて、手触りは冷たい。
小さい 冷たい
観点表現の抽出/転移 表現の集約
Small
Cold
小さい
ちっちゃい
冷たい
・・・
・・
テーブル化
観点指定要約全体のプロセスとしては、以下のような形になる。
- 29. Copyright © 2017 TIS Inc. All rights reserved. 29
観点指定要約: 数値データ(3/5)
2016年の売上についてまとめてほしい
売上
A事業部 190,000
B事業部 150,000
A事業部 B事業部
観点指定要約では、数値データを対象とした要約も行う。
Summarize “data”
for human
- 30. Copyright © 2017 TIS Inc. All rights reserved. 30
観点指定要約: 数値データ(4/5)
2016年の売上についてまとめてほしい
売上
A事業部 190,000
B事業部 150,000
A事業部 B事業部
観点表現の抽出
2016年 売上
データベース/
テーブルスキーマ
データ抽出クエリ(SQL等)の実行
SELECT 売上 from 売上テーブル where 年 = 2016
テーブル化
数値指定の観点要約は、以下のようなプロセスとなる。
- 31. Copyright © 2017 TIS Inc. All rights reserved. 31
観点指定要約: 観点推定(5/5)
ぬいぐるみについて
まとめてほしい
ぬいぐるみなら大
きさでまとめる
最大値と最小値や、
異常値を報告
観点推定は、指定を行わなくても観点を推定する機能となる。
- 32. Copyright © 2017 TIS Inc. All rights reserved. 32
単語分散表現
観点として指定された語句の意味をとらえるために、事前学習済み
分散表現を活用する。
指定された語句が要約対象の文書においてどんな意味を持つかにつ
いて、少量のデータ/ラベルなしデータから学習する
情報抽出
指定された観点について述べている表現を抽出する(大きさは、小
さい、など)
表現/単語類似度推定・分類
抽出された観点表現のうち、同一とみられるものをまとめる。
まとめる単位について、少量のデータから学習を行う。
研究テーマ(1/3)
自然言語の観点指定要約は、Aspect Based Sentiment Analysisを
ベースにする。
- 33. Copyright © 2017 TIS Inc. All rights reserved. 33
Seq2Query
自然言語をデータ抽出を行うためのクエリに変換する
Seq2SQLなどをベースに進める。
固有表現認識
クエリ項目の抽出や、観点表現の抽出を行う。
クエリ項目の元となるデータベーススキーマ、観点表現を学習する
ためのデータは何れも少ないため、転移学習が重要となる。
知識構築(優先度:低)
エンティティが持つ属性についての事前知識を構築し、観点の推定
を行う
異常検知
観点として、数値データ内の特異な変化を検知する。
研究テーマ(2/3)
自然言語の転移学習・few-shot learningが大きなテーマ
- 34. Copyright © 2017 TIS Inc. All rights reserved. 34
研究テーマ(3/3)
単語分散表現
固有表現認識
表現/単語類似度推定・
分類
要約
Seq2SQL
情報抽出
分類
テーブル化、より分かりやすい可視化等表現
知識構築
異常検知
- 35. Copyright © 2017 TIS Inc. All rights reserved. 35
研究開発したコア機能を、ユーザーに届けるためのインタフェースの開発
各種アプリケーションとの接続機能
Slack Bot
kintone
etc...
モデルを扱うための機能
モデルを学習させるためのツール
データとして使う文章を抽出するツール(Excel2Textなど)
これらは、広報活動にも大きくかかわる。
UX/インフラ開発(1/3)
- 36. Copyright © 2017 TIS Inc. All rights reserved. 36
UX/インフラ開発(2/3)
CSVファイルをアップロードした後、
Slackで対話的にモデルが作れるデ
モ。kintoneアプリケーションとの
連携機能もあり。
文章を「わかりやすさ」順にソー
トして表示するアプリケーション
- 37. Copyright © 2017 TIS Inc. All rights reserved. 37
UX/インフラ開発(3/3)
実際にアプリケーション開発、また研究開発を行うにはインフラ面の
サポートも欠かせない。
学習のためのGPU環境
モデル/アプリケーションのデプロイetc
こうしたインフラを整備するための開発も行う。なお、使用するクラ
ウド環境はGCPをメインにする。
- 38. Copyright © 2017 TIS Inc. All rights reserved. 38
研究開発したコア機能、またそれにUXを組み合わせて、「こう使える」
とユーザーがイメージできる事例を作成・広報する。
「ぬいぐるみレビューにおけるネガポジを、より細かく分析する」
「メールから日付、場所を抽出してスケジュールに登録する」
これにより、顧客獲得を目指す。
⇒chakkiチームのビジネスモデルはサービス型でなく、クライアント型です
広報活動
チームブログで公開
する
イベントでの登壇、
社内セミナーなどで
広報
- 39. Copyright © 2017 TIS Inc. All rights reserved. 39
研究・開発コミュニティに貢献する活動を行う。
OSSのIssueの消化(チームで開発したもの以外も含む)
論文に関する情報の共有
貢献活動
- 40. Copyright © 2017 TIS Inc. All rights reserved. 40
チームメンバーの育成を行う。
チームにおける育成活動は、以下の3種類
新規参画メンバ用プログラム
新規参画したメンバが一通り行うプログラム。こちら参照。
特定テーマのノウハウ共有
基本的に内容は公開する
対外的な発表にはarXivTimes輪講やTech Circleを活用
コーチング
1:1で行うコードレビューや資料レビュー
チームメンバー全員によるレビュー(チームレビュー)は、リクエストに応
じ行う(コーチング担当者、開発担当者などが必要と判断した際にセッ
ティングを行う)。
育成活動
- 41. Copyright © 2017 TIS Inc. All rights reserved. 41
活動スケジュール
半期 月次 週次
アウトプットの宣言
活動の配分は、自ら希望し割
合を決める(その後チーム内で
調整)。
半期単位で立てたアウトプッ
トについて、内容や配分に見
直しが必要であれば行う。
週次で進捗と、現在抱えて
いる課題を共有する。
また、書籍紹介によるイン
プットを行う。
研究開発
UX/
インフラ
開発
広報活動貢献活動
育成活動