Contenu connexe
Similaire à 「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史 (20)
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史
- 2. Copyright© Hottolink、 Inc。
▶TOPICS 自己紹介
榊 剛史 (株)ホットリンク、研究開発G 主任研究員兼マネージャ
東京大学、客員研究員
• 興味領域
– Web/データマイニング
– 機械学習、人工知能、自然言語処理
– 計算社会科学
• 経歴
– 2004年~2004年:東大 黒橋研 学士
– 2004年~2005年:東大 石塚研 修士
– 2006年~2009年:某電力会社にて勤務
– 2009年~2013年:東大 松尾研 博士
• ホットリンクでバイト
• MSRAでインターン
– 2014年:東大 ポスドク/ホットリンクで業務委託
– 2015年~現在 :ホットリンクにて勤務/東大 客員研究員
- 6. 人工知能研究の歴史
• 1957年〜1969年 Good Old Fashioned AI
– AI研究が進めば20世紀以内にはコンピュータは人間
に勝てるぜ!!と思っていた時代
– 1958年に「10年以内にコンピュータはチェスチャンピオ
ンに勝利する」とH.Simonが予測
• 1970年〜1979年 現実からの反撃
– 少数の例でうまく動作した方法が大規模には適用不
可能な事例が多数出現
– 答えを知っている問題しか解けない!
- 7. 人工知能研究の歴史
• 1980年〜1988年 人工知能の産業化
– 1980年 J.Sealeが強いAIと弱いAIを定義
– 人間の知的能力の一部だけでもいいから、できることから
やろうぜ!!
• 1989年〜2000年代 機械学習の成長と弱いAIの発展
– 確率理論・統計学をベースとした様々な機械学習手法が
開発
– 上記をベースとして、検索エンジンやスパムフィルタなど、
「弱いAI」の機能が発展
• 2010年代~現在 Deep Learningの発展
- 11. Deep Learningと機械学習
10
• 機械学習
– 確率統計を用いて、入力された特徴量から出力を予
測するアプローチ
• Deep Learning
– 入力されたデータから、出力の予測に有効な特徴量を
自動抽出し、出力を予測するアプローチ※機械学習
よりも一方「強いAI」に近づいた
本発表では、Deep Learning・機械学習・統計学・自然言語処理をひっ
くるめて、AI技術と呼びます
- 13. Copyright© Hottolink、 Inc。
▶TOPICS
社 名 株式会社ホットリンク
資 本 金 1,234百万円 (2016年9月末現在)
本 社 東京都千代田区四番町6番 東急番町ビル
設 立 2000年6月26日
代 表 代表取締役社長 内山 幸樹
事 業 内 容
ソーシャル・ビッグデータの分析・販売事業
クラウドサービス事業
インバウンドプロモーション支援事業など
連 結 子 会 社 株式会社トレンドExpress(100%子会社)
EFFYIS、inc。 (100%子会社)
流行特急(100%中国小会社)
連結従業員数 120名 (2016年6月末現在)
主 要 株 主 内山 幸樹
Salesforce。com、 inc。
シナジーマーケティング株式会社
12
会社概要
株 式 市 場 東 京 証 券 取 引 所 マ ザ ー ズ
- 25. Copyright© Hottolink、 Inc。
▶TOPICS
24
流通・販売しているデータ(例)
No 流通・販売データ 詳細 データエリア
1 グローバルブログデータ 世界中から集めた2000万以上のブログ。 グローバル
2 掲示板 世界中から収集した1500以上のアクティブなコミュニティ報道。 グローバル
3 YouTube 世界のYouTubeのコメントデータ(一日あたり250万以上のコメントデータ)。グローバル
4 ニュースデータ リアルタイムな報道ニュースデータ。 グローバル
5 カスタマレビュー投稿
アマゾンやトリップアドバイザーのようなWebサービス内のカスタマレビュー
投稿(200万以上)
グローバル
6 Sina Weibo 一日あたり400万件以上の投稿。中国外で唯一の公式販売代理店。 中国
7 Tencent Weibo 一日あたり200万件以上の投稿。中国外で唯一の公式販売代理店。 中国
8 Vertical Scope
世界のプレミアムフォーラムのコレクションデータ。唯一の公式販売代理
店。
アメリカ
9 StockTwits 株式を議論するトレーダー・投資家等の通信プラットフォーム。 アメリカ
10 Discuz! 25万件以上の中国国内の掲示板情報。 中国
11 Public API Management
Facebook・Instagram・ VK・Google+を含む、公開APIの管理。(データ
ソースではない)
アメリカ
12 Foursquare
7500万以上のグローバルな場所から発信される位置情報(一日あたり以
上2万件以上)。
グローバル
13 Wechatパブリックアカウントデータ 微博等その他SNSデータとの連動による分析が可能 中国
14 中国ECサイト「タオバオ」商品購入者感想書き込みデータ SNSデータとの連動による消費者商品購入実態分析が可能 中国
15 中国メディア記事データ 上記SNS、ECデータとの連動によるトータル分析が可能 中国
16 中国広告素材データ 上記SNS、EC、メディア記事データとの連動によるトータル分析が可能 中国
17 日本国内ブログ(20ポータル以上) 30億記事4000万ユーザー アメーバブログも95%以上カバー 日本
18 2ちゃんねる 全量データの独占的商用利用権を保有 日本
19 日本国内掲示板 textream、教えてgooなど国内主要掲示板をカバー 日本
20 Twitter Twitter公式データを利用 日本
21 ウェブニュース 約250サイト以上の国内ニュースサイト 日本
22 検索データ 某ツールバーの検索データの検索件数 日本
23 TVメタデータ Mデータ社提供のTVメタデータをツールを経由して提供 日本
24 アプリレビューデータ AppStore、GooglePlayのレビューデータを評価別に提供可能 日本
- 39. Copyright© Hottolink、 Inc。
▶TOPICS AI技術を活用した開発プロセス
1.ビジネスプランの作成
2.技術的可能性の検証
4 .開発の実施
3 .プロジェクト提案書・仕様書の作成
5.テストの実施
プロダクト
マネージャー
営業・コンサル
要望・
企画依頼
プロダクト
マネージャー
リサーチャー
プロダクト
マネージャー
リサーチャー
データ
サイエンティスト(仮)
ソフトウェア
エンジニア
インフラ
エンジニア
テスト
エンジニア
プロダクト
マネージャー
ソフトウェア
エンジニア
インフラ
エンジニア
プロダクト
マネージャー
テスト
エンジニア
要望:Twitterにノイズが多い
提案:ユーザ単位でスパムを判定する
検証:機械学習で、スパムユーザを精度
良くを判定できるか?を検証
仕様策定:検証したアルゴリズムに基づ
いて、仕様書を作成
開発:仕様書にあわせて、使用技術を選
定 → 開発を実施
テスト:仕様した機能が実現できてるか
を検証
営業・コンサル
製品確認
6.リリース
営業・コンサル
ヒア
リング
- 45. Copyright© Hottolink、 Inc。
▶TOPICS
44
おわりに
• A今回は、R&Dの視点から、「いてほしい」AIエンジニアの例を
あげました
• 今後AIブームがどうなるかはわかりませんが、AI技術を用い
た開発が無くなることはないと想定されます
• 開発の様々な局面において、AI技術を「理解する|使う|開
発する」ための知識が求められる(と思われる)ので、必要に
応じて学んではいかがでしょうか?
• なお、弊社では下記の職種を募集しています
AI系インフラエンジニア
になりたい方
(DBエンジニア含む)
リサーチプログラマ
になりたい方
- 46. Copyright© Hottolink、 Inc。
▶TOPICS
45
おまけ:AI系エンジニアになるために
• 中級者向け資料Deep Learning/機械学習/自然言語処理/統計学を使えるように
なるために
• 書籍
– 統計学:
• マンガでわかる統計学 http://shop.ohmsha.co.jp/shopdetail/000000001683/
– 自然言語処理:
• 言語処理のための機械学習入門 http://www.coronasha.co.jp/np/isbn/9784339027518/
• ウェブデータの機械学習 http://www.kspub.co.jp/book/detail/1529182.html
– 機械学習
• Python機械学習プログラミング http://book.impress.co.jp/books/1115101122
– ディープラーニング
• ゼロから作るDeep Learning https://www.oreilly.co.jp/books/9784873117584/
• Web教材
– Coursera
• Machine Learning, Stanford University https://www.coursera.org/learn/machine-learning
– 言語処理100本ノック http://shop.ohmsha.co.jp/shopdetail/000000001683/