SlideShare une entreprise Scribd logo
1  sur  37
Malaki Datuak (仮)
Malaki Datuak (仮)
井上 (リーダー)、岩本、大谷、尾城、
小峰、沼田、吉村
コンセプト
•インターネット上の情報による文章群のカ
テゴライズ
現状
現状
現状
現状
現状
問題意識
問題意識
解決
解決
解決
解決
猫
解決
解決
解決
解決方法
•Twitter、News feeds (RSS) から採ったcorpus
を分析し、検索語句に近い語句・テーマを
算出 (Big Data!)。
解決方法
•Twitter、News feeds (RSS) から採ったcorpus
を分析し、検索語句に近い語句・テーマを
算出 (Big Data!)。
解決方法
•Twitter、News feeds (RSS) から採ったcorpus
を分析し、検索語句に近い語句・テーマを
算出 (Big Data!)。
解決方法
解決方法
解決方法
•その結果を基にcategorize
解決方法
•その結果を基にcategorize
解決方法
•その結果を基にcategorize
解決方法
解決方法
解決方法
解決方法
解決方法
•Google, Bingから検索結果を持ってくる
解決方法
•Google, Bingから検索結果を持ってくる
アクセス数見込み
•日本のインターネット中のイノベータ = 約
150万人
•一月で150万*2.5% = 4万/月
•一年で150万*16% = 24万/月
Appendix
Technology
•LibSVM || Mahout (on Hadoop) || R
•Neo4j
•AWS || VPS
corpus (コーパス)
•構造化済みの例文集
•構造化・多層化された辞書
•自然言語の処理に用いるため、自然言語の
文章を構造化し大規模に集積したもの
SVM (Support vector machine)
•機械学習により、分類器を生成する
(Public Domain) Wikipedia
イノベータ (Innovators)
•イノベーター理論とは1962年に米・スタンフォード大学の社会学者、エベレット・M・
ロジャース教授(Everett M. Rogers)が提唱したイノベーション普及に関する理論で、商
品購入の態度を新商品購入の早い順に五つに分類したものです。
•イノベーター(Innovators:革新者):
•冒険心にあふれ、新しいものを進んで採用する人。市場全体の2.5%。
•アーリーアダプター(Early Adopters:初期採用者):
•流行に敏感で、情報収集を自ら行い、判断する人。他の消費層への影響力が大きく、オ
ピニオンリーダーとも呼ばれる。市場全体の13.5%。
•アーリーマジョリティ(Early Majority:前期追随者):
•比較的慎重派な人。平均より早くに新しいものを取り入れる。ブリッジピープルとも呼
ばれる。市場全体の34.0%。
•レイトマジョリティ(Late Majority:後期追随者):
•比較的懐疑的な人。周囲の大多数が試している場面を見てから同じ選択をする。
フォロワーズとも呼ばれる。市場全体の34.0%。
•ラガード(Laggards:遅滞者):
•最も保守的な人。流行や世の中の動きに関心が薄い。イノベーションが伝統になるまで
採用しない。伝統主義者とも訳される。市場全体の16.0%。
Malaki Datuakについて
lBig Data (英語)
lbig datuak (バスク語 → 有名な謎言語の一つ、スペインとフランスの国境付近
のバスク地方の言語)
lmalaki data (フィリピン語 → TrendMicroの解析センターTrendLabsの本部がフ
ィリピン)

Contenu connexe

Plus de Sachirou Inoue

人工言語を作るゆるやかな道
人工言語を作るゆるやかな道人工言語を作るゆるやかな道
人工言語を作るゆるやかな道Sachirou Inoue
 
How to make a spaghetti
How to make a spaghettiHow to make a spaghetti
How to make a spaghettiSachirou Inoue
 
Why we update our oss dependencies.
Why we update our oss dependencies.Why we update our oss dependencies.
Why we update our oss dependencies.Sachirou Inoue
 
勝手に作ったものたち
勝手に作ったものたち勝手に作ったものたち
勝手に作ったものたちSachirou Inoue
 
ElixirでNode.jsを倒す
ElixirでNode.jsを倒すElixirでNode.jsを倒す
ElixirでNode.jsを倒すSachirou Inoue
 
大勢でピンポンできるのは、だれ?
大勢でピンポンできるのは、だれ?大勢でピンポンできるのは、だれ?
大勢でピンポンできるのは、だれ?Sachirou Inoue
 
最速で最速のRuby擴張を作る
最速で最速のRuby擴張を作る最速で最速のRuby擴張を作る
最速で最速のRuby擴張を作るSachirou Inoue
 
哲學を學ぶ為に一冊目に何を讀むべきか?
哲學を學ぶ為に一冊目に何を讀むべきか?哲學を學ぶ為に一冊目に何を讀むべきか?
哲學を學ぶ為に一冊目に何を讀むべきか?Sachirou Inoue
 
OCamlでJavaScriptが幸せ
OCamlでJavaScriptが幸せOCamlでJavaScriptが幸せ
OCamlでJavaScriptが幸せSachirou Inoue
 

Plus de Sachirou Inoue (20)

人工言語を作るゆるやかな道
人工言語を作るゆるやかな道人工言語を作るゆるやかな道
人工言語を作るゆるやかな道
 
FaaStRuby
FaaStRubyFaaStRuby
FaaStRuby
 
DI is for us?
DI is for us?DI is for us?
DI is for us?
 
How to make a spaghetti
How to make a spaghettiHow to make a spaghetti
How to make a spaghetti
 
Why we update our oss dependencies.
Why we update our oss dependencies.Why we update our oss dependencies.
Why we update our oss dependencies.
 
Test like a team.
Test like a team.Test like a team.
Test like a team.
 
Phoenix at scale
Phoenix at scalePhoenix at scale
Phoenix at scale
 
Vivaldi #cd3437
Vivaldi #cd3437Vivaldi #cd3437
Vivaldi #cd3437
 
外傷的Elixir
外傷的Elixir外傷的Elixir
外傷的Elixir
 
勝手に作ったものたち
勝手に作ったものたち勝手に作ったものたち
勝手に作ったものたち
 
竝行
竝行竝行
竝行
 
ActiveHash
ActiveHashActiveHash
ActiveHash
 
boilerplate react
boilerplate reactboilerplate react
boilerplate react
 
ElixirでNode.jsを倒す
ElixirでNode.jsを倒すElixirでNode.jsを倒す
ElixirでNode.jsを倒す
 
大勢でピンポンできるのは、だれ?
大勢でピンポンできるのは、だれ?大勢でピンポンできるのは、だれ?
大勢でピンポンできるのは、だれ?
 
最速で最速のRuby擴張を作る
最速で最速のRuby擴張を作る最速で最速のRuby擴張を作る
最速で最速のRuby擴張を作る
 
J言語を讃えた
J言語を讃えたJ言語を讃えた
J言語を讃えた
 
哲學を學ぶ為に一冊目に何を讀むべきか?
哲學を學ぶ為に一冊目に何を讀むべきか?哲學を學ぶ為に一冊目に何を讀むべきか?
哲學を學ぶ為に一冊目に何を讀むべきか?
 
OCamlでJavaScriptが幸せ
OCamlでJavaScriptが幸せOCamlでJavaScriptが幸せ
OCamlでJavaScriptが幸せ
 
Crystalで殺せ
Crystalで殺せCrystalで殺せ
Crystalで殺せ
 

Dernier

[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
UPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdfUPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdffurutsuka
 
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directoryosamut
 
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ       2024/04/12の勉強会で発表されたものです。新人研修のまとめ       2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。iPride Co., Ltd.
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000Shota Ito
 
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。iPride Co., Ltd.
 
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxIoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxAtomu Hidaka
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 

Dernier (9)

[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
UPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdfUPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdf
 
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory
 
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ       2024/04/12の勉強会で発表されたものです。新人研修のまとめ       2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000
 
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
 
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxIoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 

Big Data (Open Data) 企画案 1