SlideShare une entreprise Scribd logo
1  sur  27
Télécharger pour lire hors ligne
從專家到社群
即時資訊採集分析系統
洪進吉/陳其貝/2015-09-03
研究目的
大數據的時代, 透過使用者行為能夠獲取相當數
量的資料, 但要轉化成有意義的資訊須要一些過
程, 利用專家系統的聚焦然後配合社群行為的大
量資料, 就可以提高解讀資訊的價值.
研究方法的挑戰
現代科技如何應用在研究調查統計
大數據資料探勘須要很多先驗資訊才會有效
目前研究方法的不足
時間性: 最新的資料是最有效的
廣泛性: 研究者就自己的想法猜測
客觀性: 侵入式的資料有很強的主觀
數量性: 很少抓取全體資訊
資料探勘與學術研究的比較
即時 vs 區間
全體 vs 抽樣
個體 vs 分類
自動化 vs 操作
客觀分析 vs 主觀模型
次級資料 vs 直接資料
次級資料
1. 我們有時只能從已抓的資料下手, 而不是最實際的資料
2. 這種指數的計算是簡化其複雜度, 一定會失去一些意義
3. 我們可以視其須要及適用度, 去調整演算法或資料搜集
4. 對於資料的可能性與適用性, 我們還須要一段路來學習
網路民意與抽樣調查最不一樣的地方
1. 網路民意是搜集使用者主動的行為, 而抽樣調查是被動被問問題.
2. 網路民意是可以做到所有的母體/群眾, 而抽樣調查是子集合/子體.
3. 網路民意是每天或隨時都在變化有數字, 而抽樣調查一定是個區間或有時間間
隔.
4. 網路民意是特定一個族群, 而抽樣調查的族群較為廣泛.
5. 網路民意不見得知道其背景資料, 而抽樣調查通常會詢問其背景資料
專家系統 vs 使用者資料
1. 透過所有媒體作家定義資訊標籤
2. 臉書的所有使用者對文章做互動
3. 計算對應出使用者與標籤的數量
4. 與其他資訊的差異與時間性比較
tag.analysis.tw (新文易數)
記者的採訪與下 Tag
所有記者的聚焦
使用者社群的熱度
轉計算到 Tag 的熱門話題
=> 知道 PGC (OGC) 與 UGC 的差異
新文易數的系統流程 (I)
1. 抓取媒體的文章列表
2. 每篇文章的 Tags
3. 計算 Tags 總數
4. 計算分數 (Normalization)
5. 從趨勢計算爆發力
6. 計算 Tag 關聯與距離等基本數值
新文易數的系統流程 (II)
7. 計算等價標籤
8. 把 Tag 組成事件
9. 計算出主要標籤
10. 做成事件簿與新聞牆
新文易數的系統流程 (III)
11. 計算有意義的標籤
12. 套用在沒有 Tag 的新聞網站
13. 計算連結文章的社群數值
14. 回算出每個 Tag 的社群數值
新文易數的研究方法
1. 量化: 半衰期控制時間量級
2. 質化: 如何定義等價標籤
3. 正負: 從讚享評的分配定義出正負評
4. 呈現: 透過對數來轉換比較
定義議題的比較
服貿媒體分眾媒體的光譜分析
計算一個人的傾向
延伸研究 -- 得票率 0.901 的正相關
2016 總統候選人聲量
系統資訊
新文易數: http://tag.analysis.tw/

Contenu connexe

Similaire à 從專家到社群 即時資訊採集分析系統

Bigdata bizoppor
Bigdata bizopporBigdata bizoppor
Bigdata bizoppor
Accenture
 
20140206 victor gau - r簡介 @ ksdg
20140206   victor gau - r簡介 @ ksdg20140206   victor gau - r簡介 @ ksdg
20140206 victor gau - r簡介 @ ksdg
Victor Gau
 
20170509 網路星期二:從公益資料分析到聰明公益平台的抽絲剝繭之路
20170509 網路星期二:從公益資料分析到聰明公益平台的抽絲剝繭之路20170509 網路星期二:從公益資料分析到聰明公益平台的抽絲剝繭之路
20170509 網路星期二:從公益資料分析到聰明公益平台的抽絲剝繭之路
Net Tuesday Taiwan
 
Information needs assessment
Information needs assessmentInformation needs assessment
Information needs assessment
mookmur
 
推荐系统的简单实现
推荐系统的简单实现推荐系统的简单实现
推荐系统的简单实现
哲 于
 
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
Jazz Yao-Tsung Wang
 
数据科学家
数据科学家数据科学家
数据科学家
Felix Liu
 
联机目录:读者和图书馆员想要什么
联机目录:读者和图书馆员想要什么联机目录:读者和图书馆员想要什么
联机目录:读者和图书馆员想要什么
sugeladi
 

Similaire à 從專家到社群 即時資訊採集分析系統 (20)

Dmresearch
DmresearchDmresearch
Dmresearch
 
社交媒體研究與鉅量資料分析
社交媒體研究與鉅量資料分析社交媒體研究與鉅量資料分析
社交媒體研究與鉅量資料分析
 
新媒體政策行銷 (新北市政府)
新媒體政策行銷 (新北市政府)新媒體政策行銷 (新北市政府)
新媒體政策行銷 (新北市政府)
 
Ir作業991015
Ir作業991015Ir作業991015
Ir作業991015
 
Ir作業991015
Ir作業991015Ir作業991015
Ir作業991015
 
Bigdata bizoppor
Bigdata bizopporBigdata bizoppor
Bigdata bizoppor
 
魏凯:大数据商业利用的政策管制问题
魏凯:大数据商业利用的政策管制问题魏凯:大数据商业利用的政策管制问题
魏凯:大数据商业利用的政策管制问题
 
20140206 victor gau - r簡介 @ ksdg
20140206   victor gau - r簡介 @ ksdg20140206   victor gau - r簡介 @ ksdg
20140206 victor gau - r簡介 @ ksdg
 
20170509 網路星期二:從公益資料分析到聰明公益平台的抽絲剝繭之路
20170509 網路星期二:從公益資料分析到聰明公益平台的抽絲剝繭之路20170509 網路星期二:從公益資料分析到聰明公益平台的抽絲剝繭之路
20170509 網路星期二:從公益資料分析到聰明公益平台的抽絲剝繭之路
 
Information needs assessment
Information needs assessmentInformation needs assessment
Information needs assessment
 
推荐系统的简单实现
推荐系统的简单实现推荐系统的简单实现
推荐系统的简单实现
 
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
 
AI數位轉型—智能數據驅動新經濟:標準化、自動化、無人化、智慧化、無憂化,20220805
AI數位轉型—智能數據驅動新經濟:標準化、自動化、無人化、智慧化、無憂化,20220805AI數位轉型—智能數據驅動新經濟:標準化、自動化、無人化、智慧化、無憂化,20220805
AI數位轉型—智能數據驅動新經濟:標準化、自動化、無人化、智慧化、無憂化,20220805
 
MixTaiwan 20170104-趨勢-陳昇瑋-從資料科學到人工智慧
MixTaiwan 20170104-趨勢-陳昇瑋-從資料科學到人工智慧MixTaiwan 20170104-趨勢-陳昇瑋-從資料科學到人工智慧
MixTaiwan 20170104-趨勢-陳昇瑋-從資料科學到人工智慧
 
数据科学家
数据科学家数据科学家
数据科学家
 
資料科學計劃的成果與展望
資料科學計劃的成果與展望資料科學計劃的成果與展望
資料科學計劃的成果與展望
 
Silf2012lw3
Silf2012lw3Silf2012lw3
Silf2012lw3
 
Dltrendsatzjpolytech
DltrendsatzjpolytechDltrendsatzjpolytech
Dltrendsatzjpolytech
 
联机目录:读者和图书馆员想要什么
联机目录:读者和图书馆员想要什么联机目录:读者和图书馆员想要什么
联机目录:读者和图书馆员想要什么
 
Self improvement in the big data era
Self improvement in the big data eraSelf improvement in the big data era
Self improvement in the big data era
 

Plus de Gene Hong

從 GA 的 API 來看 SEO 的 KPI
從 GA 的 API 來看 SEO 的 KPI從 GA 的 API 來看 SEO 的 KPI
從 GA 的 API 來看 SEO 的 KPI
Gene Hong
 
從開放公民看 新媒體&新政治
從開放公民看 新媒體&新政治從開放公民看 新媒體&新政治
從開放公民看 新媒體&新政治
Gene Hong
 
Open civic 開放公民
Open civic 開放公民Open civic 開放公民
Open civic 開放公民
Gene Hong
 
Seo in webmaster
Seo in webmasterSeo in webmaster
Seo in webmaster
Gene Hong
 
Seo, 從搜尋引擎開始
Seo, 從搜尋引擎開始Seo, 從搜尋引擎開始
Seo, 從搜尋引擎開始
Gene Hong
 

Plus de Gene Hong (20)

如何用 AI 建議探索, with Google Search Console and ChatGPT
如何用 AI 建議探索, with Google Search Console  and ChatGPT如何用 AI 建議探索, with Google Search Console  and ChatGPT
如何用 AI 建議探索, with Google Search Console and ChatGPT
 
如何建立資訊戰儀表板
如何建立資訊戰儀表板如何建立資訊戰儀表板
如何建立資訊戰儀表板
 
社群與新聞 資料分析 實作課程
社群與新聞 資料分析 實作課程社群與新聞 資料分析 實作課程
社群與新聞 資料分析 實作課程
 
從社群數據到內部開發
從社群數據到內部開發從社群數據到內部開發
從社群數據到內部開發
 
網眾 Ver. 0.2
網眾 Ver. 0.2網眾 Ver. 0.2
網眾 Ver. 0.2
 
網路選戰手冊
網路選戰手冊網路選戰手冊
網路選戰手冊
 
從 GA 的 API 來看 SEO 的 KPI ver 2.0
從 GA 的 API 來看 SEO 的 KPI ver 2.0從 GA 的 API 來看 SEO 的 KPI ver 2.0
從 GA 的 API 來看 SEO 的 KPI ver 2.0
 
開放政府與開放公民
開放政府與開放公民開放政府與開放公民
開放政府與開放公民
 
從臉書看選舉
從臉書看選舉從臉書看選舉
從臉書看選舉
 
從社群資訊獲取行為來分析個人意見傾向
從社群資訊獲取行為來分析個人意見傾向從社群資訊獲取行為來分析個人意見傾向
從社群資訊獲取行為來分析個人意見傾向
 
從 GA 的 API 來看 SEO 的 KPI 加強版!
從 GA 的 API 來看 SEO 的 KPI 加強版!從 GA 的 API 來看 SEO 的 KPI 加強版!
從 GA 的 API 來看 SEO 的 KPI 加強版!
 
網域切割注意事項
網域切割注意事項網域切割注意事項
網域切割注意事項
 
從 GA 的 API 來看 SEO 的 KPI
從 GA 的 API 來看 SEO 的 KPI從 GA 的 API 來看 SEO 的 KPI
從 GA 的 API 來看 SEO 的 KPI
 
媒體 與 社群的資料分析
媒體 與 社群的資料分析媒體 與 社群的資料分析
媒體 與 社群的資料分析
 
Seo 最重要的檢查項目
Seo 最重要的檢查項目Seo 最重要的檢查項目
Seo 最重要的檢查項目
 
從開放公民看 新媒體&新政治
從開放公民看 新媒體&新政治從開放公民看 新媒體&新政治
從開放公民看 新媒體&新政治
 
Open civic 開放公民
Open civic 開放公民Open civic 開放公民
Open civic 開放公民
 
Seo in brie
Seo in brieSeo in brie
Seo in brie
 
Seo in webmaster
Seo in webmasterSeo in webmaster
Seo in webmaster
 
Seo, 從搜尋引擎開始
Seo, 從搜尋引擎開始Seo, 從搜尋引擎開始
Seo, 從搜尋引擎開始
 

從專家到社群 即時資訊採集分析系統