Contenu connexe Similaire à 資料經濟:開放資料的下一步 黃彥男博士 (20) 資料經濟:開放資料的下一步 黃彥男博士11. Open Data是什麼?
以往
• 什麼?Open Data?開放資料?
那是什麼?(所以科技會報101年
1月辦理Open Data策略會議,好讓
部會和民眾知道什麼是Open Data)
最近
• 『準總統蔡英文特別提到Open
Data很重要…,可由中央來建
立一個數據開放的諮詢機
制…。 …』(104年11月,新竹)
11
目前
從0開始 到全民運動,各黨派都
予以強力關懷…
12. 有多少政府開放資料?
以往資料量(datasets)
• 0
現在資料量(datasets)
• over 13,000
12
1,691 1,727 1,739 1,768 1,787 1,832 1,995 2,099
2,304
2,746
3,024 3,141
3,377
3,821
5,040
6,390
7,126
8,082
8,550
10,055
11,767
11,896
12,200
0
2,000
4,000
6,000
8,000
10,000
12,000
14,000
資料集開放項數
資料來源:
data.gov.tw
104年12月
15. 15
我國開放政府資料芻議
• 施政透明、政府當責
Transparency & Accountability
• 歐美主要國家及世界經濟論壇、世界銀
行等國際組織,近年來大力倡議及推動
「開放政府」作為政府治理及服務創新
之重要策略
• 槓桿運用民間資源與創意
Participation & Collaboration
• 配合雲端運算及行動服務時代來臨,在
政府資源有限下,善用民間無限創意,
整合運用政府開放資料,發展各項跨機
關便民服務,已蔚為國際趨勢
創新經濟、社會價值
New Economy & Social Value
– 數據混搭、引領多元創新; 產業創新、型塑轉型契機
– 開放政府資料由業界自主發揮應用,可助益資訊服務產業發展
17. 17
年度 臺灣 日本 南韓 泰國 新加坡 印尼
菲
律賓
大陸 英國 美國
2013 36 32 32 - 47 38 - 38 1 2
2014 11 19 28 59 66 45 71 58 1 8
2015 1 31 23 42 23 41 78 93 2 8
臺灣開放資料 躍升全球第一
• 特別感謝民間企業應用加值、Open
Data聯盟、社群及各部會的努力
17
資料來源:OKFN 2015 Global Open Data Index Ranking
19. 幕僚機關
國家發展委員會
內政部 財政部 教育部 衛福部 經濟部 交通部
其他
部會
依各部會業務範圍推動資料分級諮詢
所屬機關依據分級結果提供開放資料
召開會議以擬定政策
及檢視整體推動成效
行政院諮詢小組
會議成員(委員11-21人)
召集人:部會資訊長
機關代表:法制單位、資訊單位、
主計單位、各業務單位
民間代表:業務領域代表、公(協)
會代表、社會團體代表、專家學
者(民間不得少於總人數1/3)
會議成員(委員8-11人)
召集人:行政院資訊長
機關代表:法務部、經濟部、財
政部、國發會
民間代表:公(協)會、社會團
體代表、學者專家
……
建立資料開放諮詢二級制
建立政府資料開放諮詢機制
19
開放重點資料 選務
法制 環境資源預算
統計
21. • 總統104年元旦祝詞
• 行政院第3322、3429次院會決議
• ide@ Taiwan 2020(創意臺灣)政策白皮書
• 政府資料開放進階行動方案
•行政院及所屬各級機關政府資料開放作業原則
•政府資料開放資料集管理要項
•政府資料開放授權條款
•政府資料開放諮詢小組設置要點
•各機關資通訊應用管理要點
•政府機關資訊採購建議書徵求文件參考
•資料集詮釋資料標準規範
•政府資料開放跨平臺介接規範
•共通性資料存取應用程式介面規範
•政府資料分類及授權利用收費原則
•資料品質評鑑機制(研議中)
政策
行動方案
作業原則
部會行動策略
•部會及所屬機關(構)
資料開放行動策略
目標、推動現況、策
略、推動作法、預計時
程、高價值資料集及跨
域合作亮點等
訂定資料開放指導規範
完備信賴資料開放環境(1/2)
21
24. 24
產業輔導推動成果
• 發起並維運Open Data聯盟,並規劃轉型為協會永續運作
• 蒐集民間資料需求達352個,促成160項資料集開放
擴大社群與民間
組織參與,加速政
府開放資料
• 補助38家企業運用Open Data建構創新服務模式,帶動
1,305,369人次使用資料服務,及業者投資與營收達4.77
億元
推動產業應用
政府開放資料,帶
動經濟發展
• 推動政府機關與企業設組,促成718件Open Data創新應
用提案,獎勵112項創新服務(包含學生、個人及新創企
業),新創企業10家
透過各式競賽、推
廣,鼓勵民間
運用資料展創意
• 與12國交流,並辦理臺泰跨國Hackathon與亞太高峰論
壇,以共通性議題與亞洲國家深度互動
• 籌備「亞洲開放資料合作組織」,臺灣為第一年主席及常
設秘書處,並研議將此組織納入APEC架構下
促成國際交流合作,
成立亞洲開放資料
合作組織
31. 大數據產業輔導團
31
整體推動策略 : 以價值共創出發,建立
服務能量打造典範案例,並推廣擴散,
由服務需求驅動來催生數據化產業
–合作發展與價值共創
資料來源: 經濟部工業局
工業局結合法人、公協會籌組大數據產業服務團,
優先導入製造業、交通運輸、電子商務運用
法人、公協會
巨量資料智慧應用促進會
開放資料聯盟
32. 大數據技術指導小組
32
工
作
項
目
• 問題界定
• 施政措施說明
• 工作時程
• 選定輔導團長
• 協同資料檢視
• 確定產學研領域顧問
與技術專家
• 細部時程訂定
• 可行性評估
• 資料樣貌
• 方法討論
• 洞察分析
• 去識別化
• 洞察效益摘要
• 施政建議評估
• 成果報告
• 經驗分享
• 意見交流
低所得背景
財政部
毒藥品防制
衛福部
新住民潛力願景
內政部
企業調薪
財政部
退休人力再利用
勞動部
行政院大數據技術指導小組
經濟部 國發會 科技部
行政協調
法規調適
倫理把關
領域顧問推薦
技術專家支援
分析技術協調
技術專家支援
領域顧問推薦
問題定義 團隊組成
工作小組
會議
問題協調
及結案報告
成果報告
–提高部會大數據能力,增加政策設計精準度
資料來源:科技會報辦公室整理
大專畢業生薪資
教育部
潛
力
應
用
規
劃
探
索
責
成
議
題
落
實
39. 資料經濟產業蘊含龐大經濟效益
經濟效益
Mckinsey:開放資料將可帶動教育、交通、消費性產品、電力、石油天然氣、健康照護
與個人理財等七大應用發展,創造$3.2-4.5兆美元的經濟價值
Wikibon:2013年全球巨量資料技術與服務市場規模為$184億美元,2018年將成長為$485
億美元,其中與應用服務相關的市值約為209億美金,比重達44%,遠高於軟體(21%)與
硬體(35%)的營收比重
3.16 5.04 8.05
12.4
16.67 19.14 20.9
1.35
2.24
3.82
6.33
9.1
10.85
12.15
2.78
4.27
6.53
9.65
12.6
14.26
15.41
0
10
20
30
40
50
2011 2012 2013 2014 2015 2016 2017
年收入(十億美金)
Service Software Hardware
資料來源:McKinsey( 2013);工研院IEK整理(2014/11)資料來源:Wikibon( 2014);工研院IEK整理(2014/11)
184億美元
485億美元
巨量資料觀點 開放資料觀點
應用商機
比重高
39
44. 44
台灣資料經濟產業市場價值衡量方法
(經濟面1/2)
人力銀行
LinkedIn
資料經濟
產業人才庫
• 資料蒐集&平台建置
• 資料處理&儲存
• 資料混搭&分析
• 資料視覺化應用
• 資料加值應用
• 資料顧問諮詢服務
• 資料科學家
• 數據分析工程師
• 機器學習科學家
• 資料分析研發工程師
• 巨量數據分析工程師
• 大數據營運分析專員
• Big data數據高級分析師
• …
篩選分類
資料經濟
服務產業
In-house
人力需求
現有業務
衍生服務
新創資料
應用服務
非SI業者(如製造業)
• 工業電腦:研華
• 代工大廠:鴻海…
• 能源管理:台達電…
• 工具機:上銀
• ….
資訊系統整合業者
• 精誠資訊
• 神通資科
• 資拓宏宇…
資料應用工具軍火商
• 知意圖(Etu)
• 意藍科技
• 御言堂…
資料加值應用服務業者
• 加值業者:天氣風險管理…
• APP:程思科技、房點子…
解決既有經營問題
• 製造業:產能良率提升
• 金融業:客戶流失預防
• …
研究重點:資料經濟產業人才分類與就業機會分析
衡量重點:
就業人才需求、公司營收、市場規模
提升產品
附加價值
資料來源: 經濟部工業局/工研院IEK
47. 47
The Basic Problem for Data Science
How to do de-identification to
•Enable “desirable uses” of the data while protecting
the “privacy” of the data subjects?
• Political policy
• Academic research
• Study drug trial
• Security: searching for terrorists/crimials
• Market analysis, ….
47
48. 48
Name Sex Blood
Jane F B
Perry M A
Smith M O
Ross M O
Huang F A
Chen M B
Approach 1: Encrypt the Data
Problems: Data cannot be
analyzed.
Name Sex Blood
100101 001001 110101
101010 111010 111111
001010 100100 011001
001110 010010 110101
110101 000000 111001
111110 110010 000101
49. 49
Approach 2: Anonymize the Data
“re-identification”, linking data
[Sweeney `97]
Problems:
Name Sex Blood HIV?
Chen F B Y
Jones M A N
Smith M O N
Ross M O Y
Lu F A N
Shah M B Y
50. 50
Approach 3: Mediate Access
C
C
trusted
“curator”
data analysts
Problems: “aggregated” statistics can
reveal individual information; query selections
Name Sex Blood
Jane F B
Perry M A
Smith M O
Ross M O
Huang F A
Chen M B
52. 52
Synthetic data
Utility: preserves statistics with every set of attributes!
“fake” people
Problem: computation time
C
Sex Blood Cancer?
F B Y
F A N
M O N
M O Y
F A N
M B Y
Sex Blood Cancer?
M B N
F B Y
M O Y
M A N
F O N