SlideShare une entreprise Scribd logo
1  sur  35
Télécharger pour lire hors ligne
© 版权所有 2010 EMC Corporation。保留所有权利。   1
大数据,大机遇
                                      陶波博士
                                      EMC中国研发中心首席技术官


© 版权所有 2010 EMC Corporation。保留所有权利。                    2
要实现阶段性变革、革命性变
                                      革,需要时机、技术、人才…的
                                      独特融合,以及对我们行业进行
                                      重大变革的运气。这种事情不会
                                      常常发生。

                                      Steve Jobs,1995 年


© 版权所有 2011 EMC Corporation。保留所有权利。                       3
大数据是一场革命性变革
                个人计算机                 互联网   大数据




© 版权所有 2011 EMC Corporation。保留所有权利。               4
!!!                               !!!
 “大数据无关乎大小,
  而关乎自由度”
                                                                                     !!!
                    — Techcrunch                      这是                       !!!


                                      大数据
                                            “发现:‘大数据’比卷
                                        !!! 更卓绝”
                                                                        “大数据! 它真实
                                                                         存在,实时提供,
                                                 时代...
                                                            — Gartner
                                                                         并且正在改变您的
                              “总数据: 比大数                                  世界”
                               据更‘大’”                                          — IDB
                                                      !!!
               !!!                      — 451 Group                     !!!
© 版权所有 2011 EMC Corporation。保留所有权利。                                                        5
EMC 大数据“堆栈”
4         协作                                      执行
                                           EMC Documentum xCP
                                                                        ?

3         实时                                      分析
                                      EMC Greenplum + Hadoop + Chorus


2       结构化与
        非结构化



1       PB 规模                                    存储
                                            EMC Isilon + Atmos


© 版权所有 2011 EMC Corporation。保留所有权利。                                         6
大数据正在改变企业存储




                                      EB
                      大数
                      据源




                                           基于文件:年复合增长率 60.7%   基于数据块:年复合增长率 21.8%
                                           至 2012 年,销售的总存储容量的 80% 将用于基于文件的数据
                                           来源:IDC




© 版权所有 2011 EMC Corporation。保留所有权利。                                                 7
大数据要求:
                                      容量和性能具有极大的可扩
                                      展性。


© 版权所有 2011 EMC Corporation。保留所有权利。                  8
纵向扩展的体系结构不适合大数据
 服务器




                                      可扩展性
                                      性能
 网络




                                      管理
                                      可用性
                                      成本
 存储




© 版权所有 2011 EMC Corporation。保留所有权利。          9
体系结构转变 — 为大数据横向扩展
 服务器




                                      可扩展性
                                      性能
 网络




                                      管理
                                      可用性
                                      成本
 存储




© 版权所有 2011 EMC Corporation。保留所有权利。          10
Isilon:横向扩展 NAS 创新
巨大的可扩展性
单个文件系统中超过 15 PB
无可比拟的性能
高达 85 GB/s 的吞吐量和高于 1.2M 的 IOPS
应用程序与工作流整合
业界领先的可靠性和自我修复能力                            应用程序




                                      性能
管理简便

                                           可扩展性




© 版权所有 2011 EMC Corporation。保留所有权利。               11
核心创新...为客户提供价值
Isilon 的 OneFS 横向扩展操作系统




                                 单一文件系统,单卷...高达 15 PB 以上
                                 原始存储利用率超过 80%
                                 最高的性能,完全对称的群集
                                 易于管理和扩展
                                 多层单一文件系统/单群集
                                 跨所有产品的单个统一平台



© 版权所有 2011 EMC Corporation。保留所有权利。                        12
File Striping: Writing a File




© 版权所有 2011 EMC Corporation。保留所有权利。   13
Isilon 解决方案适用于...



     企业 IT 扩展工作                       企业共享基础架构                               高性能计算
                                                       行业解决方案
     流

     • 大规模主目录                         • 私有云           • 媒体和娱乐                • 定量财务
     • 大规模文件归档                        • 第 3 层服务器虚拟化   • 生命科学                 • 地震处理
     • 灾难恢复与业务连续性                     • 存储整合          • Internet 与 Web 2.0   • 研究与分析
                                                      • EDA 与软件开发            • 生命信息学




© 版权所有 2011 EMC Corporation。保留所有权利。                                                    14
技术的聚合使大树据分析成为现实

                                                    聚合
                                  Web              (亦即“云”)


                                                             网络
                  创新




                                        X86
                                                     虚拟化

                                                      存储


                                              时间


© 版权所有 2011 EMC Corporation。保留所有权利。                               15
我们还需要什么?


© 版权所有 2011 EMC Corporation。保留所有权利。   16
我们需要...

                                       数据科学家
                                         创新
                                         社区
                      和               完整的大数据分析堆栈



© 版权所有 2011 EMC Corporation。保留所有权利。                17
© 版权所有 2011 EMC Corporation。保留所有权利。   18
EMC HADOOP
                                      非结构化。
                                      实时。
                                      企业就绪。

© 版权所有 2011 EMC Corporation。保留所有权利。                19
Greenplum HD 产品系列
• Greenplum HD 社区版:
      – 经认证的满堆栈,100% 开源
      – 虚拟机装置
      – 所有核心功能开发反过来又有助于 Apache Hadoop
• Greenplum HD 企业版:
      – 与众不同、混合分布、具有高级功能
      – 集成、经测试、加固型
      – 与 Hadoop、HBase、HDFS API 百分百兼容
• Greenplum HD Data Computing Appliance:
      – 优化装置配置
      – 消除复杂性,简化部署和管理
      – 与 Greenplum Database 无缝集成


© 版权所有 2011 EMC Corporation。保留所有权利。        20
Greenplum HD 技术创新

                 可插拔 I/O                 实时处理              容错

             • Isilon OneFS           • 低延迟读/写操作        • 消除名称节点的单点
                                      • 实时数据交互和分析         故障
             • Atmos
                                        处理              • 作业跟踪器及其他关
             • Cassandra                                  键组件
                                      • 与 Cassandra 和
             • MapR                     MapR 集成
             • 提高效率和性能




© 版权所有 2011 EMC Corporation。保留所有权利。                                   21
GREENPLUM HD
                                      DATA
                                      COMPUTING
                                      APPLIANCE 与
                                      Greenplum Database
                                      Apache Hadoop 强强联合



© 版权所有 2011 EMC Corporation。保留所有权利。                        22
Greenplum Chorus: 首创企业数据云平台
• 主要功能
   – 自我服务式生成数据库
   – 数据服务
   – 合作分析
• Chorus 部署在VMware云计算平台和
  Greenplum数据库上
• Chorus极大地加速从数据中提取信息的过
  程




© 版权所有 2011 EMC Corporation。保留所有权利。   23
© 版权所有 2011 EMC Corporation。保留所有权利。   24
自我服务可以快速开始一个新的项目
                       自我服务可以快速开始一个新的项目
                       o 生成数据库服务器 , 单节点或多节点
                       o 生成数据库服务器 , 单节点或多节点
                       o 生成沙盒用于分析.
                       o 生成沙盒用于分析.
                       o 方便地导入数据.
                       o 方便地导入数据.




© 版权所有 2011 EMC Corporation。保留所有权利。           25
创建合作环境对大数据做深度分析
                 创建合作环境对大数据做深度分析
                 o 创立项目工作空间 共享文档,数据和工作流程.
                 o 创立项目工作空间 共享文档,数据和工作流程.
                 o 在沙盒中实施工作流程和管理相关变更.
                 o 在沙盒中实施工作流程和管理相关变更.
                 o 控制数据的权限.
                 o 控制数据的权限.
                 o 从in-database analytics functions中导入函数
                 o 从in-database analytics functions中导入函数




© 版权所有 2011 EMC Corporation。保留所有权利。                        26
EDC 成功实例: T-Mobile

                                                                             Enterprise Data Cloud

                100 TB EDW
                                                                                 1 Petabyte EDC
Customer Challenges                                              EDC: Greenplum Database + Chorus
    – 100TB Teradata EDW focused on operational                   – Extracted data from EDW and others source systems
      reporting and financial consolidation                         to quickly assemble new analytic mart
    – EDW is single source of truth, under heavy                  – Generated a social graph from call detail records and
                                                                    subscriber data
      governance and control
                                                                  – Within 2 weeks uncovered behavior where
    – Unable to support all of the critical initiatives around      “connected” subscribers where 7X more likely to
      data surrounding the business                                 churn than average user
    – Customer loyalty and churn the #1 business initiative       – Deployed1PB production EDC with GP to power their
                                                                    analytic initiatives
      from the CEO on down


 © 版权所有 2011 EMC Corporation。保留所有权利。                                                                                        27
构建完整的大数据分析堆栈

                                          分析工具集
                                       (业务分析、BI、统计等)

                                      Greenplum Chorus
                                       针对数据的企业协作平台

                          Greenplum Data Computing Appliance
                                         专用于大数据分析


           Greenplum Database                            Greenplum HD
                     企业版与社区版                          Hadoop 企业版与社区版
          世界上可扩展性最强的 MPP 数据库平台                      针对非结构化数据的企业分析平台




© 版权所有 2011 EMC Corporation。保留所有权利。                                     28
表彰大数据创新者
                                      www.DataHeroAwards.com




© 版权所有 2011 EMC Corporation。保留所有权利。                            29
“数据英雄奖”得主
Silver Spring Networks — 能源类




© 版权所有 2011 EMC Corporation。保留所有权利。   30
“数据英雄奖”得主
Vivek Kundra,美国首席信息官 — 远见奖




© 版权所有 2011 EMC Corporation。保留所有权利。   31
大数据 = 大机遇


© 版权所有 2011 EMC Corporation。保留所有权利。   32
了解详实EMC Greenplum 数据计算应用
装置 (DCA) 的实际性能和功能:

请访问 www.bigdatafw.com下载ESG 白皮书,

«ESG实验室验证报告
‐EMC Greenplum 数据计算应用装置 »



© 版权所有 2011 EMC Corporation。保留所有权利。   33
谢谢大家


© 版权所有 2011 EMC Corporation。保留所有权利。          34
© 版权所有 2011 EMC Corporation。保留所有权利。   35

Contenu connexe

Tendances

Big Data Taiwan 2014 Opening: Converge . Discover . Monetize
Big Data Taiwan 2014 Opening: Converge . Discover . MonetizeBig Data Taiwan 2014 Opening: Converge . Discover . Monetize
Big Data Taiwan 2014 Opening: Converge . Discover . MonetizeEtu Solution
 
揭开数据虚拟化的神秘面纱
揭开数据虚拟化的神秘面纱揭开数据虚拟化的神秘面纱
揭开数据虚拟化的神秘面纱Denodo
 
Data & AI Driven Digital Transformation
Data & AI Driven Digital TransformationData & AI Driven Digital Transformation
Data & AI Driven Digital TransformationSky shi
 
数据挖掘理论与实践
数据挖掘理论与实践数据挖掘理论与实践
数据挖掘理论与实践medcl
 
Leverage Modern Enterprise Architecture To Speed Up Work Resumption
Leverage Modern Enterprise Architecture To Speed Up Work ResumptionLeverage Modern Enterprise Architecture To Speed Up Work Resumption
Leverage Modern Enterprise Architecture To Speed Up Work ResumptionDenodo
 
现代数据集成解决方案及应用案例介绍(下)
现代数据集成解决方案及应用案例介绍(下)现代数据集成解决方案及应用案例介绍(下)
现代数据集成解决方案及应用案例介绍(下)Denodo
 
Advanced Analytics and Machine Learning with Data Virtualization (Chinese)
Advanced Analytics and Machine Learning with Data Virtualization (Chinese)Advanced Analytics and Machine Learning with Data Virtualization (Chinese)
Advanced Analytics and Machine Learning with Data Virtualization (Chinese)Denodo
 
Centralizing Data Security with Data Virtualization (Chinese)
Centralizing Data Security with Data Virtualization (Chinese)Centralizing Data Security with Data Virtualization (Chinese)
Centralizing Data Security with Data Virtualization (Chinese)Denodo
 
Big Data 102 - Crossovers 成長之旅導覽 (Keynote for Big Data Taiwan 2013)
Big Data 102 - Crossovers 成長之旅導覽 (Keynote for Big Data Taiwan 2013)Big Data 102 - Crossovers 成長之旅導覽 (Keynote for Big Data Taiwan 2013)
Big Data 102 - Crossovers 成長之旅導覽 (Keynote for Big Data Taiwan 2013)Fred Chiang
 
Lean data innovation methodology
Lean data innovation methodologyLean data innovation methodology
Lean data innovation methodologySky shi
 
Trinity BDM - 橋接傳統與未來
Trinity BDM - 橋接傳統與未來Trinity BDM - 橋接傳統與未來
Trinity BDM - 橋接傳統與未來Etu Solution
 
数据服务和现代数据生态系统
数据服务和现代数据生态系统数据服务和现代数据生态系统
数据服务和现代数据生态系统Denodo
 
Keynote: What Is the next Big Data?
Keynote: What Is the next Big Data?Keynote: What Is the next Big Data?
Keynote: What Is the next Big Data?Etu Solution
 
2012 雲端產業介紹
2012 雲端產業介紹2012 雲端產業介紹
2012 雲端產業介紹Sitg Yao
 
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖Etu Solution
 
物聯網與工業4.0情境分析
物聯網與工業4.0情境分析物聯網與工業4.0情境分析
物聯網與工業4.0情境分析Kenny Huang Ph.D.
 
Etu DW Offload 解放資料倉儲的運算效能
Etu DW Offload 解放資料倉儲的運算效能Etu DW Offload 解放資料倉儲的運算效能
Etu DW Offload 解放資料倉儲的運算效能Etu Solution
 
现代数据集成解决方案及应用案例介绍(上)
现代数据集成解决方案及应用案例介绍(上)现代数据集成解决方案及应用案例介绍(上)
现代数据集成解决方案及应用案例介绍(上)Denodo
 

Tendances (20)

Big Data Taiwan 2014 Opening: Converge . Discover . Monetize
Big Data Taiwan 2014 Opening: Converge . Discover . MonetizeBig Data Taiwan 2014 Opening: Converge . Discover . Monetize
Big Data Taiwan 2014 Opening: Converge . Discover . Monetize
 
揭开数据虚拟化的神秘面纱
揭开数据虚拟化的神秘面纱揭开数据虚拟化的神秘面纱
揭开数据虚拟化的神秘面纱
 
Data & AI Driven Digital Transformation
Data & AI Driven Digital TransformationData & AI Driven Digital Transformation
Data & AI Driven Digital Transformation
 
数据挖掘理论与实践
数据挖掘理论与实践数据挖掘理论与实践
数据挖掘理论与实践
 
Leverage Modern Enterprise Architecture To Speed Up Work Resumption
Leverage Modern Enterprise Architecture To Speed Up Work ResumptionLeverage Modern Enterprise Architecture To Speed Up Work Resumption
Leverage Modern Enterprise Architecture To Speed Up Work Resumption
 
现代数据集成解决方案及应用案例介绍(下)
现代数据集成解决方案及应用案例介绍(下)现代数据集成解决方案及应用案例介绍(下)
现代数据集成解决方案及应用案例介绍(下)
 
Advanced Analytics and Machine Learning with Data Virtualization (Chinese)
Advanced Analytics and Machine Learning with Data Virtualization (Chinese)Advanced Analytics and Machine Learning with Data Virtualization (Chinese)
Advanced Analytics and Machine Learning with Data Virtualization (Chinese)
 
Emc keynote 1130 1200
Emc keynote 1130 1200Emc keynote 1130 1200
Emc keynote 1130 1200
 
Centralizing Data Security with Data Virtualization (Chinese)
Centralizing Data Security with Data Virtualization (Chinese)Centralizing Data Security with Data Virtualization (Chinese)
Centralizing Data Security with Data Virtualization (Chinese)
 
Big Data 102 - Crossovers 成長之旅導覽 (Keynote for Big Data Taiwan 2013)
Big Data 102 - Crossovers 成長之旅導覽 (Keynote for Big Data Taiwan 2013)Big Data 102 - Crossovers 成長之旅導覽 (Keynote for Big Data Taiwan 2013)
Big Data 102 - Crossovers 成長之旅導覽 (Keynote for Big Data Taiwan 2013)
 
Lean data innovation methodology
Lean data innovation methodologyLean data innovation methodology
Lean data innovation methodology
 
Trinity BDM - 橋接傳統與未來
Trinity BDM - 橋接傳統與未來Trinity BDM - 橋接傳統與未來
Trinity BDM - 橋接傳統與未來
 
数据服务和现代数据生态系统
数据服务和现代数据生态系统数据服务和现代数据生态系统
数据服务和现代数据生态系统
 
Keynote: What Is the next Big Data?
Keynote: What Is the next Big Data?Keynote: What Is the next Big Data?
Keynote: What Is the next Big Data?
 
2012 雲端產業介紹
2012 雲端產業介紹2012 雲端產業介紹
2012 雲端產業介紹
 
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
 
物聯網與工業4.0情境分析
物聯網與工業4.0情境分析物聯網與工業4.0情境分析
物聯網與工業4.0情境分析
 
Hadoop
HadoopHadoop
Hadoop
 
Etu DW Offload 解放資料倉儲的運算效能
Etu DW Offload 解放資料倉儲的運算效能Etu DW Offload 解放資料倉儲的運算效能
Etu DW Offload 解放資料倉儲的運算效能
 
现代数据集成解决方案及应用案例介绍(上)
现代数据集成解决方案及应用案例介绍(上)现代数据集成解决方案及应用案例介绍(上)
现代数据集成解决方案及应用案例介绍(上)
 

Similaire à Big Data World Forum

云存储与虚拟化分论坛 生活在云端 蔡礼洪
云存储与虚拟化分论坛 生活在云端 蔡礼洪云存储与虚拟化分论坛 生活在云端 蔡礼洪
云存储与虚拟化分论坛 生活在云端 蔡礼洪drewz lin
 
云存储与虚拟化分论坛 生活在云端 蔡礼洪 Emc
云存储与虚拟化分论坛 生活在云端 蔡礼洪 Emc云存储与虚拟化分论坛 生活在云端 蔡礼洪 Emc
云存储与虚拟化分论坛 生活在云端 蔡礼洪 EmcRiquelme624
 
Bdwf11 netezza james_zheng
Bdwf11 netezza james_zhengBdwf11 netezza james_zheng
Bdwf11 netezza james_zhengbigdatawf
 
企業郵件系統的私有雲架構教戰守則
企業郵件系統的私有雲架構教戰守則企業郵件系統的私有雲架構教戰守則
企業郵件系統的私有雲架構教戰守則OFMKT
 
云的基石:Net app存储平台
云的基石:Net app存储平台云的基石:Net app存储平台
云的基石:Net app存储平台ITband
 
Zh tw introduction_to_cloud_computing
Zh tw introduction_to_cloud_computingZh tw introduction_to_cloud_computing
Zh tw introduction_to_cloud_computingTrendProgContest13
 
Big Data 101 一 一個充滿意圖與關聯世界的具體實現
Big Data 101 一 一個充滿意圖與關聯世界的具體實現Big Data 101 一 一個充滿意圖與關聯世界的具體實現
Big Data 101 一 一個充滿意圖與關聯世界的具體實現Fred Chiang
 
昆腾技术白皮书- 重新设计备份和恢复,适应未来虚拟化和整合的需求
昆腾技术白皮书- 重新设计备份和恢复,适应未来虚拟化和整合的需求昆腾技术白皮书- 重新设计备份和恢复,适应未来虚拟化和整合的需求
昆腾技术白皮书- 重新设计备份和恢复,适应未来虚拟化和整合的需求samanthaleee
 
Linux运维趋势 第15期 虚拟化管理软件选型
Linux运维趋势 第15期 虚拟化管理软件选型Linux运维趋势 第15期 虚拟化管理软件选型
Linux运维趋势 第15期 虚拟化管理软件选型51CTO
 
云计算在电信业务中的应用分析 罗圣美
云计算在电信业务中的应用分析 罗圣美云计算在电信业务中的应用分析 罗圣美
云计算在电信业务中的应用分析 罗圣美Riquelme624
 
20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索
20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索
20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索liu sheng
 
适应业务需求的甲骨文存储解决方案及产品演示
适应业务需求的甲骨文存储解决方案及产品演示适应业务需求的甲骨文存储解决方案及产品演示
适应业务需求的甲骨文存储解决方案及产品演示ITband
 
企业应用与互联网的融合
企业应用与互联网的融合企业应用与互联网的融合
企业应用与互联网的融合Jacky Chi
 
Cloud Computing for Bioinformatics
Cloud Computing for BioinformaticsCloud Computing for Bioinformatics
Cloud Computing for BioinformaticsJazz Yao-Tsung Wang
 
利用统一存储获得无与伦比的速度,简化系统,并节省更多
利用统一存储获得无与伦比的速度,简化系统,并节省更多利用统一存储获得无与伦比的速度,简化系统,并节省更多
利用统一存储获得无与伦比的速度,简化系统,并节省更多ITband
 

Similaire à Big Data World Forum (20)

Emc keynote 0930 0945
Emc keynote 0930 0945Emc keynote 0930 0945
Emc keynote 0930 0945
 
云存储与虚拟化分论坛 生活在云端 蔡礼洪
云存储与虚拟化分论坛 生活在云端 蔡礼洪云存储与虚拟化分论坛 生活在云端 蔡礼洪
云存储与虚拟化分论坛 生活在云端 蔡礼洪
 
云存储与虚拟化分论坛 生活在云端 蔡礼洪 Emc
云存储与虚拟化分论坛 生活在云端 蔡礼洪 Emc云存储与虚拟化分论坛 生活在云端 蔡礼洪 Emc
云存储与虚拟化分论坛 生活在云端 蔡礼洪 Emc
 
102 1530-1600
102 1530-1600102 1530-1600
102 1530-1600
 
Bdwf11 netezza james_zheng
Bdwf11 netezza james_zhengBdwf11 netezza james_zheng
Bdwf11 netezza james_zheng
 
Altibase介绍
Altibase介绍Altibase介绍
Altibase介绍
 
Vplex
VplexVplex
Vplex
 
企業郵件系統的私有雲架構教戰守則
企業郵件系統的私有雲架構教戰守則企業郵件系統的私有雲架構教戰守則
企業郵件系統的私有雲架構教戰守則
 
云的基石:Net app存储平台
云的基石:Net app存储平台云的基石:Net app存储平台
云的基石:Net app存储平台
 
Zh tw introduction_to_cloud_computing
Zh tw introduction_to_cloud_computingZh tw introduction_to_cloud_computing
Zh tw introduction_to_cloud_computing
 
Big Data 101 一 一個充滿意圖與關聯世界的具體實現
Big Data 101 一 一個充滿意圖與關聯世界的具體實現Big Data 101 一 一個充滿意圖與關聯世界的具體實現
Big Data 101 一 一個充滿意圖與關聯世界的具體實現
 
Dell
DellDell
Dell
 
昆腾技术白皮书- 重新设计备份和恢复,适应未来虚拟化和整合的需求
昆腾技术白皮书- 重新设计备份和恢复,适应未来虚拟化和整合的需求昆腾技术白皮书- 重新设计备份和恢复,适应未来虚拟化和整合的需求
昆腾技术白皮书- 重新设计备份和恢复,适应未来虚拟化和整合的需求
 
Linux运维趋势 第15期 虚拟化管理软件选型
Linux运维趋势 第15期 虚拟化管理软件选型Linux运维趋势 第15期 虚拟化管理软件选型
Linux运维趋势 第15期 虚拟化管理软件选型
 
云计算在电信业务中的应用分析 罗圣美
云计算在电信业务中的应用分析 罗圣美云计算在电信业务中的应用分析 罗圣美
云计算在电信业务中的应用分析 罗圣美
 
20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索
20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索
20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索
 
适应业务需求的甲骨文存储解决方案及产品演示
适应业务需求的甲骨文存储解决方案及产品演示适应业务需求的甲骨文存储解决方案及产品演示
适应业务需求的甲骨文存储解决方案及产品演示
 
企业应用与互联网的融合
企业应用与互联网的融合企业应用与互联网的融合
企业应用与互联网的融合
 
Cloud Computing for Bioinformatics
Cloud Computing for BioinformaticsCloud Computing for Bioinformatics
Cloud Computing for Bioinformatics
 
利用统一存储获得无与伦比的速度,简化系统,并节省更多
利用统一存储获得无与伦比的速度,简化系统,并节省更多利用统一存储获得无与伦比的速度,简化系统,并节省更多
利用统一存储获得无与伦比的速度,简化系统,并节省更多
 

Big Data World Forum

  • 1. © 版权所有 2010 EMC Corporation。保留所有权利。 1
  • 2. 大数据,大机遇 陶波博士 EMC中国研发中心首席技术官 © 版权所有 2010 EMC Corporation。保留所有权利。 2
  • 3. 要实现阶段性变革、革命性变 革,需要时机、技术、人才…的 独特融合,以及对我们行业进行 重大变革的运气。这种事情不会 常常发生。 Steve Jobs,1995 年 © 版权所有 2011 EMC Corporation。保留所有权利。 3
  • 4. 大数据是一场革命性变革 个人计算机 互联网 大数据 © 版权所有 2011 EMC Corporation。保留所有权利。 4
  • 5. !!! !!! “大数据无关乎大小, 而关乎自由度” !!! — Techcrunch 这是 !!! 大数据 “发现:‘大数据’比卷 !!! 更卓绝” “大数据! 它真实 存在,实时提供, 时代... — Gartner 并且正在改变您的 “总数据: 比大数 世界” 据更‘大’” — IDB !!! !!! — 451 Group !!! © 版权所有 2011 EMC Corporation。保留所有权利。 5
  • 6. EMC 大数据“堆栈” 4 协作 执行 EMC Documentum xCP ? 3 实时 分析 EMC Greenplum + Hadoop + Chorus 2 结构化与 非结构化 1 PB 规模 存储 EMC Isilon + Atmos © 版权所有 2011 EMC Corporation。保留所有权利。 6
  • 7. 大数据正在改变企业存储 EB 大数 据源 基于文件:年复合增长率 60.7% 基于数据块:年复合增长率 21.8% 至 2012 年,销售的总存储容量的 80% 将用于基于文件的数据 来源:IDC © 版权所有 2011 EMC Corporation。保留所有权利。 7
  • 8. 大数据要求: 容量和性能具有极大的可扩 展性。 © 版权所有 2011 EMC Corporation。保留所有权利。 8
  • 9. 纵向扩展的体系结构不适合大数据 服务器 可扩展性 性能 网络 管理 可用性 成本 存储 © 版权所有 2011 EMC Corporation。保留所有权利。 9
  • 10. 体系结构转变 — 为大数据横向扩展 服务器 可扩展性 性能 网络 管理 可用性 成本 存储 © 版权所有 2011 EMC Corporation。保留所有权利。 10
  • 11. Isilon:横向扩展 NAS 创新 巨大的可扩展性 单个文件系统中超过 15 PB 无可比拟的性能 高达 85 GB/s 的吞吐量和高于 1.2M 的 IOPS 应用程序与工作流整合 业界领先的可靠性和自我修复能力 应用程序 性能 管理简便 可扩展性 © 版权所有 2011 EMC Corporation。保留所有权利。 11
  • 12. 核心创新...为客户提供价值 Isilon 的 OneFS 横向扩展操作系统 单一文件系统,单卷...高达 15 PB 以上 原始存储利用率超过 80% 最高的性能,完全对称的群集 易于管理和扩展 多层单一文件系统/单群集 跨所有产品的单个统一平台 © 版权所有 2011 EMC Corporation。保留所有权利。 12
  • 13. File Striping: Writing a File © 版权所有 2011 EMC Corporation。保留所有权利。 13
  • 14. Isilon 解决方案适用于... 企业 IT 扩展工作 企业共享基础架构 高性能计算 行业解决方案 流 • 大规模主目录 • 私有云 • 媒体和娱乐 • 定量财务 • 大规模文件归档 • 第 3 层服务器虚拟化 • 生命科学 • 地震处理 • 灾难恢复与业务连续性 • 存储整合 • Internet 与 Web 2.0 • 研究与分析 • EDA 与软件开发 • 生命信息学 © 版权所有 2011 EMC Corporation。保留所有权利。 14
  • 15. 技术的聚合使大树据分析成为现实 聚合 Web (亦即“云”) 网络 创新 X86 虚拟化 存储 时间 © 版权所有 2011 EMC Corporation。保留所有权利。 15
  • 16. 我们还需要什么? © 版权所有 2011 EMC Corporation。保留所有权利。 16
  • 17. 我们需要... 数据科学家 创新 社区 和 完整的大数据分析堆栈 © 版权所有 2011 EMC Corporation。保留所有权利。 17
  • 18. © 版权所有 2011 EMC Corporation。保留所有权利。 18
  • 19. EMC HADOOP 非结构化。 实时。 企业就绪。 © 版权所有 2011 EMC Corporation。保留所有权利。 19
  • 20. Greenplum HD 产品系列 • Greenplum HD 社区版: – 经认证的满堆栈,100% 开源 – 虚拟机装置 – 所有核心功能开发反过来又有助于 Apache Hadoop • Greenplum HD 企业版: – 与众不同、混合分布、具有高级功能 – 集成、经测试、加固型 – 与 Hadoop、HBase、HDFS API 百分百兼容 • Greenplum HD Data Computing Appliance: – 优化装置配置 – 消除复杂性,简化部署和管理 – 与 Greenplum Database 无缝集成 © 版权所有 2011 EMC Corporation。保留所有权利。 20
  • 21. Greenplum HD 技术创新 可插拔 I/O 实时处理 容错 • Isilon OneFS • 低延迟读/写操作 • 消除名称节点的单点 • 实时数据交互和分析 故障 • Atmos 处理 • 作业跟踪器及其他关 • Cassandra 键组件 • 与 Cassandra 和 • MapR MapR 集成 • 提高效率和性能 © 版权所有 2011 EMC Corporation。保留所有权利。 21
  • 22. GREENPLUM HD DATA COMPUTING APPLIANCE 与 Greenplum Database Apache Hadoop 强强联合 © 版权所有 2011 EMC Corporation。保留所有权利。 22
  • 23. Greenplum Chorus: 首创企业数据云平台 • 主要功能 – 自我服务式生成数据库 – 数据服务 – 合作分析 • Chorus 部署在VMware云计算平台和 Greenplum数据库上 • Chorus极大地加速从数据中提取信息的过 程 © 版权所有 2011 EMC Corporation。保留所有权利。 23
  • 24. © 版权所有 2011 EMC Corporation。保留所有权利。 24
  • 25. 自我服务可以快速开始一个新的项目 自我服务可以快速开始一个新的项目 o 生成数据库服务器 , 单节点或多节点 o 生成数据库服务器 , 单节点或多节点 o 生成沙盒用于分析. o 生成沙盒用于分析. o 方便地导入数据. o 方便地导入数据. © 版权所有 2011 EMC Corporation。保留所有权利。 25
  • 26. 创建合作环境对大数据做深度分析 创建合作环境对大数据做深度分析 o 创立项目工作空间 共享文档,数据和工作流程. o 创立项目工作空间 共享文档,数据和工作流程. o 在沙盒中实施工作流程和管理相关变更. o 在沙盒中实施工作流程和管理相关变更. o 控制数据的权限. o 控制数据的权限. o 从in-database analytics functions中导入函数 o 从in-database analytics functions中导入函数 © 版权所有 2011 EMC Corporation。保留所有权利。 26
  • 27. EDC 成功实例: T-Mobile Enterprise Data Cloud 100 TB EDW 1 Petabyte EDC Customer Challenges EDC: Greenplum Database + Chorus – 100TB Teradata EDW focused on operational – Extracted data from EDW and others source systems reporting and financial consolidation to quickly assemble new analytic mart – EDW is single source of truth, under heavy – Generated a social graph from call detail records and subscriber data governance and control – Within 2 weeks uncovered behavior where – Unable to support all of the critical initiatives around “connected” subscribers where 7X more likely to data surrounding the business churn than average user – Customer loyalty and churn the #1 business initiative – Deployed1PB production EDC with GP to power their analytic initiatives from the CEO on down © 版权所有 2011 EMC Corporation。保留所有权利。 27
  • 28. 构建完整的大数据分析堆栈 分析工具集 (业务分析、BI、统计等) Greenplum Chorus 针对数据的企业协作平台 Greenplum Data Computing Appliance 专用于大数据分析 Greenplum Database Greenplum HD 企业版与社区版 Hadoop 企业版与社区版 世界上可扩展性最强的 MPP 数据库平台 针对非结构化数据的企业分析平台 © 版权所有 2011 EMC Corporation。保留所有权利。 28
  • 29. 表彰大数据创新者 www.DataHeroAwards.com © 版权所有 2011 EMC Corporation。保留所有权利。 29
  • 30. “数据英雄奖”得主 Silver Spring Networks — 能源类 © 版权所有 2011 EMC Corporation。保留所有权利。 30
  • 31. “数据英雄奖”得主 Vivek Kundra,美国首席信息官 — 远见奖 © 版权所有 2011 EMC Corporation。保留所有权利。 31
  • 32. 大数据 = 大机遇 © 版权所有 2011 EMC Corporation。保留所有权利。 32
  • 33. 了解详实EMC Greenplum 数据计算应用 装置 (DCA) 的实际性能和功能: 请访问 www.bigdatafw.com下载ESG 白皮书, «ESG实验室验证报告 ‐EMC Greenplum 数据计算应用装置 » © 版权所有 2011 EMC Corporation。保留所有权利。 33
  • 34. 谢谢大家 © 版权所有 2011 EMC Corporation。保留所有权利。 34
  • 35. © 版权所有 2011 EMC Corporation。保留所有权利。 35