SlideShare une entreprise Scribd logo
1  sur  17
© 2009 VMware Inc. All rights reserved
企业的大数据平台
董波
大数据产品线经理
VMware
2
这些企业都选择了虚拟化作为大数据基础平台
Vmware虚拟化平台
3
企业需要成熟,高效、可扩展的大数据平台
4
您应该把VMWare的虚拟化作为大数据的首选平台
Management
Network/Security
Storage/Availability
Compute
5
Hadoop 在虚拟化平台上具有优异的性能
0
50
100
150
200
250
300
350
400
450
TeraGen TeraSort TeraValidate
Elapsedtime,seconds(lowerisbetter)
Native
1 VM
2 VMs
4 VMs
Source: http://www.vmware.com/files/pdf/techpaper/VMW-Hadoop-Performance-vSphere5.pdf
6
虚拟化平台满足企业Hadoop 历程中的关键需求
20 3000 node
Integrated
Scale
Standalone
7
虚拟化平台让您关注业务而非技术
8
自动化Hadoop集群部署管理
部署
改变尺寸
弹性扩展
定制
包含最佳实践
管理
配置调整
运行
执行作业
访问 HDFS
仅需1/1000 人力。
不必人人都是Hadoop专家。
9
提高Hadoop 集群可用性
 增加Hadoop集群的可用性
 使用vMotion消除计划内停机时间
 使用 vSphere HA 减少计划外停机时间
 使用 vSphere FT 提供零宕机、零数据丢失
 久经沙场的解决方案
HDFS
(Hadoop Distributed File System)
HBase (Key-Value store)
MapReduce (Job Scheduling/Execution System)
Pig (Data Flow) Hive (SQL)
BI ReportingETL Tools
ManagementServer
Zookeepr
(Coordination)
HCatalog
RDBMS
Namenode
Jobtracker
Hive
MetaDB
Hcatalog MDB
Server
10
主动监控和优化
 通过VCOPs主动监控
 获得全面的可视性
 减少手动操作
 主动管理可操作性
11
集群整合共享资源,降低 CAPEX
 如果没有虚拟化,CAPEX意味着每个集群最
大负载时硬件投资总和
 在虚拟化情形下:
• 集群共享资源池
• CAPEX 意味着通盘最大负载
• 2:1到4:1的整合比
Σ(Max) Max(Σ)
12
Storage
虚拟化让Hadoop更加弹性
Compute
Current
Hadoop:
Combined
Storage/Co
mpute
Storage
T1 T2
VM VM VM
VMVM
VM
VM中的Hadoop
- * VM 的生命周期
取决于Datanode
- * 弹性限制
存储分离
- * 计算、数据分离
- * 消除Datanode造成的
弹性限制
- * 弹性计算
- * 提高利用率
分离计算集群
- *分离虚拟计算
- * 每租户配置计算集群
- * 更强VM级别的
安全和资源隔离
Slave Node
13
在Hadoop中动态横向收缩/扩展
 为不同租户部署单独的计算集群共享HDFS
 根据优先级和可用资源增加或减少Task Tracker数量
Ad hoc
data mining
Dynamic resourcepool
Data layer HDFS
Host Host Host Host Host Host
Production
recommendation engine
Virtualization platform
Compute layer Compute
VM
Compute
VM
Compute
VM
Compute
VM
Compute
VM
Compute
VM
Compute
VM
Compute
VM
Compute
VM
Compute
VM
Compute
VM
Compute
VM
Compute
VM
Compute
VM
Compute
VM
Ad hoc
data mining
Production
recommendation engine
Compute
VM
Job Tracker Job Tracker
14
虚拟化是最佳的多租户整合方案
物理方案 虚拟化方案
Resource Sharing Yes,
Users share a common Hadoop
cluster
Yes,
Users share common physical
servers in different Hadoop
clusters
Data Sharing Yes,
Users share a common Hadoop
cluster
Yes,
Different compute clusters share
a common HDFS cluster
Performance Isolation Weak, by slot number Strong, by CPU, RAM, Disk IO
Failure Isolation No,
Bad job fails entire cluster
Strong,
Failure impact only one cluster
Configuration Isolation No,
Same configuration, same distro,
same version
Yes,
Free to use different distro,
version, configuration
Security Isolation Weak,
Enforced by Hadoop
authentication and authorization
Strong,
Cluster level isolation.
Scalability Single master node capacity will
become a bottle neck
As many Namenode and
Jobtracker as needed
15
VMWare为企业提供了成熟,高效、可扩展的大数据平台
 快速部署、配置和监控
 动态配置Hadoop,满足
业务需要
 一键式HA配置
Agility
 通过计算节点和数据节
点分离,实现全面的弹
性计算
 根据资源情况,进行
Scale In/Out
Elasticity
 整合Hadoop,提高利用
率
 池化资源,提高性能和
优化作业执行
Efficiency
16
欢迎下载试用
 Download and try Serengeti
• projectserengeti.org
 VMware Hadoop site
• vmware.com/hadoop
 Hadoop performance on
vSphere
• vmware.com/files/pdf/VMW-
Hadoop-Performance-vSphere5.pdf
 Hadoop High Availability
solution
• vmware.com/files/pdf/Apache-
Hadoop-VMware-HA-solution.pdf
17
Q&A

Contenu connexe

Tendances

雲端應用發展趨勢
雲端應用發展趨勢雲端應用發展趨勢
雲端應用發展趨勢
佳芸 江
 
深入研究雲端應用程式平台-AppFabric
深入研究雲端應用程式平台-AppFabric深入研究雲端應用程式平台-AppFabric
深入研究雲端應用程式平台-AppFabric
John Chang
 
分会场六利用赛门铁克的Sort工具降低风险,提高应用的持续运行时间 中文版
分会场六利用赛门铁克的Sort工具降低风险,提高应用的持续运行时间 中文版分会场六利用赛门铁克的Sort工具降低风险,提高应用的持续运行时间 中文版
分会场六利用赛门铁克的Sort工具降低风险,提高应用的持续运行时间 中文版
ITband
 
分会场八和Net backup一起进入云备份时代
分会场八和Net backup一起进入云备份时代分会场八和Net backup一起进入云备份时代
分会场八和Net backup一起进入云备份时代
ITband
 
X86平台三种不同的虚拟化之路
X86平台三种不同的虚拟化之路X86平台三种不同的虚拟化之路
X86平台三种不同的虚拟化之路
Jasson wong
 
大规模数据处理
大规模数据处理大规模数据处理
大规模数据处理
Kay Yan
 
Hp Storage
Hp StorageHp Storage
Hp Storage
amulopan
 
IBM System X
IBM System XIBM System X
IBM System X
yangfan
 

Tendances (20)

以业务为中心的云自动化 V mware-v-realize-automation-7
以业务为中心的云自动化 V mware-v-realize-automation-7以业务为中心的云自动化 V mware-v-realize-automation-7
以业务为中心的云自动化 V mware-v-realize-automation-7
 
2021 五月 Veeam 多雲解決方案 (完整版本)
2021 五月 Veeam 多雲解決方案 (完整版本)2021 五月 Veeam 多雲解決方案 (完整版本)
2021 五月 Veeam 多雲解決方案 (完整版本)
 
雲端應用發展趨勢
雲端應用發展趨勢雲端應用發展趨勢
雲端應用發展趨勢
 
SWsoft_Prim@Telecom
SWsoft_Prim@TelecomSWsoft_Prim@Telecom
SWsoft_Prim@Telecom
 
全新 Veeam Availability Suite v9包括 Veeam Backup & Replication 和 Veeam ONE 備份解決方...
全新 Veeam Availability Suite v9包括 Veeam Backup & Replication 和 Veeam ONE 備份解決方...全新 Veeam Availability Suite v9包括 Veeam Backup & Replication 和 Veeam ONE 備份解決方...
全新 Veeam Availability Suite v9包括 Veeam Backup & Replication 和 Veeam ONE 備份解決方...
 
Acronis iomega文件备份和虚拟机数据保护方案
Acronis iomega文件备份和虚拟机数据保护方案Acronis iomega文件备份和虚拟机数据保护方案
Acronis iomega文件备份和虚拟机数据保护方案
 
深入研究雲端應用程式平台-AppFabric
深入研究雲端應用程式平台-AppFabric深入研究雲端應用程式平台-AppFabric
深入研究雲端應用程式平台-AppFabric
 
Parallels Management Suite for Microsoft System Center Configuration Manager
Parallels Management Suite for Microsoft System Center Configuration ManagerParallels Management Suite for Microsoft System Center Configuration Manager
Parallels Management Suite for Microsoft System Center Configuration Manager
 
分会场六利用赛门铁克的Sort工具降低风险,提高应用的持续运行时间 中文版
分会场六利用赛门铁克的Sort工具降低风险,提高应用的持续运行时间 中文版分会场六利用赛门铁克的Sort工具降低风险,提高应用的持续运行时间 中文版
分会场六利用赛门铁克的Sort工具降低风险,提高应用的持续运行时间 中文版
 
賽門鐵克端點安全教戰守則 - Symantec Endpoint Protection 及 Symantec Critical System Protec...
賽門鐵克端點安全教戰守則 - Symantec Endpoint Protection 及 Symantec Critical System Protec...賽門鐵克端點安全教戰守則 - Symantec Endpoint Protection 及 Symantec Critical System Protec...
賽門鐵克端點安全教戰守則 - Symantec Endpoint Protection 及 Symantec Critical System Protec...
 
Veeam 整合地端與 AWS 雲端的資料保護 (2021 版本)
Veeam 整合地端與 AWS 雲端的資料保護 (2021 版本)Veeam 整合地端與 AWS 雲端的資料保護 (2021 版本)
Veeam 整合地端與 AWS 雲端的資料保護 (2021 版本)
 
分会场八和Net backup一起进入云备份时代
分会场八和Net backup一起进入云备份时代分会场八和Net backup一起进入云备份时代
分会场八和Net backup一起进入云备份时代
 
X86平台三种不同的虚拟化之路
X86平台三种不同的虚拟化之路X86平台三种不同的虚拟化之路
X86平台三种不同的虚拟化之路
 
8 good things to know about Microsoft Azure
8 good things to know about Microsoft Azure8 good things to know about Microsoft Azure
8 good things to know about Microsoft Azure
 
大规模数据处理
大规模数据处理大规模数据处理
大规模数据处理
 
VMware zimbra email and collaboration for the post pc era
VMware zimbra email and collaboration for the post pc eraVMware zimbra email and collaboration for the post pc era
VMware zimbra email and collaboration for the post pc era
 
Hp Storage
Hp StorageHp Storage
Hp Storage
 
建國科大雲端中心成立記者會~與采威國際產學合作~Cafe 企業雲端伺服器演講講義
建國科大雲端中心成立記者會~與采威國際產學合作~Cafe 企業雲端伺服器演講講義建國科大雲端中心成立記者會~與采威國際產學合作~Cafe 企業雲端伺服器演講講義
建國科大雲端中心成立記者會~與采威國際產學合作~Cafe 企業雲端伺服器演講講義
 
IBM System X
IBM System XIBM System X
IBM System X
 
如何构建企业私有云
如何构建企业私有云如何构建企业私有云
如何构建企业私有云
 

Similaire à 2. hadoop

方建国 -V mware-ha实战1
方建国 -V mware-ha实战1方建国 -V mware-ha实战1
方建国 -V mware-ha实战1
landece
 
Leverage virtualization in software test
Leverage virtualization in software testLeverage virtualization in software test
Leverage virtualization in software test
drewz lin
 
华为 余洲 定制化服务器
华为 余洲 定制化服务器华为 余洲 定制化服务器
华为 余洲 定制化服务器
colderboy17
 
Bloombase 为 KVM 企业级虚拟数据中心提供全方位信息安全保护及运算
Bloombase 为 KVM 企业级虚拟数据中心提供全方位信息安全保护及运算Bloombase 为 KVM 企业级虚拟数据中心提供全方位信息安全保护及运算
Bloombase 为 KVM 企业级虚拟数据中心提供全方位信息安全保护及运算
Bloombase
 

Similaire à 2. hadoop (20)

VCACICM6_M02_Arch_Comp.pptx
VCACICM6_M02_Arch_Comp.pptxVCACICM6_M02_Arch_Comp.pptx
VCACICM6_M02_Arch_Comp.pptx
 
VCACICM6_M05_Blueprints_and_Catalog Services.pptx
VCACICM6_M05_Blueprints_and_Catalog Services.pptxVCACICM6_M05_Blueprints_and_Catalog Services.pptx
VCACICM6_M05_Blueprints_and_Catalog Services.pptx
 
方建国 -V mware-ha实战1
方建国 -V mware-ha实战1方建国 -V mware-ha实战1
方建国 -V mware-ha实战1
 
VCACICM6_M07_Extensibility.pptx
VCACICM6_M07_Extensibility.pptxVCACICM6_M07_Extensibility.pptx
VCACICM6_M07_Extensibility.pptx
 
VCACICM6_M04_Configuring_IaaS.pptx
VCACICM6_M04_Configuring_IaaS.pptxVCACICM6_M04_Configuring_IaaS.pptx
VCACICM6_M04_Configuring_IaaS.pptx
 
Leverage virtualization in software test
Leverage virtualization in software testLeverage virtualization in software test
Leverage virtualization in software test
 
VCACICM6_M03_Installation.pptx
VCACICM6_M03_Installation.pptxVCACICM6_M03_Installation.pptx
VCACICM6_M03_Installation.pptx
 
Huawei cloud computing
Huawei cloud computingHuawei cloud computing
Huawei cloud computing
 
华为 余洲 定制化服务器
华为 余洲 定制化服务器华为 余洲 定制化服务器
华为 余洲 定制化服务器
 
华为 余洲 定制化服务器
华为 余洲 定制化服务器华为 余洲 定制化服务器
华为 余洲 定制化服务器
 
BAS010_虛擬化基礎_v190330
BAS010_虛擬化基礎_v190330BAS010_虛擬化基礎_v190330
BAS010_虛擬化基礎_v190330
 
BAS010_虛擬化基礎_v190330 (View online)
BAS010_虛擬化基礎_v190330 (View online)BAS010_虛擬化基礎_v190330 (View online)
BAS010_虛擬化基礎_v190330 (View online)
 
Hp云管理平台3.0
Hp云管理平台3.0Hp云管理平台3.0
Hp云管理平台3.0
 
Hyper V Final
Hyper  V FinalHyper  V Final
Hyper V Final
 
Ezilla
EzillaEzilla
Ezilla
 
Bloombase 为 KVM 企业级虚拟数据中心提供全方位信息安全保护及运算
Bloombase 为 KVM 企业级虚拟数据中心提供全方位信息安全保护及运算Bloombase 为 KVM 企业级虚拟数据中心提供全方位信息安全保护及运算
Bloombase 为 KVM 企业级虚拟数据中心提供全方位信息安全保护及运算
 
Pegasus KV Storage, Let the Users focus on their work (2018/07)
Pegasus KV Storage, Let the Users focus on their work (2018/07)Pegasus KV Storage, Let the Users focus on their work (2018/07)
Pegasus KV Storage, Let the Users focus on their work (2018/07)
 
2021 二月 Kasten K10 介紹與概觀
2021 二月 Kasten K10 介紹與概觀2021 二月 Kasten K10 介紹與概觀
2021 二月 Kasten K10 介紹與概觀
 
深入浅出 V cloud director
深入浅出 V cloud director深入浅出 V cloud director
深入浅出 V cloud director
 
Cloudera security and enterprise license by Athemaster(繁中)
Cloudera security and enterprise license by Athemaster(繁中)Cloudera security and enterprise license by Athemaster(繁中)
Cloudera security and enterprise license by Athemaster(繁中)
 

Plus de Chiou-Nan Chen (20)

Moving NEON to 64 bits
Moving NEON to 64 bitsMoving NEON to 64 bits
Moving NEON to 64 bits
 
64-bit Android
64-bit Android64-bit Android
64-bit Android
 
Intelligent Power Allocation
Intelligent Power AllocationIntelligent Power Allocation
Intelligent Power Allocation
 
3. v sphere big data extensions
3. v sphere big data extensions3. v sphere big data extensions
3. v sphere big data extensions
 
4. v sphere big data extensions hadoop
4. v sphere big data extensions   hadoop4. v sphere big data extensions   hadoop
4. v sphere big data extensions hadoop
 
1. beyond mission critical virtualizing big data and hadoop
1. beyond mission critical   virtualizing big data and hadoop1. beyond mission critical   virtualizing big data and hadoop
1. beyond mission critical virtualizing big data and hadoop
 
5. pivotal hd 2013
5. pivotal hd 20135. pivotal hd 2013
5. pivotal hd 2013
 
Emc keynote 1130 1200
Emc keynote 1130 1200Emc keynote 1130 1200
Emc keynote 1130 1200
 
Emc keynote 1030 1130
Emc keynote 1030 1130Emc keynote 1030 1130
Emc keynote 1030 1130
 
Emc keynote 0945 1030
Emc keynote 0945 1030Emc keynote 0945 1030
Emc keynote 0945 1030
 
Emc keynote 0930 0945
Emc keynote 0930 0945Emc keynote 0930 0945
Emc keynote 0930 0945
 
102 1600-1630
102 1600-1630102 1600-1630
102 1600-1630
 
102 1530-1600
102 1530-1600102 1530-1600
102 1530-1600
 
102 1430-1445
102 1430-1445102 1430-1445
102 1430-1445
 
102 1315-1345
102 1315-1345102 1315-1345
102 1315-1345
 
102 1630 1700
102 1630 1700102 1630 1700
102 1630 1700
 
102 1445 1515
102 1445 1515102 1445 1515
102 1445 1515
 
101 cd 1630-1700
101 cd 1630-1700101 cd 1630-1700
101 cd 1630-1700
 
101 cd 1600-1630
101 cd 1600-1630101 cd 1600-1630
101 cd 1600-1630
 
101 cd 1445-1515
101 cd 1445-1515101 cd 1445-1515
101 cd 1445-1515
 

2. hadoop