SlideShare une entreprise Scribd logo
1  sur  41
Télécharger pour lire hors ligne
阿里大数据应用平台
刘昌钰
@淘铁燕
2013-11-29
Agenda
• 自我介绍
• 阿里数据平台
• 大数据应用平台
• 挑战与未来
自我介绍 – 刘昌钰
• 阿里巴巴数据平台架构师
• 擅长大系统架构设计
–
–
–
–
–
–

腾讯TBOSS支付结算平台
财付通业务平台
腾讯海量数仓TDW1.0
淘宝网交易平台
淘数据平台
阿里大数据应用平台

• @淘铁燕
3
Agenda
• 自我介绍
• 阿里数据平台
• 大数据应用平台
• 挑战与未来
使命:数据给力商业
• 数据平台:数据+云计算
• 围绕数据的“存 通 用”
,大规模降低数据使用
门槛
• 越关联越有价值,越用
越有价值

5
大数据业务

6
大数据业务

数据业务

云梯1
Hadoop

云梯2
ODPS飞天

Galaxy

Garuda

Hbase

OceanBase

计算平台

7
大数据业务
数据业务
TCIF

ODS

地理服务

数据服务

数据同步

数据开发

调度生产

元数据

数据质量

应用平台
云梯1
Hadoop

云梯2
ODPS飞天

Galaxy

Garuda

Hbase

OceanBase

计算平台
8
Agenda
• 自我介绍
• 阿里数据平台
• 大数据应用平台
• 挑战与未来
大数据应用平台
• 数据导入
• 数据开发
• 数据生产
• 数据回流

• 元数据中心
• 数据质量中心
数据同步系统结构
工作流调度
数据同步中心

应用
非
结
构
化
数
据
源
结
构
化
数
据
源

对内数据支
撑:
商业智能与决
策支持

数据导入
非结构化数据
实时流式同步
结构化数据
实时流式同步

结构化数据
离线同步

实时计算
流式数据
计算框架
离线数据
计算框架

MySQL
Cluster
HBase
搜索引擎

分布式资源池
数据中心

中
间
层

应
用
服
务
器
中
间
件
服
务

产品运营分析
系统运维

对外数据产品:
数据披露
数据产品
日志实时采集 TimeTunel

BI报表
Tail
file

日志

router
broker

Tail
file

日志

Tail
file

broker

hbase

broker
broker

日志

manager monitor

数据源

业务监控

云梯2

量子统计
数据魔方

broker

hbase

broker

broker
hbase

Tail
file

云梯1

broker

broker
日志

df
sw
rit
er

broker

月光宝盒
storm
生意参谋
galaxy

阿里金融

zookeeper

采集

阿拉丁

TT

云计算
实时计算

数据产品

12
TT 日志实时采集

日采集40T 峰值1GB/S
结构化数据导入:DataX

• 统一数据交换协议
• 插件化开发

Mysql

Oracle

云梯1
Hadoop

云梯2
ODPS飞天
大表的实时增量拉取

BI报表
日志

Tail
file

router
broker

broker

ocean
base

broker

hbase

broker

mysql
oracle

manager monitor

Db
sync

df
sw
rit
er

云梯1

业务监控

云梯2

量子统计

broker

数据魔方

broker

hbase

broker

broker
hbase

broker

broker

月光宝盒
storm
生意参谋
galaxy

阿里金融

zookeeper

数据源

采集

阿拉丁

TT

云计算
实时计算

数据产品

15
大数据应用平台
• 数据导入
• 数据开发
• 数据生产
• 数据回流

• 元数据中心
• 数据质量中心
数据开发
开发环境隔离
浏览器

数据开发云

集成开发环境(WEB SDK)
设计器/编辑器

代码
仓库

运行调试
环境

测试环境
自动化测试

元数据
中心

发布
管理

生命周期管理

持续集成

项目管理

集成运维环境
仸务监控
数据质量监控

DEV sandbox

QA sandbox

仸务调度系统

仸务调度系统

PRODUCT
sandbox
仸务调度系统

数据同步

数据同步

数据同步

计算
网关

同步
网关

计算
网关

同步
网关

计算
网关

计算

计算

计算

存储

存储

存储

同步
网关

图例
物理

部署接口

测试接口
运维接口
18
数据生产(调度)
多实例多周期调度
日常周期调度实例:2013-11-28

• 基于数据血缘的DAG调
度

A
B

• 日调度、小时调度、月
调度

D
G

C
E

H

F
I

J

20
调度跨天依赖
多实例冲突检测

跨天依赖

日常周期调度实例:2013-11-27

日常周期调度实例:2013-11-28

A
B
D
G

A

E
H

B

C
F
I

D
J

G

C
E

H

F
I

J

21
Mosad生产护航

22
数据开发平台架构
开发
平台

用
户
权
限
中
心

监
控
告
警

代码管理平台

DAG管理

DAG引擎

执行插件

离线计 云梯一
算集群

ODPS

队列调度

状态管理

日志管理

流式计 Galaxy
算集群

生命周
期管理
冷数据
中心

执行服务
运行资源管理

周边系统

元数据

调度服务

资源
管理
引擎
执行
引擎

发布平台

IDE

调度
引擎
运
维
平
台

用户

第三方系统

同步中心

代码管理

实时计 Garuda
算集群

数据地
图
数据生产规模
• 调度仸务数:数万
• 总job数:数十万
• 总执行总时间:万小时

• 逻辑存储 :百PB 日增百TB
24
大数据应用平台
• 数据导入
• 数据开发
• 数据生产
• 数据回流

• 元数据中心
• 数据质量中心
DataX 异构数据同步

Hive
Server

• 仸意数据源
互通
• 日传输量在
20TB

Oracle
Server

Mysql
Server

Tair

同步
总线

ODPS

HBas
e

File

OSS
Server

OB
Server

Ocean
Base

Http

Http
Server

Hbase
Server

Hive

Oracle

Mysql

ODPS
Server

• 统一数据交
换协议
• 插件化开发

Tair
Server

OTS
Server

OTS

Disk
Sql
Server
挑战-支持海量数据同步
DataX分布式

Master

Slave

启动子仸务

数据流向

S
M
数
据
源

S

S

M

S

数
据
源

S
S

S

S

S
M

S
挑战 – 海量数据回流生产系统

预sharding

离线同步中心

直达存储

partition

存储 Server

partition

DataX

存储 Server

partition

DataX

存储 Server

partition

DataX

partition

DataX

存储 Server

partition

DataX

存储 Server

partition

海量数据

DataX

DataX

存储 Server

路由
层

存储 Server

ODPSOTS 80亿条记录 2个小时传输完毕
大数据应用平台
• 数据导入
• 数据开发
• 数据生产
• 数据回流

• 元数据中心
• 数据质量中心
元数据中心
业务线 (商业智能、小微金融等)
开放API

事件订阅/通知

元数据中心
图搜索

元数据服务

元数据
资源库

元数据驱动

事件中心

事件订阅
/通知

ODPS
驱动

Hive
驱动

......

元数据及血缘关系

同步中心
DataX

数据系统
TT

DT

ODPS

云梯1

......

HBase,OTS...30
元数据中心
Servic
e
iDB
云梯1
odps
alipay
hadoop
Garuda
OTS
HBase
myfox
OceanBase
日志
hive脚本
odps脚本
DataX
DT Task
TT
DBSync

质量
安全
生产
计量

API

Hadoop
数据字典

App
iSearch
全文检索
名称、标签、分类等

系统、包、数据表、
字段、分区等

Neo4j
数据地图
血缘
表级、字段级、分区
级

血缘追溯、影响分析
等

Garuda
数据特征

Dashboard

数据量、访问热度、
标签及用户行为等

指标体系,统计分析,
监控预警
元数据中心应用
数据地图
数据地图
大数据应用平台
• 数据导入
• 数据开发
• 数据生产
• 数据回流

• 元数据中心
• 数据质量中心
数据质量中心
天枢

天网

DQC SDK
元数据
中心

USER(用户)

DQC Web App
DQC Service

监控告警
中心

样本采集
DQC CENTER

云梯1

云梯2

实时(流式)
DQC流程
调度
2. SDK 触发检验请求

1. 规则配置

4. 返回检验结果

5. 调度根据检验
决定是否阻断子

DQC SERVICE

用户
3. 样本采集

云梯1 | 云梯2 | 流式

样本采集
Agenda
• 自我介绍
• 阿里数据平台
• 大数据应用平台
• 挑战与未来
挑战与未来
•
•
•
•
•
•

稳定性
效率
对外开放
数据质量
可管理性
易用门槛

39
例子:同步中心
•
•
•
•

DataX迁移Dbsync:效率
对接MC和iDB:变更透明 稳定性
同步接入DQC:数据质量
服务化:接入门槛

40
Thanks!

最复杂的大数据应用场景
等你来挑战自己

http://www.alidata.org/
@淘铁燕
tieyan.lcy@taobao.com

Contenu connexe

Tendances

2014 Hpocon 姚仁捷 唯品会 - data driven ops
2014 Hpocon 姚仁捷   唯品会 - data driven ops2014 Hpocon 姚仁捷   唯品会 - data driven ops
2014 Hpocon 姚仁捷 唯品会 - data driven opsMichael Zhang
 
数据的价值和灵魂
数据的价值和灵魂数据的价值和灵魂
数据的价值和灵魂学峰 司
 
Big data案例
Big data案例 Big data案例
Big data案例 翊廷 廖
 
Big data應用讓企業獲利翻倍
Big data應用讓企業獲利翻倍Big data應用讓企業獲利翻倍
Big data應用讓企業獲利翻倍Weng Wallace
 
浅谈数据科学
浅谈数据科学浅谈数据科学
浅谈数据科学学峰 司
 
Data without Boundaries - 圍繞第一方數據,找到商業驅動力
Data without Boundaries - 圍繞第一方數據,找到商業驅動力Data without Boundaries - 圍繞第一方數據,找到商業驅動力
Data without Boundaries - 圍繞第一方數據,找到商業驅動力Etu Solution
 
Hadoop Big Data 成功案例分享
Hadoop Big Data 成功案例分享Hadoop Big Data 成功案例分享
Hadoop Big Data 成功案例分享Etu Solution
 
关于云的那些事
关于云的那些事关于云的那些事
关于云的那些事Yan Wang
 
博晓通企业介绍和典型客户201504 (完整版)
博晓通企业介绍和典型客户201504 (完整版)博晓通企业介绍和典型客户201504 (完整版)
博晓通企业介绍和典型客户201504 (完整版)Yu Zhang
 
如何为“云”打造稳固的基石 - 鹏云网络科技
如何为“云”打造稳固的基石 - 鹏云网络科技如何为“云”打造稳固的基石 - 鹏云网络科技
如何为“云”打造稳固的基石 - 鹏云网络科技Hardway Hou
 
Google BigQuery introduction
Google BigQuery introductionGoogle BigQuery introduction
Google BigQuery introductionSimon Su
 
Trinity BDM - 橋接傳統與未來
Trinity BDM - 橋接傳統與未來Trinity BDM - 橋接傳統與未來
Trinity BDM - 橋接傳統與未來Etu Solution
 
揭开数据虚拟化的神秘面纱
揭开数据虚拟化的神秘面纱揭开数据虚拟化的神秘面纱
揭开数据虚拟化的神秘面纱Denodo
 
Transportation big data 20190701 交通部座談會引言
Transportation big data 20190701 交通部座談會引言Transportation big data 20190701 交通部座談會引言
Transportation big data 20190701 交通部座談會引言Richard Chang
 
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖Etu Solution
 
客戶數據分析四大難題一次解決: IBM 數據分析解決方案
客戶數據分析四大難題一次解決:  IBM 數據分析解決方案客戶數據分析四大難題一次解決:  IBM 數據分析解決方案
客戶數據分析四大難題一次解決: IBM 數據分析解決方案Randy Lin
 
Big Data Taiwan 2014 Keynote 1: Why and How We Monetize Data – 意圖,讓我們聚在這裡
Big Data Taiwan 2014 Keynote 1: Why and How We Monetize Data  – 意圖,讓我們聚在這裡Big Data Taiwan 2014 Keynote 1: Why and How We Monetize Data  – 意圖,讓我們聚在這裡
Big Data Taiwan 2014 Keynote 1: Why and How We Monetize Data – 意圖,讓我們聚在這裡Etu Solution
 
Can data virtualization uphold performance with complex queries? (Chinese)
Can data virtualization uphold performance with complex queries? (Chinese)Can data virtualization uphold performance with complex queries? (Chinese)
Can data virtualization uphold performance with complex queries? (Chinese)Denodo
 
刘书良:基于大数据公共云平台的Dsp技术
刘书良:基于大数据公共云平台的Dsp技术刘书良:基于大数据公共云平台的Dsp技术
刘书良:基于大数据公共云平台的Dsp技术hdhappy001
 

Tendances (20)

2014 Hpocon 姚仁捷 唯品会 - data driven ops
2014 Hpocon 姚仁捷   唯品会 - data driven ops2014 Hpocon 姚仁捷   唯品会 - data driven ops
2014 Hpocon 姚仁捷 唯品会 - data driven ops
 
数据的价值和灵魂
数据的价值和灵魂数据的价值和灵魂
数据的价值和灵魂
 
Big data案例
Big data案例 Big data案例
Big data案例
 
Big data應用讓企業獲利翻倍
Big data應用讓企業獲利翻倍Big data應用讓企業獲利翻倍
Big data應用讓企業獲利翻倍
 
浅谈数据科学
浅谈数据科学浅谈数据科学
浅谈数据科学
 
Data without Boundaries - 圍繞第一方數據,找到商業驅動力
Data without Boundaries - 圍繞第一方數據,找到商業驅動力Data without Boundaries - 圍繞第一方數據,找到商業驅動力
Data without Boundaries - 圍繞第一方數據,找到商業驅動力
 
Hadoop Big Data 成功案例分享
Hadoop Big Data 成功案例分享Hadoop Big Data 成功案例分享
Hadoop Big Data 成功案例分享
 
关于云的那些事
关于云的那些事关于云的那些事
关于云的那些事
 
博晓通企业介绍和典型客户201504 (完整版)
博晓通企业介绍和典型客户201504 (完整版)博晓通企业介绍和典型客户201504 (完整版)
博晓通企业介绍和典型客户201504 (完整版)
 
如何为“云”打造稳固的基石 - 鹏云网络科技
如何为“云”打造稳固的基石 - 鹏云网络科技如何为“云”打造稳固的基石 - 鹏云网络科技
如何为“云”打造稳固的基石 - 鹏云网络科技
 
Google BigQuery introduction
Google BigQuery introductionGoogle BigQuery introduction
Google BigQuery introduction
 
Trinity BDM - 橋接傳統與未來
Trinity BDM - 橋接傳統與未來Trinity BDM - 橋接傳統與未來
Trinity BDM - 橋接傳統與未來
 
10708
1070810708
10708
 
揭开数据虚拟化的神秘面纱
揭开数据虚拟化的神秘面纱揭开数据虚拟化的神秘面纱
揭开数据虚拟化的神秘面纱
 
Transportation big data 20190701 交通部座談會引言
Transportation big data 20190701 交通部座談會引言Transportation big data 20190701 交通部座談會引言
Transportation big data 20190701 交通部座談會引言
 
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
 
客戶數據分析四大難題一次解決: IBM 數據分析解決方案
客戶數據分析四大難題一次解決:  IBM 數據分析解決方案客戶數據分析四大難題一次解決:  IBM 數據分析解決方案
客戶數據分析四大難題一次解決: IBM 數據分析解決方案
 
Big Data Taiwan 2014 Keynote 1: Why and How We Monetize Data – 意圖,讓我們聚在這裡
Big Data Taiwan 2014 Keynote 1: Why and How We Monetize Data  – 意圖,讓我們聚在這裡Big Data Taiwan 2014 Keynote 1: Why and How We Monetize Data  – 意圖,讓我們聚在這裡
Big Data Taiwan 2014 Keynote 1: Why and How We Monetize Data – 意圖,讓我們聚在這裡
 
Can data virtualization uphold performance with complex queries? (Chinese)
Can data virtualization uphold performance with complex queries? (Chinese)Can data virtualization uphold performance with complex queries? (Chinese)
Can data virtualization uphold performance with complex queries? (Chinese)
 
刘书良:基于大数据公共云平台的Dsp技术
刘书良:基于大数据公共云平台的Dsp技术刘书良:基于大数据公共云平台的Dsp技术
刘书良:基于大数据公共云平台的Dsp技术
 

En vedette

大数据漫谈-bilibili
大数据漫谈-bilibili大数据漫谈-bilibili
大数据漫谈-bilibili不持
 
云+容器: 重新定义企业IT架构 - 阿里云容器服务 云栖大会 2016
云+容器: 重新定义企业IT架构 - 阿里云容器服务  云栖大会 2016云+容器: 重新定义企业IT架构 - 阿里云容器服务  云栖大会 2016
云+容器: 重新定义企业IT架构 - 阿里云容器服务 云栖大会 2016Li Yi
 
从Docker到容器服务
从Docker到容器服务从Docker到容器服务
从Docker到容器服务Li Yi
 
阿里巴巴运维自动化的探索与规划
阿里巴巴运维自动化的探索与规划阿里巴巴运维自动化的探索与规划
阿里巴巴运维自动化的探索与规划mysqlops
 
MySQL运维那些事
MySQL运维那些事MySQL运维那些事
MySQL运维那些事Jinrong Ye
 
Cgroup lxc在17173 iaas应用池中应用
Cgroup lxc在17173 iaas应用池中应用Cgroup lxc在17173 iaas应用池中应用
Cgroup lxc在17173 iaas应用池中应用Jinrong Ye
 
MySQL设计、优化、运维
MySQL设计、优化、运维MySQL设计、优化、运维
MySQL设计、优化、运维Jinrong Ye
 
我们的MySQL
我们的MySQL我们的MySQL
我们的MySQLJinrong Ye
 
MySQL压力测试经验
MySQL压力测试经验MySQL压力测试经验
MySQL压力测试经验Jinrong Ye
 
如何针对业务做DB优化
如何针对业务做DB优化如何针对业务做DB优化
如何针对业务做DB优化Jinrong Ye
 
程序猿都该知道的MySQL秘籍
程序猿都该知道的MySQL秘籍程序猿都该知道的MySQL秘籍
程序猿都该知道的MySQL秘籍Jinrong Ye
 
高效Linux SA
高效Linux SA高效Linux SA
高效Linux SAJinrong Ye
 
MySQL数据库设计、优化
MySQL数据库设计、优化MySQL数据库设计、优化
MySQL数据库设计、优化Jinrong Ye
 
Cgroups, namespaces, and beyond: what are containers made from? (DockerCon Eu...
Cgroups, namespaces, and beyond: what are containers made from? (DockerCon Eu...Cgroups, namespaces, and beyond: what are containers made from? (DockerCon Eu...
Cgroups, namespaces, and beyond: what are containers made from? (DockerCon Eu...Jérôme Petazzoni
 
MySQL技术分享:一步到位实现mysql优化
MySQL技术分享:一步到位实现mysql优化MySQL技术分享:一步到位实现mysql优化
MySQL技术分享:一步到位实现mysql优化Jinrong Ye
 

En vedette (16)

大数据漫谈-bilibili
大数据漫谈-bilibili大数据漫谈-bilibili
大数据漫谈-bilibili
 
云+容器: 重新定义企业IT架构 - 阿里云容器服务 云栖大会 2016
云+容器: 重新定义企业IT架构 - 阿里云容器服务  云栖大会 2016云+容器: 重新定义企业IT架构 - 阿里云容器服务  云栖大会 2016
云+容器: 重新定义企业IT架构 - 阿里云容器服务 云栖大会 2016
 
从Docker到容器服务
从Docker到容器服务从Docker到容器服务
从Docker到容器服务
 
阿里巴巴运维自动化的探索与规划
阿里巴巴运维自动化的探索与规划阿里巴巴运维自动化的探索与规划
阿里巴巴运维自动化的探索与规划
 
MySQL运维那些事
MySQL运维那些事MySQL运维那些事
MySQL运维那些事
 
Cgroup lxc在17173 iaas应用池中应用
Cgroup lxc在17173 iaas应用池中应用Cgroup lxc在17173 iaas应用池中应用
Cgroup lxc在17173 iaas应用池中应用
 
MySQL设计、优化、运维
MySQL设计、优化、运维MySQL设计、优化、运维
MySQL设计、优化、运维
 
我们的MySQL
我们的MySQL我们的MySQL
我们的MySQL
 
MySQL压力测试经验
MySQL压力测试经验MySQL压力测试经验
MySQL压力测试经验
 
如何针对业务做DB优化
如何针对业务做DB优化如何针对业务做DB优化
如何针对业务做DB优化
 
Big Data Architectural Patterns
Big Data Architectural PatternsBig Data Architectural Patterns
Big Data Architectural Patterns
 
程序猿都该知道的MySQL秘籍
程序猿都该知道的MySQL秘籍程序猿都该知道的MySQL秘籍
程序猿都该知道的MySQL秘籍
 
高效Linux SA
高效Linux SA高效Linux SA
高效Linux SA
 
MySQL数据库设计、优化
MySQL数据库设计、优化MySQL数据库设计、优化
MySQL数据库设计、优化
 
Cgroups, namespaces, and beyond: what are containers made from? (DockerCon Eu...
Cgroups, namespaces, and beyond: what are containers made from? (DockerCon Eu...Cgroups, namespaces, and beyond: what are containers made from? (DockerCon Eu...
Cgroups, namespaces, and beyond: what are containers made from? (DockerCon Eu...
 
MySQL技术分享:一步到位实现mysql优化
MySQL技术分享:一步到位实现mysql优化MySQL技术分享:一步到位实现mysql优化
MySQL技术分享:一步到位实现mysql优化
 

Similaire à 刘昌钰:阿里大数据应用平台

淘宝双11双12案例分享
淘宝双11双12案例分享淘宝双11双12案例分享
淘宝双11双12案例分享vanadies10
 
唯品会大数据实践 Sacc pub
唯品会大数据实践 Sacc pub唯品会大数据实践 Sacc pub
唯品会大数据实践 Sacc pubChao Zhu
 
Greenplum技术
Greenplum技术Greenplum技术
Greenplum技术锐 张
 
逻辑数据编织 – 构建先进的现代企业数据架构
逻辑数据编织 – 构建先进的现代企业数据架构逻辑数据编织 – 构建先进的现代企业数据架构
逻辑数据编织 – 构建先进的现代企业数据架构Denodo
 
阿里巴巴数据中台实践分享.pdf
阿里巴巴数据中台实践分享.pdf阿里巴巴数据中台实践分享.pdf
阿里巴巴数据中台实践分享.pdfmarkmind
 
如何快速实现数据编织架构
如何快速实现数据编织架构如何快速实现数据编织架构
如何快速实现数据编织架构Denodo
 
云存储与虚拟化分论坛 基于云计算的海量数据挖掘
云存储与虚拟化分论坛 基于云计算的海量数据挖掘云存储与虚拟化分论坛 基于云计算的海量数据挖掘
云存储与虚拟化分论坛 基于云计算的海量数据挖掘Riquelme624
 
Se shang hai_04_cloudybi
Se shang hai_04_cloudybiSe shang hai_04_cloudybi
Se shang hai_04_cloudybiTech2IPO
 
云计算概念介绍2011 03
云计算概念介绍2011 03云计算概念介绍2011 03
云计算概念介绍2011 03Liming Liu
 
How do we manage more than one thousand of Pegasus clusters - engine part
How do we manage more than one thousand of Pegasus clusters - engine partHow do we manage more than one thousand of Pegasus clusters - engine part
How do we manage more than one thousand of Pegasus clusters - engine partacelyc1112009
 
淘宝数据可视化[2010 SD2.0]
淘宝数据可视化[2010 SD2.0]淘宝数据可视化[2010 SD2.0]
淘宝数据可视化[2010 SD2.0]KennyZ
 
How Enterprises Leverage Data to Overcome Business Challenges During Coronavirus
How Enterprises Leverage Data to Overcome Business Challenges During CoronavirusHow Enterprises Leverage Data to Overcome Business Challenges During Coronavirus
How Enterprises Leverage Data to Overcome Business Challenges During CoronavirusDenodo
 
How to continuously improve Apache Pegasus in complex toB scenarios
How to continuously improve Apache Pegasus in complex toB scenariosHow to continuously improve Apache Pegasus in complex toB scenarios
How to continuously improve Apache Pegasus in complex toB scenariosacelyc1112009
 
美团数据平台之Kafka应用实践和优化
美团数据平台之Kafka应用实践和优化美团数据平台之Kafka应用实践和优化
美团数据平台之Kafka应用实践和优化confluent
 
深入淺出 AWS 大數據工具
深入淺出 AWS 大數據工具深入淺出 AWS 大數據工具
深入淺出 AWS 大數據工具Amazon Web Services
 
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里li luo
 
现代数据集成解决方案及应用案例介绍(下)
现代数据集成解决方案及应用案例介绍(下)现代数据集成解决方案及应用案例介绍(下)
现代数据集成解决方案及应用案例介绍(下)Denodo
 
Big Data World Forum
Big Data World ForumBig Data World Forum
Big Data World Forumbigdatawf
 
俞晨杰:Linked in大数据应用和azkaban
俞晨杰:Linked in大数据应用和azkaban俞晨杰:Linked in大数据应用和azkaban
俞晨杰:Linked in大数据应用和azkabanhdhappy001
 
Modernising Data Architecture for Data Driven Insights (Chinese)
Modernising Data Architecture for Data Driven Insights (Chinese)Modernising Data Architecture for Data Driven Insights (Chinese)
Modernising Data Architecture for Data Driven Insights (Chinese)Denodo
 

Similaire à 刘昌钰:阿里大数据应用平台 (20)

淘宝双11双12案例分享
淘宝双11双12案例分享淘宝双11双12案例分享
淘宝双11双12案例分享
 
唯品会大数据实践 Sacc pub
唯品会大数据实践 Sacc pub唯品会大数据实践 Sacc pub
唯品会大数据实践 Sacc pub
 
Greenplum技术
Greenplum技术Greenplum技术
Greenplum技术
 
逻辑数据编织 – 构建先进的现代企业数据架构
逻辑数据编织 – 构建先进的现代企业数据架构逻辑数据编织 – 构建先进的现代企业数据架构
逻辑数据编织 – 构建先进的现代企业数据架构
 
阿里巴巴数据中台实践分享.pdf
阿里巴巴数据中台实践分享.pdf阿里巴巴数据中台实践分享.pdf
阿里巴巴数据中台实践分享.pdf
 
如何快速实现数据编织架构
如何快速实现数据编织架构如何快速实现数据编织架构
如何快速实现数据编织架构
 
云存储与虚拟化分论坛 基于云计算的海量数据挖掘
云存储与虚拟化分论坛 基于云计算的海量数据挖掘云存储与虚拟化分论坛 基于云计算的海量数据挖掘
云存储与虚拟化分论坛 基于云计算的海量数据挖掘
 
Se shang hai_04_cloudybi
Se shang hai_04_cloudybiSe shang hai_04_cloudybi
Se shang hai_04_cloudybi
 
云计算概念介绍2011 03
云计算概念介绍2011 03云计算概念介绍2011 03
云计算概念介绍2011 03
 
How do we manage more than one thousand of Pegasus clusters - engine part
How do we manage more than one thousand of Pegasus clusters - engine partHow do we manage more than one thousand of Pegasus clusters - engine part
How do we manage more than one thousand of Pegasus clusters - engine part
 
淘宝数据可视化[2010 SD2.0]
淘宝数据可视化[2010 SD2.0]淘宝数据可视化[2010 SD2.0]
淘宝数据可视化[2010 SD2.0]
 
How Enterprises Leverage Data to Overcome Business Challenges During Coronavirus
How Enterprises Leverage Data to Overcome Business Challenges During CoronavirusHow Enterprises Leverage Data to Overcome Business Challenges During Coronavirus
How Enterprises Leverage Data to Overcome Business Challenges During Coronavirus
 
How to continuously improve Apache Pegasus in complex toB scenarios
How to continuously improve Apache Pegasus in complex toB scenariosHow to continuously improve Apache Pegasus in complex toB scenarios
How to continuously improve Apache Pegasus in complex toB scenarios
 
美团数据平台之Kafka应用实践和优化
美团数据平台之Kafka应用实践和优化美团数据平台之Kafka应用实践和优化
美团数据平台之Kafka应用实践和优化
 
深入淺出 AWS 大數據工具
深入淺出 AWS 大數據工具深入淺出 AWS 大數據工具
深入淺出 AWS 大數據工具
 
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里
 
现代数据集成解决方案及应用案例介绍(下)
现代数据集成解决方案及应用案例介绍(下)现代数据集成解决方案及应用案例介绍(下)
现代数据集成解决方案及应用案例介绍(下)
 
Big Data World Forum
Big Data World ForumBig Data World Forum
Big Data World Forum
 
俞晨杰:Linked in大数据应用和azkaban
俞晨杰:Linked in大数据应用和azkaban俞晨杰:Linked in大数据应用和azkaban
俞晨杰:Linked in大数据应用和azkaban
 
Modernising Data Architecture for Data Driven Insights (Chinese)
Modernising Data Architecture for Data Driven Insights (Chinese)Modernising Data Architecture for Data Driven Insights (Chinese)
Modernising Data Architecture for Data Driven Insights (Chinese)
 

Plus de hdhappy001

詹剑锋:Big databench—benchmarking big data systems
詹剑锋:Big databench—benchmarking big data systems詹剑锋:Big databench—benchmarking big data systems
詹剑锋:Big databench—benchmarking big data systemshdhappy001
 
翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践hdhappy001
 
袁晓如:大数据时代可视化和可视分析的机遇与挑战
袁晓如:大数据时代可视化和可视分析的机遇与挑战袁晓如:大数据时代可视化和可视分析的机遇与挑战
袁晓如:大数据时代可视化和可视分析的机遇与挑战hdhappy001
 
徐萌:中国移动大数据应用实践
徐萌:中国移动大数据应用实践徐萌:中国移动大数据应用实践
徐萌:中国移动大数据应用实践hdhappy001
 
肖康:Storm在实时网络攻击检测和分析的应用与改进
肖康:Storm在实时网络攻击检测和分析的应用与改进肖康:Storm在实时网络攻击检测和分析的应用与改进
肖康:Storm在实时网络攻击检测和分析的应用与改进hdhappy001
 
夏俊鸾:Spark——基于内存的下一代大数据分析框架
夏俊鸾:Spark——基于内存的下一代大数据分析框架夏俊鸾:Spark——基于内存的下一代大数据分析框架
夏俊鸾:Spark——基于内存的下一代大数据分析框架hdhappy001
 
魏凯:大数据商业利用的政策管制问题
魏凯:大数据商业利用的政策管制问题魏凯:大数据商业利用的政策管制问题
魏凯:大数据商业利用的政策管制问题hdhappy001
 
王涛:基于Cloudera impala的非关系型数据库sql执行引擎
王涛:基于Cloudera impala的非关系型数据库sql执行引擎王涛:基于Cloudera impala的非关系型数据库sql执行引擎
王涛:基于Cloudera impala的非关系型数据库sql执行引擎hdhappy001
 
王峰:阿里搜索实时流计算技术
王峰:阿里搜索实时流计算技术王峰:阿里搜索实时流计算技术
王峰:阿里搜索实时流计算技术hdhappy001
 
钱卫宁:在线社交媒体分析型查询基准评测初探
钱卫宁:在线社交媒体分析型查询基准评测初探钱卫宁:在线社交媒体分析型查询基准评测初探
钱卫宁:在线社交媒体分析型查询基准评测初探hdhappy001
 
穆黎森:Interactive batch query at scale
穆黎森:Interactive batch query at scale穆黎森:Interactive batch query at scale
穆黎森:Interactive batch query at scalehdhappy001
 
罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群hdhappy001
 
刘诚忠:Running cloudera impala on postgre sql
刘诚忠:Running cloudera impala on postgre sql刘诚忠:Running cloudera impala on postgre sql
刘诚忠:Running cloudera impala on postgre sqlhdhappy001
 
李战怀:大数据背景下分布式系统的数据一致性策略
李战怀:大数据背景下分布式系统的数据一致性策略李战怀:大数据背景下分布式系统的数据一致性策略
李战怀:大数据背景下分布式系统的数据一致性策略hdhappy001
 
冯宏华:H base在小米的应用与扩展
冯宏华:H base在小米的应用与扩展冯宏华:H base在小米的应用与扩展
冯宏华:H base在小米的应用与扩展hdhappy001
 
堵俊平:Hadoop virtualization extensions
堵俊平:Hadoop virtualization extensions堵俊平:Hadoop virtualization extensions
堵俊平:Hadoop virtualization extensionshdhappy001
 
陈跃国:Sql on-hadoop结构化大数据分析系统性能评测
陈跃国:Sql on-hadoop结构化大数据分析系统性能评测陈跃国:Sql on-hadoop结构化大数据分析系统性能评测
陈跃国:Sql on-hadoop结构化大数据分析系统性能评测hdhappy001
 
查礼 -大数据技术如何用于传统信息系统
查礼 -大数据技术如何用于传统信息系统查礼 -大数据技术如何用于传统信息系统
查礼 -大数据技术如何用于传统信息系统hdhappy001
 
Ted yu:h base and hoya
Ted yu:h base and hoyaTed yu:h base and hoya
Ted yu:h base and hoyahdhappy001
 
Raghu nambiar:industry standard benchmarks
Raghu nambiar:industry standard benchmarksRaghu nambiar:industry standard benchmarks
Raghu nambiar:industry standard benchmarkshdhappy001
 

Plus de hdhappy001 (20)

詹剑锋:Big databench—benchmarking big data systems
詹剑锋:Big databench—benchmarking big data systems詹剑锋:Big databench—benchmarking big data systems
詹剑锋:Big databench—benchmarking big data systems
 
翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践
 
袁晓如:大数据时代可视化和可视分析的机遇与挑战
袁晓如:大数据时代可视化和可视分析的机遇与挑战袁晓如:大数据时代可视化和可视分析的机遇与挑战
袁晓如:大数据时代可视化和可视分析的机遇与挑战
 
徐萌:中国移动大数据应用实践
徐萌:中国移动大数据应用实践徐萌:中国移动大数据应用实践
徐萌:中国移动大数据应用实践
 
肖康:Storm在实时网络攻击检测和分析的应用与改进
肖康:Storm在实时网络攻击检测和分析的应用与改进肖康:Storm在实时网络攻击检测和分析的应用与改进
肖康:Storm在实时网络攻击检测和分析的应用与改进
 
夏俊鸾:Spark——基于内存的下一代大数据分析框架
夏俊鸾:Spark——基于内存的下一代大数据分析框架夏俊鸾:Spark——基于内存的下一代大数据分析框架
夏俊鸾:Spark——基于内存的下一代大数据分析框架
 
魏凯:大数据商业利用的政策管制问题
魏凯:大数据商业利用的政策管制问题魏凯:大数据商业利用的政策管制问题
魏凯:大数据商业利用的政策管制问题
 
王涛:基于Cloudera impala的非关系型数据库sql执行引擎
王涛:基于Cloudera impala的非关系型数据库sql执行引擎王涛:基于Cloudera impala的非关系型数据库sql执行引擎
王涛:基于Cloudera impala的非关系型数据库sql执行引擎
 
王峰:阿里搜索实时流计算技术
王峰:阿里搜索实时流计算技术王峰:阿里搜索实时流计算技术
王峰:阿里搜索实时流计算技术
 
钱卫宁:在线社交媒体分析型查询基准评测初探
钱卫宁:在线社交媒体分析型查询基准评测初探钱卫宁:在线社交媒体分析型查询基准评测初探
钱卫宁:在线社交媒体分析型查询基准评测初探
 
穆黎森:Interactive batch query at scale
穆黎森:Interactive batch query at scale穆黎森:Interactive batch query at scale
穆黎森:Interactive batch query at scale
 
罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群
 
刘诚忠:Running cloudera impala on postgre sql
刘诚忠:Running cloudera impala on postgre sql刘诚忠:Running cloudera impala on postgre sql
刘诚忠:Running cloudera impala on postgre sql
 
李战怀:大数据背景下分布式系统的数据一致性策略
李战怀:大数据背景下分布式系统的数据一致性策略李战怀:大数据背景下分布式系统的数据一致性策略
李战怀:大数据背景下分布式系统的数据一致性策略
 
冯宏华:H base在小米的应用与扩展
冯宏华:H base在小米的应用与扩展冯宏华:H base在小米的应用与扩展
冯宏华:H base在小米的应用与扩展
 
堵俊平:Hadoop virtualization extensions
堵俊平:Hadoop virtualization extensions堵俊平:Hadoop virtualization extensions
堵俊平:Hadoop virtualization extensions
 
陈跃国:Sql on-hadoop结构化大数据分析系统性能评测
陈跃国:Sql on-hadoop结构化大数据分析系统性能评测陈跃国:Sql on-hadoop结构化大数据分析系统性能评测
陈跃国:Sql on-hadoop结构化大数据分析系统性能评测
 
查礼 -大数据技术如何用于传统信息系统
查礼 -大数据技术如何用于传统信息系统查礼 -大数据技术如何用于传统信息系统
查礼 -大数据技术如何用于传统信息系统
 
Ted yu:h base and hoya
Ted yu:h base and hoyaTed yu:h base and hoya
Ted yu:h base and hoya
 
Raghu nambiar:industry standard benchmarks
Raghu nambiar:industry standard benchmarksRaghu nambiar:industry standard benchmarks
Raghu nambiar:industry standard benchmarks
 

刘昌钰:阿里大数据应用平台