SlideShare une entreprise Scribd logo
1  sur  33
基于Mesos的豆瓣数据基础架构
田忠博
tianzhongbo@douban.com
2017-06-21
关于豆瓣
• 豆瓣于2005年3月上线
• 以技术和产品为核心、生活和
文化为内容的创新网络服务
• Python 为主要工作语言
挑战
多样化
的需求
业务数
据分析
广告智
能投放
反垃圾
反水军
个性化
推荐
社交网
络分析
• 每月 100TB+ 日志
• 海量音视频, UGC 数据
• 大量用户个性化数据
数据量大
• 大规模机器学习
• 复杂网络分析和模拟
• 实时数据流分析
计算量大
• 充分利用资源
• 公平合理的调度任务
• 节省成本
高效率
如何应对 ?
大数据
高性能
计算
机器学习
• 共享统一的核心基础设施
• 整合各领域最佳的解决方案
• 增强跨领域互操作性
• 方便易用, 提升开发效率
核心基础设施
Hadoop ?
• 与 Python 整合困难
• 只适合传统大数据分析业务
• 难以整合高性能计算方案
• 机器学习? 深度学习?
• 数据访问困难
• 学习推广成本高
Hadoop
Hive
数
据
分
析
HDFS
MooseFS
• 分布式文件系统
• 类 GFS 架构
• 支持 Fuse 方式访问
• 完整的权限与用户组支持
• 性能优良
• 解决数据共享存储问题
• 日志, 数据, 备份
• 镜像文件
• 代码
• ……
• 历程 @douban
• 2009.12 测试 MooseFS v1.5.12
• 2009.12 上线 MooseFS v1.6.7
• 现状 @douban
• v3.0.92
• 6 个集群
• 数据 6.2 PB+
• 文件 96.7 M+
• 事件峰值 每秒 133 K+
Apache Mesos
• Benjamin Hindman, et al
"Mesos: A Platform for Fine-
Grained Resource Sharing in the
Data Center."
• 分布式资源调度系统
• wDRF - 公平高效的分配算法
• 灵活的两级调度模型
• 开放的资源调度接口
• 高质量的代码实现
• 隔离, 资源限制, Container, …
• 弹性私有云
• 历程 @douban
• 2011.10 测试 Mesos v0.3
• 2011.12 上线 Mesos v0.4
• 现状 @douban
• v1.2.0 & v1.3.0
• 3 个集群
• CPU 5000+
• Mem 5 TB+
• 每日 3 M+ 任务
PyMesos
• https://github.com/douban/pymesos
• Mesos Scheduler/Executor Driver 的纯 Python 实现
• 使用 Mesos HTTP v1 API
• 支持 CPython 2.7/3.5 以及 PyPy
• 内置基于 Zookeeper 的 Master 发现机制
• 提供 subprocess 接口的辅助函数
大数据解决方案
DPark
• https://github.com/douban/dpark
• Apache Spark 的 Python 克隆
• Resilient Distributed Dataset
• 更好的支持迭代计算
• 更好的支持 Python
• 复用 Python 代码和 C 扩展
• 整合 NumPy, SciPy, Pandas, …
• 多租户支持
• 实时流计算 Dstream
from dpark import DparkContext
ctx = DparkContext('mesos')
stopwords = set([
'the', 'to', 'of', 'for', 'in', 'a',
'with', 'this', 'that', 'be‘
])
rdd = ctx.textFile('shakespeare.txt')
rdd = rdd.flatMap(
lambda line: line.rstrip().split()
).map(
lambda word: word.lower()
).filter(
lambda word: word not in stopwords
)
for word, cnt in rdd.hot(10):
print word, cnt
位置感知
• Mesos, MooseFS 集群重叠部署
• 优先将任务发往数据所在节点
• 本地 MooseFS 直接读取
• 网络 IO 转化为本地 IO
TaskTask
Agent
Data
MooseFS
Master
Mesos
Master
DPark
Scheduler
Task
TaskTaskTask
Agent
Data
Agent
Data
Agent
Docker 支持
• 目的:
• 适应线上服务化架构
• 保持环境一致
• 资源隔离
• 加快启动速度
• Docker Containerizer
• Mesos v0.20.0
• 自动镜像构建
• 自动镜像发布和部署
• 自动 Volume 相关路径路径
大数据解决方案
• 原生 Python 支持
• 支持更多业务类型
• 灵活, 轻量
• 内部系统整合
• 直接读取数据备份
• 计算结果自动上线
• 资源隔离与审计
• 公平调度
Mesos
DPark
数
据
分
析
反
垃
圾
实
时
分
析
MooseFSDocker
高性能计算解决方案
MPI 整合方案
• Mrun
• https://github.com/douban/dpark/blob/master/tools/mrun
• 支持从 Mesos 动态分配 MPI 资源
• 支持 MPI Hydra Launcher
• 支持 MPICH2, MPICH3 以及 MVAPICH2
• 高性能计算工具箱
• 相似度计算
• 逻辑回归
• 聚类, 谱聚类
• ……
GPU 加速
• Docker Containerizer
• Nvidia Docker
• 必须使用镜像
• 流程
1. GPU 作为自定义资源注册
2. Master 分配资源给 Scheduler
3. Scheduler 查询 Nvidia Docker
4. Nvidia Docker 返回 GPU 参数
5. Scheduler 提交任务
6. Master 通过 Agent 启动任务
Scheduler
Mesos
Master
Mesos
Agent
Nvidia Docker
Plugin
2
1
3
4
5
6
GPU 加速
• Mesos Unified Containerizer
• GPU Isolator
• 是否使用镜像可选
• 自动分配 GPU 资源
• 流程
1. 注册 GPU 信息到 Master 节点
2. Scheduler 获得 GPU 资源
3. Scheduler 提交 GPU 计算任务
4. Master 通过 Agent 启动 GPU
计算任务
Scheduler
Mesos
Master
Mesos Agent
2
1
3
4
InfiniBand 集成
• 高速, 低延迟
• FDR 56Gb/s
• EDR 100Gb/s
• 消除分布式计算的带宽瓶颈
• 计算任务多机并行扩展
• 构建高性能计算云
• Mesos 设备白名单
• [MESOS-6791] by Douban
• 打开 GPU Isolator 时可以访问
InfiniBand 设备
• Mesos v1.3.0
• MVAPICH2-GDR
• 支持 InfiniBand 的 MPI-3 实现
• 与 MPICH2 二进制兼容
• GPUDirect RDMA
GPUDirect RDMA
GPU CPU
IB HCA
CPU GPU
IB HCA
PCI x4 PCI x4
InfiniBand
GPU
Mem
Mem Mem
GPU
Mem
Without GDR
With GDR
GPU-GPU Benchmark
1.0E+01
1.0E+02
1.0E+03
1.0E+04
0
1000
2000
3000
4000
5000
6000
7000
LATENCY(US)
BANDWIDTH(MB/S)
PACKET SIZE (BYTE)
Bandwidth Latency
测试环境
• MVAPICH2-GDR 2.2
• Mellanox OFED 4.0
• CUDA 8.0
• nv_peer 内核驱动
• gdrcopy 内核驱动
• OSU Benchmark
GPUDirect RDMA
Threshold
高性能计算解决方案
• 支持新一代硬件加速设备
• 充分发挥底层硬件性能
• 消除并行计算带宽瓶颈
• 分布式高性能矩阵计算
MooseFS
Mesos
DPark
数
据
分
析
反
垃
圾
实
时
分
析
Docker
MPI
推
荐
系
统
广
告
投
放
GPU + IB
机器学习解决方案
Paracel
• https://github.com/douban/paracel
• Jeffrey Dean, et al.
"Large scale distributed deep
networks."
• 参数服务器思想
• 分布式机器学习框架
• 使用 MPI 框架通信
• Stale Synchronous Parallel
Parameter Server 𝜔′ = 𝜔 − 𝜂Δ𝜔
𝜔 Δ𝜔
Model
Replicas
Data
Shards
DMLC on Mesos
• Distributed (Deep) Machine Learning Community
• 机器学习工具箱
• MXNet
• XGBoost
• Mesos Support for dmlc-core
• dmlc/dmlc-core#241 by Douban
• Powered by PyMesos
• Fallback to mesos-execute
• XGBoost on Mesos
• 获得近似线性加速能力
Tensorflow
• Tensorflow
• 深度学习框架 By
Google/DeepMind
• 自动求导
• GPU 加速
• Distributed Tensorflow
• Tensorflow v0.8
• gRPC 实现的参数服务器
• In-Graph/Between-Graph 训练
模式
• Tensorflow RDMA
• Remote Direct Memory Access
• tensorflow/tensorflow#8943
by Yahoo
• 使用 verbs 接口访问 IB 设备
• gRPC 协议
• Tensorflow v1.2.0
TFMesos
• https://github.com/douban/tfmesos
• Distributed Tensorflow on Mesos
• 支持 GPU
• 支持 Docker
• tfrun 工具适配 Between-Graph 模式
import tensorflow as tf
from tfmesos import cluster
jobs_def = [
{"name": "ps", "num": 2},
{"name": "worker", "num": 2},
]
with cluster(jobs_def) as c:
with tf.device('/job:ps/task:0'):
a = tf.Variable(10)
with tf.device('/job:ps/task:1'):
b = tf.Variable(32)
with tf.device("/job:worker/task:1"):
op = a + b
grpc_url = c.targets['/job:worker/task:0']
with tf.Session(grpc_url) as sess:
sess.run(tf.global_variables_initializer())
print sess.run(op)
add
a b
/job:ps/task:0
/job:ps/task:1
/job:worker/task:1
机器学习解决方案
• 集成先进机器学习平台
• 从机器学习走向深度学习
• 解决大规模复杂问题
MooseFS
Mesos
DPark
数
据
分
析
反
垃
圾
实
时
分
析
Docker
MPI
推
荐
系
统
广
告
投
放
GPU + IB
自
然
语
言
理
解
复
杂
网
络
分
析
Paracel
DMLC
Tensorflow
总结与展望
成果
大数据
高性能
计算
机器学习
• 基于 Mesos 的统一基础设施
• 整合了各领域最佳解决方案
• 跨解决方案的互操作性
• 充分挖掘高性能硬件的潜能
• 多租户弹性计算云
• 大规模多机并行深度学习
心得
构建统一的
基础设施
整体提升
优势互补
资源共享
形成化学反应
发挥 Mesos 的
平台优势
开放灵活的接口
可定制性
高可扩展性
活跃的开发社区
拥抱新技术
利用高性能硬件
整合新技术方案
学习先进理念
融入开源社区
Q & A
Or: AMA (Ask Me Anything)
Mesos-based Data Infrastructure @ Douban

Contenu connexe

Tendances

X program-within-a-month
X program-within-a-monthX program-within-a-month
X program-within-a-monthChao Zhu
 
Azure HDInsight 介紹
Azure HDInsight 介紹Azure HDInsight 介紹
Azure HDInsight 介紹Herman Wu
 
Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)Jazz Yao-Tsung Wang
 
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座NTC.im(Notch Training Center)
 
Azure Data Lake 簡介
Azure Data Lake 簡介Azure Data Lake 簡介
Azure Data Lake 簡介Herman Wu
 
2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform Security2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform SecurityJazz Yao-Tsung Wang
 
艺龙旅行网架构案例分享-Qcon2011
艺龙旅行网架构案例分享-Qcon2011艺龙旅行网架构案例分享-Qcon2011
艺龙旅行网架构案例分享-Qcon2011Yiwei Ma
 
云计算技术与应用
云计算技术与应用云计算技术与应用
云计算技术与应用Yang Guanjun
 
中大型规模的网站架构运维 Saac
中大型规模的网站架构运维 Saac中大型规模的网站架构运维 Saac
中大型规模的网站架构运维 SaacChao Zhu
 
2006-11-16 RFID and OSS for Agriculture
2006-11-16 RFID and OSS for Agriculture2006-11-16 RFID and OSS for Agriculture
2006-11-16 RFID and OSS for AgricultureJazz Yao-Tsung Wang
 
Introduction to K8S Big Data SIG
Introduction to K8S Big Data SIGIntroduction to K8S Big Data SIG
Introduction to K8S Big Data SIGJazz Yao-Tsung Wang
 
杨少华:阿里开放数据处理服务
杨少华:阿里开放数据处理服务杨少华:阿里开放数据处理服务
杨少华:阿里开放数据处理服务hdhappy001
 
Hadoop的典型应用与企业化之路 for HBTC 2012
Hadoop的典型应用与企业化之路 for HBTC 2012Hadoop的典型应用与企业化之路 for HBTC 2012
Hadoop的典型应用与企业化之路 for HBTC 2012James Chen
 
翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践hdhappy001
 
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況Jazz Yao-Tsung Wang
 
選擇正確的Solution 來建置現代化的雲端資料倉儲
選擇正確的Solution 來建置現代化的雲端資料倉儲選擇正確的Solution 來建置現代化的雲端資料倉儲
選擇正確的Solution 來建置現代化的雲端資料倉儲Herman Wu
 
Hadoop 生態系十年回顧與未來展望
Hadoop 生態系十年回顧與未來展望Hadoop 生態系十年回顧與未來展望
Hadoop 生態系十年回顧與未來展望Jazz Yao-Tsung Wang
 
Hadoop 2.0 之古往今來
Hadoop 2.0 之古往今來Hadoop 2.0 之古往今來
Hadoop 2.0 之古往今來Wei-Yu Chen
 

Tendances (20)

X program-within-a-month
X program-within-a-monthX program-within-a-month
X program-within-a-month
 
Azure HDInsight 介紹
Azure HDInsight 介紹Azure HDInsight 介紹
Azure HDInsight 介紹
 
Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)
 
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
 
Azure Data Lake 簡介
Azure Data Lake 簡介Azure Data Lake 簡介
Azure Data Lake 簡介
 
2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform Security2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform Security
 
艺龙旅行网架构案例分享-Qcon2011
艺龙旅行网架构案例分享-Qcon2011艺龙旅行网架构案例分享-Qcon2011
艺龙旅行网架构案例分享-Qcon2011
 
云计算技术与应用
云计算技术与应用云计算技术与应用
云计算技术与应用
 
中大型规模的网站架构运维 Saac
中大型规模的网站架构运维 Saac中大型规模的网站架构运维 Saac
中大型规模的网站架构运维 Saac
 
2006-11-16 RFID and OSS for Agriculture
2006-11-16 RFID and OSS for Agriculture2006-11-16 RFID and OSS for Agriculture
2006-11-16 RFID and OSS for Agriculture
 
Introduction to K8S Big Data SIG
Introduction to K8S Big Data SIGIntroduction to K8S Big Data SIG
Introduction to K8S Big Data SIG
 
杨少华:阿里开放数据处理服务
杨少华:阿里开放数据处理服务杨少华:阿里开放数据处理服务
杨少华:阿里开放数据处理服务
 
Hadoop的典型应用与企业化之路 for HBTC 2012
Hadoop的典型应用与企业化之路 for HBTC 2012Hadoop的典型应用与企业化之路 for HBTC 2012
Hadoop的典型应用与企业化之路 for HBTC 2012
 
翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践
 
Life of Big Data Technologies
Life of Big Data TechnologiesLife of Big Data Technologies
Life of Big Data Technologies
 
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
 
選擇正確的Solution 來建置現代化的雲端資料倉儲
選擇正確的Solution 來建置現代化的雲端資料倉儲選擇正確的Solution 來建置現代化的雲端資料倉儲
選擇正確的Solution 來建置現代化的雲端資料倉儲
 
Hadoop 生態系十年回顧與未來展望
Hadoop 生態系十年回顧與未來展望Hadoop 生態系十年回顧與未來展望
Hadoop 生態系十年回顧與未來展望
 
Hadoop 2.0 之古往今來
Hadoop 2.0 之古往今來Hadoop 2.0 之古往今來
Hadoop 2.0 之古往今來
 
Hadoop 介紹 20141024
Hadoop 介紹 20141024Hadoop 介紹 20141024
Hadoop 介紹 20141024
 

Similaire à Mesos-based Data Infrastructure @ Douban

百度系统部分布式系统介绍 马如悦 Sacc2010
百度系统部分布式系统介绍 马如悦 Sacc2010百度系统部分布式系统介绍 马如悦 Sacc2010
百度系统部分布式系统介绍 马如悦 Sacc2010Chuanying Du
 
Hadoop con 2015 hadoop enables enterprise data lake
Hadoop con 2015   hadoop enables enterprise data lakeHadoop con 2015   hadoop enables enterprise data lake
Hadoop con 2015 hadoop enables enterprise data lakeJames Chen
 
刘书良:基于大数据公共云平台的Dsp技术
刘书良:基于大数据公共云平台的Dsp技术刘书良:基于大数据公共云平台的Dsp技术
刘书良:基于大数据公共云平台的Dsp技术hdhappy001
 
ClickHouse北京Meetup ClickHouse Best Practice @Sina
ClickHouse北京Meetup ClickHouse Best Practice @SinaClickHouse北京Meetup ClickHouse Best Practice @Sina
ClickHouse北京Meetup ClickHouse Best Practice @SinaJack Gao
 
大資料趨勢介紹與相關使用技術
大資料趨勢介紹與相關使用技術大資料趨勢介紹與相關使用技術
大資料趨勢介紹與相關使用技術Wei-Yu Chen
 
Nosql三步曲
Nosql三步曲Nosql三步曲
Nosql三步曲84zhu
 
分布式流数据实时计算平台 Iprocess
分布式流数据实时计算平台 Iprocess分布式流数据实时计算平台 Iprocess
分布式流数据实时计算平台 Iprocessbabel_qi
 
利用统一存储获得无与伦比的速度,简化系统,并节省更多
利用统一存储获得无与伦比的速度,简化系统,并节省更多利用统一存储获得无与伦比的速度,简化系统,并节省更多
利用统一存储获得无与伦比的速度,简化系统,并节省更多ITband
 
Hacking Nginx at Taobao
Hacking Nginx at TaobaoHacking Nginx at Taobao
Hacking Nginx at TaobaoJoshua Zhu
 
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里li luo
 
Streaming architecture zx_dec2015
Streaming architecture zx_dec2015Streaming architecture zx_dec2015
Streaming architecture zx_dec2015Zhenzhong Xu
 
Data Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouseData Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouseJack Gao
 
NoSQL误用和常见陷阱分析
NoSQL误用和常见陷阱分析NoSQL误用和常见陷阱分析
NoSQL误用和常见陷阱分析iammutex
 
Mr&ueh数据库方面
Mr&ueh数据库方面Mr&ueh数据库方面
Mr&ueh数据库方面Tianwei Liu
 
COSCUP 2019 - 開源大數據引擎 Greenplum
COSCUP 2019 - 開源大數據引擎 GreenplumCOSCUP 2019 - 開源大數據引擎 Greenplum
COSCUP 2019 - 開源大數據引擎 GreenplumOmni-Alex Chen
 
20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索
20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索
20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索liu sheng
 
浅析分布式存储架构—设计自己的存储- 58同城徐振华
浅析分布式存储架构—设计自己的存储- 58同城徐振华浅析分布式存储架构—设计自己的存储- 58同城徐振华
浅析分布式存储架构—设计自己的存储- 58同城徐振华zhuozhe
 
天涯论坛的技术进化史-Qcon2011
天涯论坛的技术进化史-Qcon2011天涯论坛的技术进化史-Qcon2011
天涯论坛的技术进化史-Qcon2011Yiwei Ma
 
Couchbase introduction - Chinese
Couchbase introduction - Chinese Couchbase introduction - Chinese
Couchbase introduction - Chinese Vickie Zeng
 
开源+自主开发 - 淘宝软件基础设施构建实践
开源+自主开发  - 淘宝软件基础设施构建实践开源+自主开发  - 淘宝软件基础设施构建实践
开源+自主开发 - 淘宝软件基础设施构建实践Wensong Zhang
 

Similaire à Mesos-based Data Infrastructure @ Douban (20)

百度系统部分布式系统介绍 马如悦 Sacc2010
百度系统部分布式系统介绍 马如悦 Sacc2010百度系统部分布式系统介绍 马如悦 Sacc2010
百度系统部分布式系统介绍 马如悦 Sacc2010
 
Hadoop con 2015 hadoop enables enterprise data lake
Hadoop con 2015   hadoop enables enterprise data lakeHadoop con 2015   hadoop enables enterprise data lake
Hadoop con 2015 hadoop enables enterprise data lake
 
刘书良:基于大数据公共云平台的Dsp技术
刘书良:基于大数据公共云平台的Dsp技术刘书良:基于大数据公共云平台的Dsp技术
刘书良:基于大数据公共云平台的Dsp技术
 
ClickHouse北京Meetup ClickHouse Best Practice @Sina
ClickHouse北京Meetup ClickHouse Best Practice @SinaClickHouse北京Meetup ClickHouse Best Practice @Sina
ClickHouse北京Meetup ClickHouse Best Practice @Sina
 
大資料趨勢介紹與相關使用技術
大資料趨勢介紹與相關使用技術大資料趨勢介紹與相關使用技術
大資料趨勢介紹與相關使用技術
 
Nosql三步曲
Nosql三步曲Nosql三步曲
Nosql三步曲
 
分布式流数据实时计算平台 Iprocess
分布式流数据实时计算平台 Iprocess分布式流数据实时计算平台 Iprocess
分布式流数据实时计算平台 Iprocess
 
利用统一存储获得无与伦比的速度,简化系统,并节省更多
利用统一存储获得无与伦比的速度,简化系统,并节省更多利用统一存储获得无与伦比的速度,简化系统,并节省更多
利用统一存储获得无与伦比的速度,简化系统,并节省更多
 
Hacking Nginx at Taobao
Hacking Nginx at TaobaoHacking Nginx at Taobao
Hacking Nginx at Taobao
 
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里
 
Streaming architecture zx_dec2015
Streaming architecture zx_dec2015Streaming architecture zx_dec2015
Streaming architecture zx_dec2015
 
Data Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouseData Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouse
 
NoSQL误用和常见陷阱分析
NoSQL误用和常见陷阱分析NoSQL误用和常见陷阱分析
NoSQL误用和常见陷阱分析
 
Mr&ueh数据库方面
Mr&ueh数据库方面Mr&ueh数据库方面
Mr&ueh数据库方面
 
COSCUP 2019 - 開源大數據引擎 Greenplum
COSCUP 2019 - 開源大數據引擎 GreenplumCOSCUP 2019 - 開源大數據引擎 Greenplum
COSCUP 2019 - 開源大數據引擎 Greenplum
 
20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索
20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索
20141128(刘胜)UTC2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索
 
浅析分布式存储架构—设计自己的存储- 58同城徐振华
浅析分布式存储架构—设计自己的存储- 58同城徐振华浅析分布式存储架构—设计自己的存储- 58同城徐振华
浅析分布式存储架构—设计自己的存储- 58同城徐振华
 
天涯论坛的技术进化史-Qcon2011
天涯论坛的技术进化史-Qcon2011天涯论坛的技术进化史-Qcon2011
天涯论坛的技术进化史-Qcon2011
 
Couchbase introduction - Chinese
Couchbase introduction - Chinese Couchbase introduction - Chinese
Couchbase introduction - Chinese
 
开源+自主开发 - 淘宝软件基础设施构建实践
开源+自主开发  - 淘宝软件基础设施构建实践开源+自主开发  - 淘宝软件基础设施构建实践
开源+自主开发 - 淘宝软件基础设施构建实践
 

Mesos-based Data Infrastructure @ Douban