SlideShare une entreprise Scribd logo
1  sur  34
Télécharger pour lire hors ligne
Hadoop 第⼀一讲 @
           瑞友科技IT应用研究院池建强

                 Weibo: @池建强
                Twitter: @sagacity
大数据胜于好算法


‣ 如果数据足够多,可能产生出意想之外的应用
‣ 无论算法好坏,更多的数据总能带了来更好的推荐效果
大数据存储和分析遇到的问题


‣ 磁盘容量的增长远远大于磁盘读取速度
‣ 1TB的磁盘,数据传输速度100MB/s,读⼀一遍2.5H
‣ 写数据就更慢了...
解决之道


‣ 磁盘数据并行读写
‣ 分布式文件系统,冗余
‣ MapReduce
2004年,Google发表论文,向全世界介绍了MapReduce
2005年初,为了支持Nutch搜索引擎项目,Nutch的开发者基于Google发布的MapReduce
报告,在Nutch上开发了⼀一个可工作的MapReduce应用
2005年中,所有主要的Nutch算法被移植到MapReduce和NDFS(Nutch Distributed File
System )环境来运行
2006年2月,Apache Hadoop项目正式启动以支持MapReduce和HDFS的独立发展
2007年,百度开始使用Hadoop做离线处理,目前差不多80%的Hadoop集群用作日志处理
2008年,淘宝开始投入研究基于Hadoop的系统--云梯,并将其用于处理电子商务相关数
据。云梯1的总容量大概为9.3PB,包含了1100台机器,每天处理约18000道作业,扫描
500TB数据
2008年1月,Hadoop成为Apache顶级项目
2008年7月,Hadoop打破1TB数据排序基准测试记录。Yahoo的⼀一个Hadoop集群用209
秒完成1TB数据的排序,比上⼀一年的纪录保持者保持的297秒快了将近90秒
项目演化...
Hadoop提供了⼀一个可靠的共享存储和分析系统。HDFS
实现存储,MapReduce实现分析处理
Google App Engine——Runtime,OpenAPI


MapReduce           BigTable
                                    Chubby
            GFS
Hadoop


                       MapReduce        HBase/Hive      Pig
                                                              ZooKeeper
                                        HDFS




   Google App Engine——Runtime,OpenAPI


MapReduce           BigTable
                                    Chubby
            GFS
传统关系型数据库    MapReduce
数据大小      GB          PB
 访问     交互式和批处理      批处理
 更新      多次读写     ⼀一次写入多次读取
 结构      静态模式       动态模式
完整性        高          低
横向扩展      非线性        线性
Hadoop生态圈
            分布式文件系统和通用I/O的组件与接口(序列化,Java RPC和持久化数
Common
            据结构)
  Avro      支持高效的跨语言RPC和持久数据存储的序列化系统
MapReduce   分布式数据处理模型和执行环境,运行在大型商用机集群
  HDFS      分布式文件系统,用于大型商用机集群
            数据流语言和运行环境,检索大型数据集,Pig运行在MapReduce和HDFS
   PIG
            的集群上
            分布式、按列存储的数据仓库。Hive管理HDFS中存储的数据,并提供基
  Hive
            于SQL的查询语言(由运行时引擎翻译成MapReduce作业)
            分布式、按列存储的数据库。HBase使用HDFS作为底层存储,同时支持
  HBase
            MapReduce的批量式计算和点查询(随机读取)
ZooKeeper   分布式、可用性高的协调服务。提供类似分布式锁的基础服务
  Sqoop     在数据库和HDFS之间高效传输数据的工具
Hadoop支持多种语言,包括Java/C/Python/Ruby
MapReduce
MapR
     educ
          e
MapReduce对数据采用的是运行时解释的方式,所以对
非结构化和半结构化数据非常有效
MapReduce输入的键和值并不是数据固有的属性,而是
有分析数据的人员来选择的
0067011990999991950051507004+68750+023550FM-12+038299999V0203301N00671220001CN9999999N9+00001+99999999999
0043011990999991950051512004+68750+023550FM-12+038299999V0203201N00671220001CN9999999N9+00221+99999999999
0043011990999991950051518004+68750+023550FM-12+038299999V0203201N00261220001CN9999999N9-00111+99999999999
0043012650999991949032412004+62300+010750FM-12+048599999V0202701N00461220001CN0500001N9+01111+99999999999
0043012650999991949032418004+62300+010750FM-12+048599999V0202701N00461220001CN0500001N9+00781+99999999999
Mapper
public class MaxTemperatureMapper extends MapReduceBase
  implements Mapper<LongWritable, Text, Text, IntWritable> {

 private static final int MISSING = 9999;
 //key:行偏移量; value:行文本
 public void map(LongWritable key, Text value,
     OutputCollector<Text, IntWritable> output, Reporter reporter)
     throws IOException {

    String line = value.toString();
    String year = line.substring(15, 19);
    ......
    if (airTemperature != MISSING && quality.matches("[01459]")) {
      output.collect(new Text(year), new
IntWritable(airTemperature));
    }
  }
}
Reducer
public class MaxTemperatureReducer extends MapReduceBase
  implements Reducer<Text, IntWritable, Text, IntWritable> {

    public void reduce(Text key, Iterator<IntWritable> values,
        OutputCollector<Text, IntWritable> output, Reporter reporter)
        throws IOException {

        int maxValue = Integer.MIN_VALUE;
        while (values.hasNext()) {
          maxValue = Math.max(maxValue, values.next().get());
        }
        output.collect(key, new IntWritable(maxValue));
    }
}
Combiner
map1: (1950, 0)               map2: (1950, 30)
      (1950, 20)                    (1950, 20)
      (1950, 10)

combine: (1950, [20,30])

conf.setMapperClass(MaxTemperatureMapper.class);
//指定合并函数
conf.setCombinerClass(MaxTemperatureReducer.class);
conf.setReducerClass(MaxTemperatureReducer.class);
HDFS
HDFS是Hadoop的首选分布式文件系统,同时Hadoop
也可以支持其他文件系统,例如本地文件和其他分布式
系统。
超大文件—>1024G—>1T—>1024T—>1P
HDSF是为大数据吞吐设计的,这可能会以时间延迟为代价
HDFS的block默认为64M,Map任务通常⼀一次处理⼀一个块
的任务
nodename存储文件的元数据,nodename是放在内存中的,
所以文件存储的节点受限于namenode的内存大小。
显示分布式系统的数据块结构:hadoop fsck / -files -blocks
安装部署
本地模式
‣ JDK1.6
‣ 无需运行守候进程
‣ 默认配置文件无须修改
‣ 在etc/hadoop/hadoop-env.sh设置JAVA_HOME
‣ 执行:bin/hadoop version
Hadoop控制脚本依赖SSH来执行
伪分布模式                                                对整个集群的操作。

                                                     为了支持无缝工作,SSH安装好
‣ 需要运行守候进程-sbin/startall.sh                          后需要允许运行hadoop的用户无
                                                     需键入密码登录到集群内的机

‣ 修改配置文件                                             器。

                                                     创建公钥和私钥对,在集群间
‣ 配置SSH                                              共享密钥对。

   ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
   cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

‣ 格式化HDFS文件系统
‣ 查看分布式文件:hadoop -fs ls .
‣ NameNode - http://localhost:50070/
‣ JobTracker - http://localhost:50030/
全分布模式
‣ 在至少两台机器安装hadoop
   10.211.55.2-os x
   10.211.55.7-linux

‣ 配置SSH:
   cd ~/.ssh
   scp authorized_keys 10.211.55.7:/home/chjq/.ssh

‣ 修改配置文件,增加Slave节点
‣ 格式化全分布式HDFS文件系统
‣ 查看分布式文件:hadoop -fs ls .
‣ NameNode - http://10.211.55.2:50070/
‣ JobTracker - http://10.211.55.2:50030/
MapReduce和HDFS实践
如何运行第二章中Java的MaxTemperature例子?
1、首先把所需数据提交到HDFS中。
cd hadoop-book
hadoop fs -put input input

2、建立java项目,把相关例程中的java代码导入项目
包括:
MaxTemperature.java
MaxTemperatureMapper.java
MaxTemperatureReducer.java
MaxTemperatureWithCombiner.java
NewMaxTemperature.java

引入jar包:hadoop-core-1.0.0.jar
编译通过,把源代码导出jar包,MaxTemperature.jar
3、执行命令运行map/reduce任务
以jar包的形式执行任务:
hadoop jar MaxTemperature.jar MaxTemperature input/ncdc/sample.txt
output
MaxTemperature是入口程序
input/ncdc/sample.txt是HDFS上的数据文件
可以采用目录方式处理多个数据,例如:
hadoop jar MaxTemperature.jarMaxTemperature input/ncdc/*.txt output
hadoop jar MaxTemperature.jarMaxTemperature input/ncdc/* output
hadoop会自动遍历目录下的所有文件

output是存放输出结果目录
4、查看执行结果
输出数据写入output目录,其中每个reducer都有⼀一个
输出文件,在这个例子中,包含⼀一个reducer,所以只能
找到⼀一个文件,part-00000

hadoop fs -cat output/part-00000
欲知后事如何
且听下回分解
Questions?

        Follow me
        微博:@池建强 | twitter: @sagacity

Contenu connexe

Tendances

Hadoop系统及其关键技术
Hadoop系统及其关键技术Hadoop系统及其关键技术
Hadoop系统及其关键技术冬 陈
 
Hadoop 設定與配置
Hadoop 設定與配置Hadoop 設定與配置
Hadoop 設定與配置鳥 藍
 
大資料趨勢介紹與相關使用技術
大資料趨勢介紹與相關使用技術大資料趨勢介紹與相關使用技術
大資料趨勢介紹與相關使用技術Wei-Yu Chen
 
Hadoop ecosystem - hadoop 生態系
Hadoop ecosystem - hadoop 生態系Hadoop ecosystem - hadoop 生態系
Hadoop ecosystem - hadoop 生態系Wei-Yu Chen
 
2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform Security2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform SecurityJazz Yao-Tsung Wang
 
Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結James Chen
 
Hadoop 0.20 程式設計
Hadoop 0.20 程式設計Hadoop 0.20 程式設計
Hadoop 0.20 程式設計Wei-Yu Chen
 
MapReduce 簡單介紹與練習
MapReduce 簡單介紹與練習MapReduce 簡單介紹與練習
MapReduce 簡單介紹與練習孜羲 顏
 
淘宝Hadoop数据分析实践
淘宝Hadoop数据分析实践淘宝Hadoop数据分析实践
淘宝Hadoop数据分析实践Min Zhou
 
Distributed Data Analytics at Taobao
Distributed Data Analytics at TaobaoDistributed Data Analytics at Taobao
Distributed Data Analytics at TaobaoMin Zhou
 
ClickHouse北京Meetup ClickHouse Best Practice @Sina
ClickHouse北京Meetup ClickHouse Best Practice @SinaClickHouse北京Meetup ClickHouse Best Practice @Sina
ClickHouse北京Meetup ClickHouse Best Practice @SinaJack Gao
 
加速開發! 在Windows開發hadoop程式,直接運行 map/reduce
加速開發! 在Windows開發hadoop程式,直接運行 map/reduce加速開發! 在Windows開發hadoop程式,直接運行 map/reduce
加速開發! 在Windows開發hadoop程式,直接運行 map/reduceWei-Yu Chen
 
Data Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouseData Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouseJack Gao
 
Apache hadoop and cdh(cloudera distribution) introduction 基本介紹
Apache hadoop and cdh(cloudera distribution) introduction 基本介紹Apache hadoop and cdh(cloudera distribution) introduction 基本介紹
Apache hadoop and cdh(cloudera distribution) introduction 基本介紹Anna Yen
 
Hadoop的典型应用与企业化之路 for HBTC 2012
Hadoop的典型应用与企业化之路 for HBTC 2012Hadoop的典型应用与企业化之路 for HBTC 2012
Hadoop的典型应用与企业化之路 for HBTC 2012James Chen
 
Hadoop安裝 (1)
Hadoop安裝 (1)Hadoop安裝 (1)
Hadoop安裝 (1)銘鴻 陳
 
Establish The Core of Cloud Computing Application by Using Hazelcast (Chinese)
Establish The Core of  Cloud Computing Application  by Using Hazelcast (Chinese)Establish The Core of  Cloud Computing Application  by Using Hazelcast (Chinese)
Establish The Core of Cloud Computing Application by Using Hazelcast (Chinese)Joseph Kuo
 
唯品会大数据实践 Sacc pub
唯品会大数据实践 Sacc pub唯品会大数据实践 Sacc pub
唯品会大数据实践 Sacc pubChao Zhu
 
Hbase运维碎碎念
Hbase运维碎碎念Hbase运维碎碎念
Hbase运维碎碎念haiyuan ning
 

Tendances (20)

Hadoop系统及其关键技术
Hadoop系统及其关键技术Hadoop系统及其关键技术
Hadoop系统及其关键技术
 
Hadoop 設定與配置
Hadoop 設定與配置Hadoop 設定與配置
Hadoop 設定與配置
 
大資料趨勢介紹與相關使用技術
大資料趨勢介紹與相關使用技術大資料趨勢介紹與相關使用技術
大資料趨勢介紹與相關使用技術
 
Hadoop ecosystem - hadoop 生態系
Hadoop ecosystem - hadoop 生態系Hadoop ecosystem - hadoop 生態系
Hadoop ecosystem - hadoop 生態系
 
2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform Security2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform Security
 
Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結
 
Hadoop 0.20 程式設計
Hadoop 0.20 程式設計Hadoop 0.20 程式設計
Hadoop 0.20 程式設計
 
MapReduce 簡單介紹與練習
MapReduce 簡單介紹與練習MapReduce 簡單介紹與練習
MapReduce 簡單介紹與練習
 
淘宝Hadoop数据分析实践
淘宝Hadoop数据分析实践淘宝Hadoop数据分析实践
淘宝Hadoop数据分析实践
 
Distributed Data Analytics at Taobao
Distributed Data Analytics at TaobaoDistributed Data Analytics at Taobao
Distributed Data Analytics at Taobao
 
ClickHouse北京Meetup ClickHouse Best Practice @Sina
ClickHouse北京Meetup ClickHouse Best Practice @SinaClickHouse北京Meetup ClickHouse Best Practice @Sina
ClickHouse北京Meetup ClickHouse Best Practice @Sina
 
加速開發! 在Windows開發hadoop程式,直接運行 map/reduce
加速開發! 在Windows開發hadoop程式,直接運行 map/reduce加速開發! 在Windows開發hadoop程式,直接運行 map/reduce
加速開發! 在Windows開發hadoop程式,直接運行 map/reduce
 
Data Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouseData Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouse
 
Apache hadoop and cdh(cloudera distribution) introduction 基本介紹
Apache hadoop and cdh(cloudera distribution) introduction 基本介紹Apache hadoop and cdh(cloudera distribution) introduction 基本介紹
Apache hadoop and cdh(cloudera distribution) introduction 基本介紹
 
Zabbix in PPTV
Zabbix in PPTVZabbix in PPTV
Zabbix in PPTV
 
Hadoop的典型应用与企业化之路 for HBTC 2012
Hadoop的典型应用与企业化之路 for HBTC 2012Hadoop的典型应用与企业化之路 for HBTC 2012
Hadoop的典型应用与企业化之路 for HBTC 2012
 
Hadoop安裝 (1)
Hadoop安裝 (1)Hadoop安裝 (1)
Hadoop安裝 (1)
 
Establish The Core of Cloud Computing Application by Using Hazelcast (Chinese)
Establish The Core of  Cloud Computing Application  by Using Hazelcast (Chinese)Establish The Core of  Cloud Computing Application  by Using Hazelcast (Chinese)
Establish The Core of Cloud Computing Application by Using Hazelcast (Chinese)
 
唯品会大数据实践 Sacc pub
唯品会大数据实践 Sacc pub唯品会大数据实践 Sacc pub
唯品会大数据实践 Sacc pub
 
Hbase运维碎碎念
Hbase运维碎碎念Hbase运维碎碎念
Hbase运维碎碎念
 

En vedette

张振杰:大数据时代的隐私保护的挑战和机遇
张振杰:大数据时代的隐私保护的挑战和机遇张振杰:大数据时代的隐私保护的挑战和机遇
张振杰:大数据时代的隐私保护的挑战和机遇hdhappy001
 
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里li luo
 
Introduction to big data
Introduction to big dataIntroduction to big data
Introduction to big data邦宇 叶
 
大数据知识及技术简介(Introduction to basic concepts and techiques of big data in Chinese)
大数据知识及技术简介(Introduction to basic concepts and techiques of big data in Chinese)大数据知识及技术简介(Introduction to basic concepts and techiques of big data in Chinese)
大数据知识及技术简介(Introduction to basic concepts and techiques of big data in Chinese)Ye (Julia) Li
 
BDTC2015 小米-大数据和小米金融
BDTC2015 小米-大数据和小米金融BDTC2015 小米-大数据和小米金融
BDTC2015 小米-大数据和小米金融Jerry Wen
 
大数据漫谈-bilibili
大数据漫谈-bilibili大数据漫谈-bilibili
大数据漫谈-bilibili不持
 
BDTC2015 启明星辰-潘柱廷-中国大数据技术与产业发展报告
BDTC2015 启明星辰-潘柱廷-中国大数据技术与产业发展报告BDTC2015 启明星辰-潘柱廷-中国大数据技术与产业发展报告
BDTC2015 启明星辰-潘柱廷-中国大数据技术与产业发展报告Jerry Wen
 
HTTP2 and gRPC
HTTP2 and gRPCHTTP2 and gRPC
HTTP2 and gRPCGuo Jing
 
Building High Performance APIs In Go Using gRPC And Protocol Buffers
Building High Performance APIs In Go Using gRPC And Protocol BuffersBuilding High Performance APIs In Go Using gRPC And Protocol Buffers
Building High Performance APIs In Go Using gRPC And Protocol BuffersShiju Varghese
 

En vedette (9)

张振杰:大数据时代的隐私保护的挑战和机遇
张振杰:大数据时代的隐私保护的挑战和机遇张振杰:大数据时代的隐私保护的挑战和机遇
张振杰:大数据时代的隐私保护的挑战和机遇
 
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里
 
Introduction to big data
Introduction to big dataIntroduction to big data
Introduction to big data
 
大数据知识及技术简介(Introduction to basic concepts and techiques of big data in Chinese)
大数据知识及技术简介(Introduction to basic concepts and techiques of big data in Chinese)大数据知识及技术简介(Introduction to basic concepts and techiques of big data in Chinese)
大数据知识及技术简介(Introduction to basic concepts and techiques of big data in Chinese)
 
BDTC2015 小米-大数据和小米金融
BDTC2015 小米-大数据和小米金融BDTC2015 小米-大数据和小米金融
BDTC2015 小米-大数据和小米金融
 
大数据漫谈-bilibili
大数据漫谈-bilibili大数据漫谈-bilibili
大数据漫谈-bilibili
 
BDTC2015 启明星辰-潘柱廷-中国大数据技术与产业发展报告
BDTC2015 启明星辰-潘柱廷-中国大数据技术与产业发展报告BDTC2015 启明星辰-潘柱廷-中国大数据技术与产业发展报告
BDTC2015 启明星辰-潘柱廷-中国大数据技术与产业发展报告
 
HTTP2 and gRPC
HTTP2 and gRPCHTTP2 and gRPC
HTTP2 and gRPC
 
Building High Performance APIs In Go Using gRPC And Protocol Buffers
Building High Performance APIs In Go Using gRPC And Protocol BuffersBuilding High Performance APIs In Go Using gRPC And Protocol Buffers
Building High Performance APIs In Go Using gRPC And Protocol Buffers
 

Similaire à Hadoop-分布式数据平台

Hdfs introduction
Hdfs introductionHdfs introduction
Hdfs introductionbaggioss
 
What could hadoop do for us
What could hadoop do for us What could hadoop do for us
What could hadoop do for us Simon Hsu
 
推薦系統實作
推薦系統實作推薦系統實作
推薦系統實作FEG
 
HDInsight for Hadoopers
HDInsight for HadoopersHDInsight for Hadoopers
HDInsight for HadoopersKuo-Chun Su
 
應用Ceph技術打造軟體定義儲存新局
應用Ceph技術打造軟體定義儲存新局應用Ceph技術打造軟體定義儲存新局
應用Ceph技術打造軟體定義儲存新局Alex Lau
 
Hadoop大数据实践经验
Hadoop大数据实践经验Hadoop大数据实践经验
Hadoop大数据实践经验Hanborq Inc.
 
大规模数据处理
大规模数据处理大规模数据处理
大规模数据处理Kay Yan
 
大规模数据处理
大规模数据处理大规模数据处理
大规模数据处理airsex
 
Hdfs原理及实现
Hdfs原理及实现Hdfs原理及实现
Hdfs原理及实现baggioss
 
Hadoop与数据分析
Hadoop与数据分析Hadoop与数据分析
Hadoop与数据分析George Ang
 
Hadoop基础及hive入门
Hadoop基础及hive入门Hadoop基础及hive入门
Hadoop基础及hive入门haiwang
 
百度系统部分布式系统介绍 马如悦 Sacc2010
百度系统部分布式系统介绍 马如悦 Sacc2010百度系统部分布式系统介绍 马如悦 Sacc2010
百度系统部分布式系统介绍 马如悦 Sacc2010Chuanying Du
 
Paas研究介绍
Paas研究介绍Paas研究介绍
Paas研究介绍snakebbf
 
Big Java, Big Data
Big Java, Big DataBig Java, Big Data
Big Java, Big DataKuo-Chun Su
 
Hadoop基线选定
Hadoop基线选定Hadoop基线选定
Hadoop基线选定baggioss
 

Similaire à Hadoop-分布式数据平台 (20)

Hdfs
HdfsHdfs
Hdfs
 
Hdfs
HdfsHdfs
Hdfs
 
Hdfs introduction
Hdfs introductionHdfs introduction
Hdfs introduction
 
What could hadoop do for us
What could hadoop do for us What could hadoop do for us
What could hadoop do for us
 
Hadoop 介紹 20141024
Hadoop 介紹 20141024Hadoop 介紹 20141024
Hadoop 介紹 20141024
 
推薦系統實作
推薦系統實作推薦系統實作
推薦系統實作
 
HDInsight for Hadoopers
HDInsight for HadoopersHDInsight for Hadoopers
HDInsight for Hadoopers
 
IT03
IT03IT03
IT03
 
應用Ceph技術打造軟體定義儲存新局
應用Ceph技術打造軟體定義儲存新局應用Ceph技術打造軟體定義儲存新局
應用Ceph技術打造軟體定義儲存新局
 
Hadoop大数据实践经验
Hadoop大数据实践经验Hadoop大数据实践经验
Hadoop大数据实践经验
 
大规模数据处理
大规模数据处理大规模数据处理
大规模数据处理
 
大规模数据处理
大规模数据处理大规模数据处理
大规模数据处理
 
Hdfs原理及实现
Hdfs原理及实现Hdfs原理及实现
Hdfs原理及实现
 
H base云存储
H base云存储H base云存储
H base云存储
 
Hadoop与数据分析
Hadoop与数据分析Hadoop与数据分析
Hadoop与数据分析
 
Hadoop基础及hive入门
Hadoop基础及hive入门Hadoop基础及hive入门
Hadoop基础及hive入门
 
百度系统部分布式系统介绍 马如悦 Sacc2010
百度系统部分布式系统介绍 马如悦 Sacc2010百度系统部分布式系统介绍 马如悦 Sacc2010
百度系统部分布式系统介绍 马如悦 Sacc2010
 
Paas研究介绍
Paas研究介绍Paas研究介绍
Paas研究介绍
 
Big Java, Big Data
Big Java, Big DataBig Java, Big Data
Big Java, Big Data
 
Hadoop基线选定
Hadoop基线选定Hadoop基线选定
Hadoop基线选定
 

Hadoop-分布式数据平台