Meethadoop

Overview ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Thinking at scale ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

What we need? Job data data data

Apache Hadoop is an open source Java software framework for running data-intensive applications on large clusters of commodity hardware. Hadoop

Two components ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Hadoop Distributed Filesystem HDFS, the Hadoop Distributed File System, is a distributed file system designed to hold very large amounts of data (terabytes or even petabytes), and provide high-throughput access to this information.

HDFS:Motivation ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Assumptions ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

HDFS Design ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

HDFS Design ,[object Object],[object Object],[object Object],[object Object],[object Object]

Hdfs NameNode Hdfs DataNode Hdfs DataNode Hdfs aware application Posix API HDFS API Hdfs view Network Stack Regular filesystem Specific drivers.. HDFS Client Block Diagram Client computer

HDFS Architecture ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

HDFS: Handling Failures ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Hadoop MapReduce Map Reduce is a programming model and an associated implementation for processing and generating large data sets.

Map/Reduce Programming Model ,[object Object],[object Object],[object Object]

Map ,[object Object],[object Object]

Example: Upper-case Mapperlet ,[object Object],[object Object],[object Object],[object Object]

Reduce ,[object Object],[object Object],[object Object]

Example: Sum Reducer ,[object Object],[object Object]

MapReduce DataFlow Example:Word Count Hi,how are you? Iam good Hello Hello how are you? Not so good Are 1 hi 1 how 1 you 1 Are 1 Hello 1 Hello 1 how 1 you 1 Are 2 Hello 2 Hi 1 how 2 you 2 Are[1 1] Hello[1 1] Hi[1] how[1 1] you[1 1] Map Reduce Input Intermediate results Output merged Sorted

Parallelism ,[object Object],[object Object],[object Object],[object Object]

Combining Phase ,[object Object],[object Object],[object Object],[object Object],[object Object]

Hadoop Map-Reduce Architecture ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Hadoop Map-Reduce Architecture ,[object Object],[object Object],[object Object]

MapReduce: Client ,[object Object],[object Object],[object Object]

Meethadoop

Recommandé

Recommandé

Contenu connexe

Tendances

Tendances (20)

En vedette

En vedette (8)

Similaire à Meethadoop

Similaire à Meethadoop (20)

Meethadoop