More Related Content
Similar to 알고 쓰자! HBase | Devon 2012
Similar to 알고 쓰자! HBase | Devon 2012 (20)
알고 쓰자! HBase | Devon 2012
- 16. 부족한 기능에 대한 보완
Endpoint: Group-by Operator
Observer: Secondary Index
- 17. Group-by Operator
select c1, c2, count(v1) from tab group by c1, c2;
Configuration conf = HBaseConfiguration.create();
GroupByClient client = new GroupByClient(conf);
long queryID = client.aggregate("tab", "d:c1,d:c2", "count(d:v1)");
GroupByClient.printResult(queryID);
- 19. Group-by Operator
Performance
9 Region Servers. 24GB RAM. 4Cores(with HT). 4 HDDs
1억 건. 8.6GB(Snappy. 압축율 약 28%)
(단위: 초)
800
640
600
400 GroupBy
Count(shell)
200
38
0
Duration
- 22. Secondary Index
Dual Write
Observer를 이용한 구현
클라이언트는 코드 수정이 필요 없음
부하를 많이 주었을 때 문제 발생해서 보류
- 23. Secondary Index
Dual Write
HIndexedTable extends HTable
Override put/scan method
- 26. Secondary Index
Scan Performance
9 Region Servers. 24GB RAM. 4Cores(with HT). 4 HDDs
1억 건. 8.6GB(Snappy. 압축율 약 28%)
(단위: 초)
400
308
300
200 172
100
7 1
0
Filtered Scan 1% 0.10% 0.01%
(w/o index)
- 31. Durability
다수 노드 장애 시
데이터 복구 불가능할 수 있음
UPS, queue & snapshot
- 34. Q&A
유응섭
rspeed@daumcorp.com