Árvores B

Árvores B
Átila Camurça
Samir Coutinho
Tunay Araújo
27 de junho de 2013

Sumary
1 Introdução
2 Motivação
3 Definição
4 Operações Básicas
5 Exemplo
6 Utilização
PostgreSQL
7 Referências

Introdução
Sabemos que em relação a memória de computador existe uma hierarquia
de velocidade de acesso, memórias cache e de registro são mais velozes
que memórias RAM, que são mais velozes que HDs.
Podemos utilizar algor´ıtmos que especificamente sejam rápidos ao acessar
HDs.

Motivação
Quando os dados são muito grandes para caber na memória principal,
eles devem se expandir para o disco. O acesso ao disco é muito custoso
em comparação com uma instrução t´ıpica. O número de acessos ao disco
vai preponderar o tempo de execução. O objetivo das Árvores B é criar
uma árvore de busca que irá minimizar os acessos ao disco.

Definição
Árvores B são árvores de pesquisa balanceadas projetadas
especificamente para serem armazanadas em discos magnéticos.
Medimos o desempenho pela quantidade de tempo de computação que
consomem, mas também pela quantidade de acesso a disco que são
realizadas.

Altura
O número de acessos ao disco é proporcional a altura da Árvore B.
O pior caso da altura de uma Árvore B é
h ≤ logt
n + 1
2
⇔ O(logt n)

Operações Básicas
Sempre mantemos a ra´ız na memória principal, assim um
DISK-READ da ra´ız nunca será necessário.
Qualquer nó passado como parâmetro já deve ter sofrido um
DISK-HEAD.
Qualquer nó deve ter mudado com um DISK-WRITE.

O número de execução de um algoritmo de árvores B é determinado,
principalmente, pelo número de operações DISK-WRITE e
DISK-READ.
A quantidade de acessos ao disco é diretamente proporcional ao
fator de ramificação.

1. B-TREE-SEARCH
2. B-TREE-INSERT
3. B-TREE-CREATE
4. B-TREE-DELETE

B-TREE-CREATE
Para construir árvores B utilizamos B-TREE-CREATE para criar um nó
raiz vazio e depois chamamos B-TREE-INSERT para adicionar novas
chaves. Ela exige O(1) operações de disco e tempo de CPU O(1).

B-TREE-INSERT
O número de acessos a disco de B-TREE-INSERT é O(h) pois
apenas O(1) operações disk-read/write são feitas entre duas
chamadas consecutivas de B-TREE-INSERT-NONFULL.
O tempo total de cpu é O(th) = O(t logt n).
Observação
o split na raiz é o unico jeito de aumentar a altura da árvore B. Ao
contrário das árvores binárias, o crescimento se dá na raiz em vez das
folhas.

Inserção de elemento (split)
A inserção nas árvores B é relativamente mais complicada, pois,
precisamos inserir a nova chave no nó correto da árvore, sem violar
suas propriedades.
Como procedemos se o nó está cheio?
Se estiver cheio deve separar (split) o nó em torno do elemento
mediano, criando outros dois nós que não violam as definições de
árvore.
O elemento mediano é promovido, passando a fazer parte do nó pai
daquele nó.

B-TREE-SPLIT-CHILD
A nova chave sempre é inserida em uma folha.
A inserção é feita em um único percurso na árvore, a partir da raiz
até uma das folhas.
O procedimento B-TREE-SPLIT-CHILD é usado para garantir que a
recursão nunca desça em um nó cheio.

B-TREE-INSERT-NONFULL
O código a seguir faz uso do procedimento
B-TREE-INSERT-NONFULL, que é responsável pela inserção da
chave em um nó n não cheio.
B-TREE-INSERT-NONFULL, insere a chave k no nó x, caso este
seja uma folha, caso contrário, procura o filho adequado e desce a
ele recursivamente até encontrar a folha onde deve inserir k.

B-TREE-DELETE
Caso 1: envolve deleção da chave de uma folha. Restando t − 1
chaves.
Caso 2: se a chave k estiver no nó x e x é um nó interno.
Caso 3: se a chave não estiver presente no nó interno x.

Utilização
Muitos sistemas de bancos de dados usam árvores B ou variações de
árvores B para armazenar informações.
Um deles é o PostgreSQL (http://www.postgresql.org/).

PostgreSQL
PostgreSQL usa árvores B nos seus ´ındices (INDEX). Índices são usados
primariamente para aumentar a performance do banco de dados.
Além de Árvores B o PostgreSQL oferece suporte a:
HASH
GiST (Generalized Search Tree)
SP-GiST (Space-Partitioned - Generalized Search Tree)
GIN (Generalized Inverted Index)

PostgreSQL
Árvores B são melhor utilizadas quando um ´ındice involve comparações
como <, <=, =, >=, >

Exemplo
PostgreSQL
CREATE TABLE not_indexed_table
(
id integer NOT NULL
)
WITH (
OIDS=FALSE
);
ALTER TABLE not_indexed_table
OWNER TO postgres;

Exemplo
PostgreSQL
CREATE TABLE indexed_table
(
id integer NOT NULL,
CONSTRAINT indexed_table_pkey PRIMARY KEY (id)
)
WITH (
OIDS=FALSE
);
ALTER TABLE indexed_table
OWNER TO postgres;

Exemplo
PostgreSQL
INSERT INTO not_indexed_table (id)
SELECT GENERATE_SERIES(1, 100000);
INSERT INTO indexed_table (id)
SELECT GENERATE_SERIES(1, 100000);

Exemplo
PostgreSQL
EXPLAIN ANALYZE SELECT COUNT(*) FROM not_indexed_table;
-- sa´ıda
Aggregate (cost=1572.00..1572.01 rows=1 width=0)
(actual time=73.198..73.198 rows=1 loops=1)
-> Seq Scan on not_indexed_table
(cost=0.00..1336.20 rows=94320 width=0)
Total runtime: 73.239 ms

Exemplo
PostgreSQL
EXPLAIN ANALYZE SELECT COUNT(*) FROM indexed_table;
-- sa´ıda
Aggregate (cost=1643.00..1643.01 rows=1 width=0)
-> Seq Scan on indexed_table
(cost=0.00..1393.00 rows=100000 width=0)

Exemplo
PostgreSQL
EXPLAIN ANALYZE SELECT * FROM not_indexed_table
WHERE id < 12;
-- sa´ıda
Seq Scan on not_indexed_table
(cost=0.00..1643.00 rows=10 width=4)
Filter: (id < 12)
Rows Removed by Filter: 99989

Exemplo
PostgreSQL
EXPLAIN ANALYZE SELECT * FROM indexed_table
WHERE id < 12;
-- sa´ıda
Index Only Scan using indexed_table_pkey
on indexed_table
(cost=0.00..8.45 rows=11 width=4)
Index Cond: (id < 12)
Heap Fetches: 11

Exemplo
PostgreSQL
Tabela Tamanho
not indexed table 3168 kB
indexed table 4936 kB

PostgreSQL
Da documentação do PostgreSQL:
Adding a primary key will automatically create a unique btree
index on the column or group of columns used in the primary
key.
Adicionando uma chave primária irá automaticamente criar uma Árvore B
de ´ındice único na coluna ou grupo de colunas usadas na chave primária.
http:
//www.postgresql.org/docs/9.0/static/ddl-constraints.html

Referências
http://www.depesz.com/2010/09/09/
why-is-my-index-not-being-used/
http://www.thegeekstuff.com/2009/05/
15-advanced-postgresql-commands-with-examples/
http://ats.oka.nu/b-tree/b-tree.manual.html
http://www.postgresql.org/docs/9.0/static/
ddl-constraints.html
T. Cormen, C. Leiserson, R. Rivest, C. Stein, Algoritmos - Teoria e
Prática, 2002
http:
//www.lcad.icmc.usp.br/ñonato/ED/B_arvore/btree.htm
http://www.di.ufpb.br/lucidio/Btrees.pdf

Árvores B

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Semelhante a Árvores B

Semelhante a Árvores B (20)

Mais de Átila Camurça

Mais de Átila Camurça (12)

Árvores B