O documento descreve um projeto europeu (Net-WMS) para integrar realidade virtual e técnicas de otimização em sistemas de gestão de armazéns. O projeto envolveu várias empresas e instituições de investigação. O documento também discute como as colónias de formigas podem inspirar novas abordagens para melhorar os resultados de pesquisa na web, tendo em conta a semântica da pesquisa e a experiência de navegação de outros utilizadores.
3. Wide Scope – The Company Concept
Net-WMS
European-funded project (FP6) for integrating Virtual Reality //
http:ms.
and optimization techniques in a new generation of Networked
businesses in Warehouse Management Systems under net-w .org
ercim
constraints.
» PSA – Peugeot Citroen (France)
» FIAT – Research Centre (Italy)
» Wide Scope (Portugal)
» KLS Optim (France)
» Mind2Biz (Turkey)
» CEA – Commisariat Energie Atomique (France)
» SICS – Swedish Institute Computer Science (Sweden)
» INRIA (France)
» École des Mines de Nantes (France)
» ERCIM – W3C (France)
Page 3
4. Optimização de pesquisas Web
utilizando Colónias de Formigas
Pedro Gomes, Filipe Carvalho
Page 4
5. Pesquisa Web – Case Study
Pesquisa:
Expressão “404 Error – Page
not found”
Resultados (~7.660.000):
Nas 6 primeiras posições
temos 5 “páginas não
encontradas” e 1 explicação
Wikipedia.
Page 5
6. Pesquisa Web - Case Study
Página 2:
Mais do mesmo...
Page 6
7. Pesquisa Web – Case Study
Mas ao longo das várias páginas de resultados
surgem alguns links interessantes ....
pag. 1
pag. 2
pag. 2
pag. 3
Page 7
8. Porquê, porquê, porquê ?
Question 1
- Porque surgem tantos resultados desinteressantes e apenas alguns relevantes
para aquilo que pretendo encontrar ?
- ... devo refinar a pesquisa ?
- ... procurar noutro site ?
- ... navegar de página para página a partir de um link que pareça interessante (e.g.,
wikipedia) ?
Question 2
- Porque não estão logo na primeira página todos os resultados interessantes
que encontrei espalhados por várias páginas ?
Page 8
9. State-of-the-art
Os resultados de uma pesquisa são
devolvidos em função de duas
dimensões:
• a sintaxe textual da “query”
• a “importância” de cada página
enquadrada no contexto da pesquisa
(PageRank)
Resultados = Sintaxe + Ranking
Page 9
10. State-of-the-art
Os resultados de uma pesquisa são
devolvidos em função de duas
dimensões:
“PageRank is defined as follows:
• a sintaxe textual dahas pages T1...Tn which point to it
We assume page A “query”
(i.e., are citations).
The parameter d is a damping factor which can be set
• o ranking de cada página set d to 0.85.
between 0 and 1. We usually
enquadrada is defined as the number of links going out of page A.
Also C(A) no contexto da pesquisa
The PageRank of a page A is given as follows:
PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))“
In The Anatomy of a Large-Scale Hypertextual Web Search Engine,
Sergey Brin and Lawrence Page,
Computer Science Department, Stanford University, 1998
Page 10
11. Introdução da semântica
Com “semântica de uma pesquisa”
referimo-nos ao que o utilizador pretende
encontrar;
A semântica está além dos caractéres
utilizados numa expressão de pesquisa
ou na relevância que outros sites
atribuem a cada resultado.
Resultados = Sintaxe + Semântica + Ranking
Page 11
12. Introdução da semântica
Question:
Como saber o significado da pesquisa
para além dos caractéres utilizados ?
Question:
Como saber que um resultado é
relevante para essa semântica
independentemente do seu PageRank ?
Page 12
14. Behaviour of real ants
Real ants are capable of finding the shortest path from a food source
to the nest without using visual cues.
Also, they are capable of adapting to changes in the environment,
for example finding a new shortest path once the old one is no
longer feasible due to a new obstacle
Page 14
15. Behaviour of real ants
Ants deposit a certain amount of pheromone while walking, and
each ant probabilistically prefers to follow a direction rich in
pheromone rather than a poorer one.
This elementary behavior of real ants can be used to explain how
they can find the shortest path which reconnects a broken line after
the sudden appearance of an unexpected obstacle has interrupted
the initial path.
Page 15
16. Behaviour of real ants
In fact, once the obstacle has appeared, those ants which are just in
front of the obstacle cannot continue to follow the pheromone trail
and therefore they have to choose between turning right or left.
In this situation we can expect half the ants to choose to turn right
and the other half to turn left. The very same situation can be found
on the other side of the obstacle.
Page 16
17. Behaviour of real ants
Those ants which choose, by chance, the shorter path around the
obstacle will more rapidly reconstitute the interrupted pheromone
trail compared to those which choose the longer path.
The shorter path will receive a higher amount of pheromone in the
time unit and this will in turn cause a higher number of ants to
choose the shorter path. Due to this positive feedback
(autocatalytic) process, very soon all the ants will choose the
shorter path
Page 17
18. Modelação matemática
Em cada nodo i, a desejabilidade de passar para j é determinada em
função da visibilidade (i -> j) e da quantidade de feromona entre (i ->
j).
O troço i->j será seguido com uma probabilidade proporcional à sua
desejabilidade, tal como qualquer outro nodo destino k.
Page 18
19. Modelação matemática
Em cada nodo i, a desejabilidade de passar para j é determinada em
função da probabilidade de passarede i para j no instantedeéferomona entre (i ->
A visibilidade (i -> j) da quantidade p
j). directamente proporcional à feromona (τ) depositada entre i e j
e à visibilidade/ desejabilidade (η) de passar para j.
O troço i->j será seguido com uma probabilidade proporcional à sua
desejabilidade, tal como qualquer outro nodo destino k.
Page 19
20. Feromonas nas pesquisas
“404
Error -
Page Not
Found”
Pag 1 Pag 2 Pag 3
Ao navegar de página em página de resultados e ao seleccionar
alguns links de interesse nessas páginas, estamos a delinear um
trilho de feromonas sobre o que achámos interessante e, ao mesmo
tempo, a mostrar que alguns tópicos não são interessantes,
ignorando-os.
Page 20
21. Mapeamento Ants/Utilizadores
Para cada pesquisa i, a desejabilidade de mostrar o resultado j é
determinada em função do PageRank de j e da quantidade de
feromona entre i e j.
Desta forma, a ordem dos resultados baseia-se no PageRank de
cada página e na experiência prévia de navegação de outros
utilizadores, em função do mesmo critério de pesquisa.
Page 21
22. Mapeamento Ants/Utilizadores
Para cada pesquisa i, a desejabilidade de mostrar o resultado j é
determinada emdo resultado j em função da pesquisa da quantidadeéde
A ordem função do PageRank de j e por i no instante p
feromona entre i e j.
directamente proporcional à feromona (τ) depositada entre i e j
e ao PageRank (η) de j.
Desta forma, a ordem dos resultados baseia-se no PageRank de
cada página e na experiência prévia de navegação de outros
utilizadores, em função do mesmo critério de pesquisa.
Page 22
24. Conclusões
Os resultados de pesquisas web podem incluir mais informação do
que apenas a relevância que outros sites lhe atribuem;
Essa informação é baseada na experiência de navegação que outros
utilizadores revelaram em função de critérios de pesquisa
semelhantes;
A informação sobre a desejabilidade de cada resultado é mantida
por um sistema autocatalítico de passagem de informação
- As feromonas evaporam com o tempo;
- Os troços mais seleccionados são promovidos naturalmente e reforçada a sua
feromona;
- Os troços menos seleccionados afundam-se cada vez mais nas páginas de
resultados;
Page 24