SlideShare une entreprise Scribd logo
1  sur  26
Indexation de données
SS tree
• Demba SYLLA
• Rachid TALBI
Contexte

Indexation multidimensionnelle des données

multimédia

1
Introduction
Multimédia
• Arrivée des CD_ROM (1980) apparition du mot multimédia
• Il désignait les applications qui pouvait utiliser ou piloter différents
médias simultanément.

• Recherche informatique : mutlimédia  l’étude des média non textuels

Images , Vidéos, Son

2
Introduction
Base de données multimédia (MMDB)

• Initialement traitées comme des BD standards:
– Objet multimédia ↔ un seul item : champ d’une BDDR

– Recherche sur mots clés.
– Utilisation des relation entre objet.
– Recherche sur les mots dans les pages web (http://images.google.com)

3
Introduction
Spécificités des MMDB
• L’information portée par le multimédia est tout ce qui peut venir du
monde réel, alors que l’information portée par une base de données
classique ne peut être qu’une représentation symbolique de faits
limités a l’univers de la base de données.

•Le développeur d’une MMDB ne peut expliciter tous les aspects
des données qui seront importants pour l’utilisateur.

Informations

4
Introduction
Spécificités des MMDB
• Ex de requête impossible avec un SGDB “classique”:
récupérer toutes les images “qui ressemblent” à une image requête ??

•Besoin de recherche d’information sur le contenu des objets, non pas
sur leurs attributs. (recherche approximative/par contenu )

5
Introduction
Spécificités des MMDB
• Ex de requête impossible avec un SGDB “classique”:
récupérer toutes les images “qui ressemblent” à une image requête ??

•Besoin de recherche d’information sur le contenu des objets, non pas
sur leurs attributs. (recherche approximative/par contenu )

6
Indexation
• Décrire les images par leurs contenu à l’aide des descripteurs
relatifs aux indices visuels (couleurs, forme, texture,…).
Image BD

Indices
visuels

Descripteurs

Vecteur caractéristique

Couleur

Forme

V

Texture

7
Recherche approximative /par similarité
• L’idée clé dans la recherche de média est la recherche approximative
• Utilise la notion de proximité, de similarité, de distance entre objets

 Retrouver les vecteurs similaires à un vecteur de requête au sens
d’une mesure de similarité (distance entre eux)

8
Distance et mesure de similarité
• Avoir un outil quantitatif pour répondre à la question:
Est-ce que deux entités X et Y se ressemblent ?
• comparer des entités obtenir un scalaire indiquant la
proximité de ces entités

9
Distance
• Une distance d sur un ensemble E de vecteurs est une
application dans R+ vérifiant les axiomes suivantes:
 Séparation : d(x,y)=0 ↔ x=y
 Symétrie: d(x,y)=d(y,x)
 Inégalité triangulaire : d(x,z)<= d(x,y)+d(y,z)

10
Distance
• La similarité est basée sur la notion de distance entre deux points x, y:
 Distance euclidienne:
d(x,y) =

 Distance X2: pour comparer deux distributions

11
Approches de recherche par similarité
• Recherche à Ɛ près: (par intervalle)

V5

V3

Q (q,ε )= { v∈ BD/ sim(q,v) < ε }
q
V2

V4

V1

12
Approche de recherche par similarité
• Recherche des K plus proches voisins :
V5

V3

q
V2
V1

V4

K=2

13
Le SS-tree

• Arbre de recherche par similarité
 basé sur des sphères qui englobes les objets
 Le centre de la sphère est le centre de gravité des points

14
Le SS-tree

Utilisation de sphères
Centre d’une sphère=
centre De gravité des
points englobés

Représentation multidimensionnelle

15
Le SS-tree

représentation de l'arbre utilisé dans la mémoire
ou sur le disque

16
Le SS-tree
• Maintien le nombre des points dans les sous arbres
• La sphère représentée par son centre et le rayon
Avantages:
 Moins d’espace que le rectangle (R*-tree)
 Fanout plus élevé en raison du fait que l’espace de stockage requis est
plus petit

17
Le SS-tree
Avantages:
 Moins d’espace que le rectangle (R*-tree)
 Fanout plus élevé en raison du fait que l’espace de stockage requis est
plus petit

Inconvénients:
 SS-tree comporte plus de volume que le R-tree, ce qui augmente la
quantité de chevauchement

18
SR-tree

Idéalement, un noeud d'index devrait combiner l’espace de
stockage petit du SS-tree avec le volume petit du R *-tree,
d’où le SR-tree

19
SR-tree
• Utilise les sphères de délimitation du SS-tree et les rectangles
englobant du R-tree

20
SR-tree
• Le nœud d’index est l’intersection de ces deux

21
SR-tree
• Le nœud d’index est l’intersection de ces deux

22
SR-tree

Sur mémoire

23
SR-tree
• Structures:
 Nœud d'index maintient explicitement à la fois

o sphère délimitant
o rectangle englobant
 Center est barycentre pondéré de nœuds enfants
 Le rayon est le minimum des distances maximales de

o Sphères englobant des nœuds enfants
o Rectangles de délimitation de nœuds enfants

24
Questions ??

Contenu connexe

Tendances

Cours HBase et Base de Données Orientées Colonnes (HBase, Column Oriented Dat...
Cours HBase et Base de Données Orientées Colonnes (HBase, Column Oriented Dat...Cours HBase et Base de Données Orientées Colonnes (HBase, Column Oriented Dat...
Cours HBase et Base de Données Orientées Colonnes (HBase, Column Oriented Dat...Hatim CHAHDI
 
Techniques du data mining
Techniques du data miningTechniques du data mining
Techniques du data miningDonia Hammami
 
BigData_Chp5: Putting it all together
BigData_Chp5: Putting it all togetherBigData_Chp5: Putting it all together
BigData_Chp5: Putting it all togetherLilia Sfaxi
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataLilia Sfaxi
 
Cours fouille de donn+®es part1
Cours fouille de donn+®es part1Cours fouille de donn+®es part1
Cours fouille de donn+®es part1Amani Baklouti
 
Business Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseBusiness Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseAlexandre Equoy
 
Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture Lilia Sfaxi
 
Introduction au big data
Introduction au big dataIntroduction au big data
Introduction au big dataAbdelghani Azri
 
BigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceBigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceLilia Sfaxi
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQLLilia Sfaxi
 
Introduction à la big data V2
Introduction à la big data V2Introduction à la big data V2
Introduction à la big data V2Mehdi TAZI
 
Présentation des bases de données NoSql
Présentation des bases de données NoSqlPrésentation des bases de données NoSql
Présentation des bases de données NoSqlSidi LEKHALIFA
 
La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?Jean-Marc Dupont
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business IntelligenceLilia Sfaxi
 
Introduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniquesIntroduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniquesIsmail CHAIB
 
Hadoop and friends : introduction
Hadoop and friends : introductionHadoop and friends : introduction
Hadoop and friends : introductionfredcons
 
Cours Big Data Chap3
Cours Big Data Chap3Cours Big Data Chap3
Cours Big Data Chap3Amal Abid
 

Tendances (20)

Cours HBase et Base de Données Orientées Colonnes (HBase, Column Oriented Dat...
Cours HBase et Base de Données Orientées Colonnes (HBase, Column Oriented Dat...Cours HBase et Base de Données Orientées Colonnes (HBase, Column Oriented Dat...
Cours HBase et Base de Données Orientées Colonnes (HBase, Column Oriented Dat...
 
Techniques du data mining
Techniques du data miningTechniques du data mining
Techniques du data mining
 
BigData_Chp5: Putting it all together
BigData_Chp5: Putting it all togetherBigData_Chp5: Putting it all together
BigData_Chp5: Putting it all together
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
 
Cours fouille de donn+®es part1
Cours fouille de donn+®es part1Cours fouille de donn+®es part1
Cours fouille de donn+®es part1
 
Business Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseBusiness Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouse
 
Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture
 
Chp3 - ESB
Chp3 - ESBChp3 - ESB
Chp3 - ESB
 
Data Mining
Data MiningData Mining
Data Mining
 
Introduction au big data
Introduction au big dataIntroduction au big data
Introduction au big data
 
BigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceBigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-Reduce
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQL
 
Introduction à la big data V2
Introduction à la big data V2Introduction à la big data V2
Introduction à la big data V2
 
Présentation des bases de données NoSql
Présentation des bases de données NoSqlPrésentation des bases de données NoSql
Présentation des bases de données NoSql
 
Une Introduction à Hadoop
Une Introduction à HadoopUne Introduction à Hadoop
Une Introduction à Hadoop
 
La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Introduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniquesIntroduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniques
 
Hadoop and friends : introduction
Hadoop and friends : introductionHadoop and friends : introduction
Hadoop and friends : introduction
 
Cours Big Data Chap3
Cours Big Data Chap3Cours Big Data Chap3
Cours Big Data Chap3
 

En vedette

SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...
SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...
SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...Conférence IC 2009
 
Présentation1 grammaire textuelle
Présentation1 grammaire textuellePrésentation1 grammaire textuelle
Présentation1 grammaire textuelleelhachimiabdelhak
 
La femme-grillagee
La femme-grillageeLa femme-grillagee
La femme-grillageecdt34400
 
Conferencia Y Festival San Sebastián de Los Ballesteros en Cataluña
Conferencia Y Festival San Sebastián de Los Ballesteros en CataluñaConferencia Y Festival San Sebastián de Los Ballesteros en Cataluña
Conferencia Y Festival San Sebastián de Los Ballesteros en Cataluñacosasdeandalucia
 
Bloque de novedades y anuncios
Bloque de novedades y anunciosBloque de novedades y anuncios
Bloque de novedades y anunciosjuanjoreverte
 
IV eBook turismo 2.0, marketing y empresa de Hosteltur
IV eBook turismo 2.0, marketing y empresa de HostelturIV eBook turismo 2.0, marketing y empresa de Hosteltur
IV eBook turismo 2.0, marketing y empresa de HostelturHosteltur
 
L'avenir de Java : Erlang, Haskell ou Ruby
L'avenir de Java : Erlang, Haskell ou RubyL'avenir de Java : Erlang, Haskell ou Ruby
L'avenir de Java : Erlang, Haskell ou RubyMarc Bojoly
 
Connected Commerce by DigitasLBI
Connected Commerce by DigitasLBIConnected Commerce by DigitasLBI
Connected Commerce by DigitasLBIPhilippe Dumont
 
Reporting multi site - toutes vos donnees en un clic
Reporting multi site - toutes vos donnees en un clicReporting multi site - toutes vos donnees en un clic
Reporting multi site - toutes vos donnees en un clicAT Internet
 
F Otos Y Sabiduria
F Otos Y SabiduriaF Otos Y Sabiduria
F Otos Y Sabiduriaguesta6167d
 
Ameublement et crédit : analyse du marché
Ameublement et crédit : analyse du marchéAmeublement et crédit : analyse du marché
Ameublement et crédit : analyse du marchéCA Consumer Finance
 
Webinar campañas efectivas
Webinar campañas efectivasWebinar campañas efectivas
Webinar campañas efectivasMasterBase®
 
Relais De Croissance ExtéRieure
Relais De Croissance ExtéRieureRelais De Croissance ExtéRieure
Relais De Croissance ExtéRieureSully Médiations
 
Charla Violencia Escolar
Charla Violencia EscolarCharla Violencia Escolar
Charla Violencia Escolarchiquian
 

En vedette (20)

SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...
SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...
SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...
 
Présentation1 grammaire textuelle
Présentation1 grammaire textuellePrésentation1 grammaire textuelle
Présentation1 grammaire textuelle
 
Text mining
Text miningText mining
Text mining
 
Textmining Introduction
Textmining IntroductionTextmining Introduction
Textmining Introduction
 
La femme-grillagee
La femme-grillageeLa femme-grillagee
La femme-grillagee
 
gradle_nantesjug
gradle_nantesjuggradle_nantesjug
gradle_nantesjug
 
Conferencia Y Festival San Sebastián de Los Ballesteros en Cataluña
Conferencia Y Festival San Sebastián de Los Ballesteros en CataluñaConferencia Y Festival San Sebastián de Los Ballesteros en Cataluña
Conferencia Y Festival San Sebastián de Los Ballesteros en Cataluña
 
Bloque de novedades y anuncios
Bloque de novedades y anunciosBloque de novedades y anuncios
Bloque de novedades y anuncios
 
IV eBook turismo 2.0, marketing y empresa de Hosteltur
IV eBook turismo 2.0, marketing y empresa de HostelturIV eBook turismo 2.0, marketing y empresa de Hosteltur
IV eBook turismo 2.0, marketing y empresa de Hosteltur
 
L'avenir de Java : Erlang, Haskell ou Ruby
L'avenir de Java : Erlang, Haskell ou RubyL'avenir de Java : Erlang, Haskell ou Ruby
L'avenir de Java : Erlang, Haskell ou Ruby
 
Connected Commerce by DigitasLBI
Connected Commerce by DigitasLBIConnected Commerce by DigitasLBI
Connected Commerce by DigitasLBI
 
Reporting multi site - toutes vos donnees en un clic
Reporting multi site - toutes vos donnees en un clicReporting multi site - toutes vos donnees en un clic
Reporting multi site - toutes vos donnees en un clic
 
F Otos Y Sabiduria
F Otos Y SabiduriaF Otos Y Sabiduria
F Otos Y Sabiduria
 
Ameublement et crédit : analyse du marché
Ameublement et crédit : analyse du marchéAmeublement et crédit : analyse du marché
Ameublement et crédit : analyse du marché
 
Webinar campañas efectivas
Webinar campañas efectivasWebinar campañas efectivas
Webinar campañas efectivas
 
Planeta Web2
Planeta Web2Planeta Web2
Planeta Web2
 
Relais De Croissance ExtéRieure
Relais De Croissance ExtéRieureRelais De Croissance ExtéRieure
Relais De Croissance ExtéRieure
 
Charla Violencia Escolar
Charla Violencia EscolarCharla Violencia Escolar
Charla Violencia Escolar
 
Synthese complexite entreprises 2011
Synthese complexite entreprises 2011Synthese complexite entreprises 2011
Synthese complexite entreprises 2011
 
Chacao digital
Chacao digitalChacao digital
Chacao digital
 

Similaire à SS tree (par SYLLA Demba et TALBI Rachid)

Introduction aux bases de données
Introduction aux bases de donnéesIntroduction aux bases de données
Introduction aux bases de donnéesAbdoulaye Dieng
 
Base de Données Chapitre I .pptx
Base de Données Chapitre I .pptxBase de Données Chapitre I .pptx
Base de Données Chapitre I .pptxAbdoulayeTraore48
 
Diaporamas-Bases de données.pdf
Diaporamas-Bases de données.pdfDiaporamas-Bases de données.pdf
Diaporamas-Bases de données.pdfEST-UMI de Meknès
 
Devoir Final dans No Sql Base de donnée avec corrigé
Devoir Final dans No Sql Base de donnée avec corrigéDevoir Final dans No Sql Base de donnée avec corrigé
Devoir Final dans No Sql Base de donnée avec corrigéRimaDaqch
 
Les entrepôts de données ou comment rendre les données trouvables accessibles...
Les entrepôts de données ou comment rendre les données trouvables accessibles...Les entrepôts de données ou comment rendre les données trouvables accessibles...
Les entrepôts de données ou comment rendre les données trouvables accessibles...Desconnets Jean-Christophe
 
Base de données graphe et Neo4j
Base de données graphe et Neo4jBase de données graphe et Neo4j
Base de données graphe et Neo4jBoris Guarisma
 
Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques ...
Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques ...Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques ...
Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques ...SCD Université Côte d'Azur
 
Avec le langage R, prenez de la hauteur dans l’analyse de vos données !
Avec le langage R, prenez de la hauteur dans l’analyse de vos données ! Avec le langage R, prenez de la hauteur dans l’analyse de vos données !
Avec le langage R, prenez de la hauteur dans l’analyse de vos données ! Yi YANG
 

Similaire à SS tree (par SYLLA Demba et TALBI Rachid) (10)

Introduction aux bases de données
Introduction aux bases de donnéesIntroduction aux bases de données
Introduction aux bases de données
 
Base de Données Chapitre I .pptx
Base de Données Chapitre I .pptxBase de Données Chapitre I .pptx
Base de Données Chapitre I .pptx
 
Diaporamas-Bases de données.pdf
Diaporamas-Bases de données.pdfDiaporamas-Bases de données.pdf
Diaporamas-Bases de données.pdf
 
Devoir Final dans No Sql Base de donnée avec corrigé
Devoir Final dans No Sql Base de donnée avec corrigéDevoir Final dans No Sql Base de donnée avec corrigé
Devoir Final dans No Sql Base de donnée avec corrigé
 
Les entrepôts de données ou comment rendre les données trouvables accessibles...
Les entrepôts de données ou comment rendre les données trouvables accessibles...Les entrepôts de données ou comment rendre les données trouvables accessibles...
Les entrepôts de données ou comment rendre les données trouvables accessibles...
 
Base de données graphe et Neo4j
Base de données graphe et Neo4jBase de données graphe et Neo4j
Base de données graphe et Neo4j
 
BDRO.pdf
BDRO.pdfBDRO.pdf
BDRO.pdf
 
Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques ...
Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques ...Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques ...
Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques ...
 
R-Lab-1-ppt.pdf
R-Lab-1-ppt.pdfR-Lab-1-ppt.pdf
R-Lab-1-ppt.pdf
 
Avec le langage R, prenez de la hauteur dans l’analyse de vos données !
Avec le langage R, prenez de la hauteur dans l’analyse de vos données ! Avec le langage R, prenez de la hauteur dans l’analyse de vos données !
Avec le langage R, prenez de la hauteur dans l’analyse de vos données !
 

Plus de rchbeir

Web ontologie language (par RAFEH Aya et VAILLEUX Arnaud)
Web ontologie language (par RAFEH Aya et VAILLEUX Arnaud)Web ontologie language (par RAFEH Aya et VAILLEUX Arnaud)
Web ontologie language (par RAFEH Aya et VAILLEUX Arnaud)rchbeir
 
Ranking (par IBRAHIM Sirine et TANIOS Dany)
Ranking (par IBRAHIM Sirine et TANIOS	 Dany)Ranking (par IBRAHIM Sirine et TANIOS	 Dany)
Ranking (par IBRAHIM Sirine et TANIOS Dany)rchbeir
 
Crawlers (par DE COURCHELLE Inès et JACOB Sophie)
Crawlers (par DE COURCHELLE Inès et JACOB Sophie)Crawlers (par DE COURCHELLE Inès et JACOB Sophie)
Crawlers (par DE COURCHELLE Inès et JACOB Sophie)rchbeir
 
Quad-Tree et Kd-Tree (par MARQUES Patricia et OLIVIER Aymeric)
Quad-Tree et Kd-Tree (par MARQUES Patricia et OLIVIER Aymeric)Quad-Tree et Kd-Tree (par MARQUES Patricia et OLIVIER Aymeric)
Quad-Tree et Kd-Tree (par MARQUES Patricia et OLIVIER Aymeric)rchbeir
 
NoSQL (par HEGUY Xabier)
NoSQL (par HEGUY Xabier)NoSQL (par HEGUY Xabier)
NoSQL (par HEGUY Xabier)rchbeir
 
Mpeg7 et comm ontology (par MOHIBE Amine et BENSLIMANE Mohamed-Amine)
Mpeg7 et comm ontology (par MOHIBE Amine et BENSLIMANE Mohamed-Amine)Mpeg7 et comm ontology (par MOHIBE Amine et BENSLIMANE Mohamed-Amine)
Mpeg7 et comm ontology (par MOHIBE Amine et BENSLIMANE Mohamed-Amine)rchbeir
 
LSI latent (par HATOUM Saria et DONGO ESCALANTE Irvin Franco)
LSI latent (par HATOUM Saria et DONGO ESCALANTE Irvin Franco)LSI latent (par HATOUM Saria et DONGO ESCALANTE Irvin Franco)
LSI latent (par HATOUM Saria et DONGO ESCALANTE Irvin Franco)rchbeir
 
Arbre b (par EL HACHEM Marwan et RICHA Elias)
Arbre b (par EL HACHEM Marwan et RICHA Elias)Arbre b (par EL HACHEM Marwan et RICHA Elias)
Arbre b (par EL HACHEM Marwan et RICHA Elias)rchbeir
 
Adaptative hypermedia (par MALKI Sara et MAKSIMOVICH Aleksandra)
Adaptative hypermedia (par MALKI Sara et MAKSIMOVICH Aleksandra)Adaptative hypermedia (par MALKI Sara et MAKSIMOVICH Aleksandra)
Adaptative hypermedia (par MALKI Sara et MAKSIMOVICH Aleksandra)rchbeir
 
Information Retrieval
Information RetrievalInformation Retrieval
Information Retrievalrchbeir
 

Plus de rchbeir (13)

Web ontologie language (par RAFEH Aya et VAILLEUX Arnaud)
Web ontologie language (par RAFEH Aya et VAILLEUX Arnaud)Web ontologie language (par RAFEH Aya et VAILLEUX Arnaud)
Web ontologie language (par RAFEH Aya et VAILLEUX Arnaud)
 
Ranking (par IBRAHIM Sirine et TANIOS Dany)
Ranking (par IBRAHIM Sirine et TANIOS	 Dany)Ranking (par IBRAHIM Sirine et TANIOS	 Dany)
Ranking (par IBRAHIM Sirine et TANIOS Dany)
 
Crawlers (par DE COURCHELLE Inès et JACOB Sophie)
Crawlers (par DE COURCHELLE Inès et JACOB Sophie)Crawlers (par DE COURCHELLE Inès et JACOB Sophie)
Crawlers (par DE COURCHELLE Inès et JACOB Sophie)
 
Quad-Tree et Kd-Tree (par MARQUES Patricia et OLIVIER Aymeric)
Quad-Tree et Kd-Tree (par MARQUES Patricia et OLIVIER Aymeric)Quad-Tree et Kd-Tree (par MARQUES Patricia et OLIVIER Aymeric)
Quad-Tree et Kd-Tree (par MARQUES Patricia et OLIVIER Aymeric)
 
NoSQL (par HEGUY Xabier)
NoSQL (par HEGUY Xabier)NoSQL (par HEGUY Xabier)
NoSQL (par HEGUY Xabier)
 
Mpeg7 et comm ontology (par MOHIBE Amine et BENSLIMANE Mohamed-Amine)
Mpeg7 et comm ontology (par MOHIBE Amine et BENSLIMANE Mohamed-Amine)Mpeg7 et comm ontology (par MOHIBE Amine et BENSLIMANE Mohamed-Amine)
Mpeg7 et comm ontology (par MOHIBE Amine et BENSLIMANE Mohamed-Amine)
 
LSI latent (par HATOUM Saria et DONGO ESCALANTE Irvin Franco)
LSI latent (par HATOUM Saria et DONGO ESCALANTE Irvin Franco)LSI latent (par HATOUM Saria et DONGO ESCALANTE Irvin Franco)
LSI latent (par HATOUM Saria et DONGO ESCALANTE Irvin Franco)
 
Arbre b (par EL HACHEM Marwan et RICHA Elias)
Arbre b (par EL HACHEM Marwan et RICHA Elias)Arbre b (par EL HACHEM Marwan et RICHA Elias)
Arbre b (par EL HACHEM Marwan et RICHA Elias)
 
Adaptative hypermedia (par MALKI Sara et MAKSIMOVICH Aleksandra)
Adaptative hypermedia (par MALKI Sara et MAKSIMOVICH Aleksandra)Adaptative hypermedia (par MALKI Sara et MAKSIMOVICH Aleksandra)
Adaptative hypermedia (par MALKI Sara et MAKSIMOVICH Aleksandra)
 
Information Retrieval
Information RetrievalInformation Retrieval
Information Retrieval
 
Plsql2
Plsql2Plsql2
Plsql2
 
Plsql
PlsqlPlsql
Plsql
 
Sql3
Sql3Sql3
Sql3
 

SS tree (par SYLLA Demba et TALBI Rachid)

  • 1. Indexation de données SS tree • Demba SYLLA • Rachid TALBI
  • 3. Introduction Multimédia • Arrivée des CD_ROM (1980) apparition du mot multimédia • Il désignait les applications qui pouvait utiliser ou piloter différents médias simultanément. • Recherche informatique : mutlimédia  l’étude des média non textuels Images , Vidéos, Son 2
  • 4. Introduction Base de données multimédia (MMDB) • Initialement traitées comme des BD standards: – Objet multimédia ↔ un seul item : champ d’une BDDR – Recherche sur mots clés. – Utilisation des relation entre objet. – Recherche sur les mots dans les pages web (http://images.google.com) 3
  • 5. Introduction Spécificités des MMDB • L’information portée par le multimédia est tout ce qui peut venir du monde réel, alors que l’information portée par une base de données classique ne peut être qu’une représentation symbolique de faits limités a l’univers de la base de données. •Le développeur d’une MMDB ne peut expliciter tous les aspects des données qui seront importants pour l’utilisateur. Informations 4
  • 6. Introduction Spécificités des MMDB • Ex de requête impossible avec un SGDB “classique”: récupérer toutes les images “qui ressemblent” à une image requête ?? •Besoin de recherche d’information sur le contenu des objets, non pas sur leurs attributs. (recherche approximative/par contenu ) 5
  • 7. Introduction Spécificités des MMDB • Ex de requête impossible avec un SGDB “classique”: récupérer toutes les images “qui ressemblent” à une image requête ?? •Besoin de recherche d’information sur le contenu des objets, non pas sur leurs attributs. (recherche approximative/par contenu ) 6
  • 8. Indexation • Décrire les images par leurs contenu à l’aide des descripteurs relatifs aux indices visuels (couleurs, forme, texture,…). Image BD Indices visuels Descripteurs Vecteur caractéristique Couleur Forme V Texture 7
  • 9. Recherche approximative /par similarité • L’idée clé dans la recherche de média est la recherche approximative • Utilise la notion de proximité, de similarité, de distance entre objets  Retrouver les vecteurs similaires à un vecteur de requête au sens d’une mesure de similarité (distance entre eux) 8
  • 10. Distance et mesure de similarité • Avoir un outil quantitatif pour répondre à la question: Est-ce que deux entités X et Y se ressemblent ? • comparer des entités obtenir un scalaire indiquant la proximité de ces entités 9
  • 11. Distance • Une distance d sur un ensemble E de vecteurs est une application dans R+ vérifiant les axiomes suivantes:  Séparation : d(x,y)=0 ↔ x=y  Symétrie: d(x,y)=d(y,x)  Inégalité triangulaire : d(x,z)<= d(x,y)+d(y,z) 10
  • 12. Distance • La similarité est basée sur la notion de distance entre deux points x, y:  Distance euclidienne: d(x,y) =  Distance X2: pour comparer deux distributions 11
  • 13. Approches de recherche par similarité • Recherche à Ɛ près: (par intervalle) V5 V3 Q (q,ε )= { v∈ BD/ sim(q,v) < ε } q V2 V4 V1 12
  • 14. Approche de recherche par similarité • Recherche des K plus proches voisins : V5 V3 q V2 V1 V4 K=2 13
  • 15. Le SS-tree • Arbre de recherche par similarité  basé sur des sphères qui englobes les objets  Le centre de la sphère est le centre de gravité des points 14
  • 16. Le SS-tree Utilisation de sphères Centre d’une sphère= centre De gravité des points englobés Représentation multidimensionnelle 15
  • 17. Le SS-tree représentation de l'arbre utilisé dans la mémoire ou sur le disque 16
  • 18. Le SS-tree • Maintien le nombre des points dans les sous arbres • La sphère représentée par son centre et le rayon Avantages:  Moins d’espace que le rectangle (R*-tree)  Fanout plus élevé en raison du fait que l’espace de stockage requis est plus petit 17
  • 19. Le SS-tree Avantages:  Moins d’espace que le rectangle (R*-tree)  Fanout plus élevé en raison du fait que l’espace de stockage requis est plus petit Inconvénients:  SS-tree comporte plus de volume que le R-tree, ce qui augmente la quantité de chevauchement 18
  • 20. SR-tree Idéalement, un noeud d'index devrait combiner l’espace de stockage petit du SS-tree avec le volume petit du R *-tree, d’où le SR-tree 19
  • 21. SR-tree • Utilise les sphères de délimitation du SS-tree et les rectangles englobant du R-tree 20
  • 22. SR-tree • Le nœud d’index est l’intersection de ces deux 21
  • 23. SR-tree • Le nœud d’index est l’intersection de ces deux 22
  • 25. SR-tree • Structures:  Nœud d'index maintient explicitement à la fois o sphère délimitant o rectangle englobant  Center est barycentre pondéré de nœuds enfants  Le rayon est le minimum des distances maximales de o Sphères englobant des nœuds enfants o Rectangles de délimitation de nœuds enfants 24