SlideShare a Scribd company logo
1 of 25
ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΑΠΟΔΟΣΗΣ ΤΟΥ
ΜΗΧΑΝΙΣΜΟΥ ΔΙΑΣΧΙΣΗΣ ΤΟΥ ΔΙΑΔΙΚΤΥΟΥ
ΜΕ ΒΑΣΗ ΤΟ ΣΗΜΑΣΙΟΛΟΓΙΚΟ ΠΕΡΙΕΧΟΜΕΝΟ
ΚΑΡΒΟΥΝΗΣ ΕΥΑΓΓΕΛΟΣ
υπό την επίβλεψη του
κ. Συμεωνίδη Ανδρέα
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ
ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ
ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ
ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ
ΕΡΓΑΣΤΗΡΙΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΠΛΗΡΟΦΟΡΙΩΝ ΚΑΙ ΥΠΟΛΟΓΙΣΜΩΝ
Σκοπός διπλωματικής
• Κατανόηση τρόπου λειτουργίας των
Μηχανισμών Διάσχισης του Διαδικτύου
• Επιλογή Apache Nutch
– Δοκιμή σε ιστοσελίδες
– Ανάλυση αποτελεσμάτων
– Εξοικείωση με αλγόριθμο βαθμολόγησης OPIC
• Δημιουργία του SpiTag
– Δίνει βαρύτητα στα metatags των σελίδων
– Βαθμολόγηση με βάση το σημασιολογικό
περιεχόμενο
• Σύγκριση SpiTag-Nutch
2
Υπόθεση
• Μεγαλύτερο πλήθος σημασιολογικού
περιεχομένου  Μεγαλύτερη αξία της
ιστοσελίδας
• Περισσότερες και πλουσιότερες ιστοσελίδες
που παραπέμπουν σε μία ιστοσελίδα 
Μεγαλύτερη αξία της ιστοσελίδας
• Επισκεπτόμαστε σημασιολογικά
πλουσιότερες ιστοσελίδες;;;
3
Σημασιολογικός Ιστός
• Semantic Web / Web 3.0
• Δημιούργημα του Tim Berners-Lee, 2001
• Δεδομένα που μπορούν να καταλάβουν και οι
μηχανές
• eXtensible Markup Language - XML
• Resource Description Framework – RDF
• Ontologies
4
Μηχανισμοί Διάσχισης του
Διαδικτύου
• Web Crawlers ή Spiders
• Ο Matthew Gray το 1993 δημιούργησε τον
πρώτο και ονομάστηκε World Wide Web
Wanderer
• Λειτουργία
– Επισκέπτονται τις ιστοσελίδες
– Κατεβάζουν το περιεχόμενό τους
– Το αποθηκεύουν σε τοπικό αποθηκευτικό χώρο
5
Ταξινόμηση Μηχανισμών Διάσχισης
Crawlers
Περιοχή
κάλυψης
Unfocused
Crawler
Focused Crawler
Ευελιξία Mobile Crawler
Συγκεκριμένης
διεύθυνσης
Διαδικτύου
Topic Specific
Crawler
Ontology Based
/ Semantic
Based Crawler
Διανομή
φορτίου
Intra-Site
Parallel Crawler
Distributed
Crawler
6
Μηχανισμοί Διάσχισης του
Διαδικτύου
• Δημοφιλέστεροι
– Apache Nutch
– WebSPHINX
– Mercator
– BingBot
– BioCrawler
– Slug
– OntoCrawler
7
Προσθήκη
ιστοσελίδων
στην Ουρά
Επεξεργασίας
Επιλογή μίας
ιστοσελίδας
από την Ουρά
Επεξεργασίας
Ανάκτηση –
Fetch της
ιστοσελίδας
Ανάλυση –
Parse της
ιστοσελίδας
Προσθήκη
αποτελεσμάτων
στην Ουρά
Επεξεργασίας
Επιλογή
αρχικών
ιστοσελίδων Επανέλαβε μέχρι να αδειάσει
η Ουρά Επεξεργασίας
Τυπικός
κύκλος
λειτουργίας
ενός Web
Crawler
8
Γιατί Apache Nutch
• Ανοιχτού κώδικα γραμμένος σε Java
• Επεκτάσιμος
• Διανεμημένος
– Διανεμημένο Σύστημα Αρχείων (NDFS)
– Μοντέλο MapReduce
• Βαθμολόγηση σύμφωνα με αλγόριθμο OPIC
– Μεταβλητές “μετρητά”, “ιστορικό μετρητών”
9
Μοντέλο MapReduce
• Προγραμματιστικό μοντέλο
• Παράλληλη Επεξεργασία Προβλημάτων
• Χρησιμοποιεί μεγάλο αριθμό υπολογιστών
•Διαδικασία Map()
i. Ο κόμβος-άρχοντας συλλέγει τα
δεδομένα
ii. Τα διαιρεί σε υπο-προβλήματα
iii. Τα μοιράζει στους κόμβους-
εργάτες
iv. Οι κόμβοι-εργάτες τα
επεξεργάζονται και ενημερώνουν
τον κόμβο-άρχοντα
•Διαδικασία Reduce()
i. Ο κόμβος-άρχοντας συλλέγει
τα αποτελέσματα από όλους
τους κόμβους-εργάτες
ii. Τα συνδυάζει κατάλληλα
ώστε να σχηματίσει το
τελικό αποτέλεσμα
10
Κύκλος Crawling του Nutch
i. Εισαγωγή αρχικών
ιστοσελίδων
ii. Παραγωγή (΄Generate΄)
 topN: Επιλογή Ν ιστοσελίδων με
την υψηλότερη βαθμολογία
iii. Ανάκτηση (΄Fetch΄)
iv. Ανάλυση (΄Parse΄)
v. Ανανέωση Βάσης
Δεδομένων (΄Update
Database΄)
vi. Εάν δεν τελείωσε,
πήγαινε στο βήμα ii
Παραγωγή
Ανάκτηση
Ανάλυση
Ανανέωση
Βάσης
Δεδομένων
Εισαγωγή
ιστοσελίδων /
seed.txt
11
SpiTag
• Νέος Μηχανισμός Διάσχισης του Διαδικτύου
• Spi(der) και (meta)Tag
• Βασισμένος στον Apache Nutch 2.2.1
• Αλλαγές
– Παραγωγή
• Βαθμολόγηση ιστοσελίδων που επιλέγονται για ανάκτηση
– Ανάλυση ιστοσελίδων
• Άντληση των metatags
• Καταμέτρηση των metatags
– Ανανέωση Βάσης Δεδομένων
• Βαθμολόγηση ιστοσελίδων
12
Στόχοι
• Βαθμολόγηση ιστοσελίδων με βάση το περιεχόμενο τους
• Επίσκεψη ιστοσελίδων με πλουσιότερο περιεχόμενο
• Καταμέτρηση και αποθήκευση των metatags του περιεχομένου
i. Image Tags
ii. Video Tags
iii. Meta Name
iv. Meta Property
v. Meta Equiv
vi. Meta Item Property
vii. Twitter Tags
viii. Facebook Tags
ix. Script
x. Rel
13
• Βαθμολογία ιστοσελίδας που
αναλύθηκε
– Άντληση των μετρητών των metatags
– Άντληση των βαρών των metatags
– Υπολογισμός βαθμολογίας
𝜄=1
𝑛
( 𝑊𝑒𝑖𝑔ℎ𝑡 ∗ 𝑁𝑢𝑚𝑏𝑒𝑟𝑂𝑓𝑀𝑒𝑡𝑎𝑡𝑎𝑔𝑠)
όπου i = ο αριθμός των metatags που εξετάζουμε,
0 ≤ Weight ≤ 1
Βαθμολόγηση
• Βαθμολογία ιστοσελίδας-
παιδιού
𝑖=1
𝑛
𝑆𝑐𝑜𝑟𝑒𝑂𝑓𝑃𝑎𝑟𝑒𝑛𝑡𝑠
𝑁𝑢𝑚𝑏𝑒𝑟𝑂𝑓𝑃𝑎𝑟𝑒𝑛𝑡𝑠
όπου i = ο αριθμός γονέων της νεοεισερχόμενης
σελίδας
14
Σύνολο Πειραμάτων
Πειράματα Nutch SpiTag SpiTagVSNutch
Αριθμός αρχικών
ιστοσελίδων
4 9 6
Πειράματα σε κάθε
ιστοσελίδα
15 3 2
Διάρκεια
πειράματος
30 λεπτά – 5 ώρες 24 – 62 ώρες 12-24 ώρες
15
• Ubuntu Linux 13.04
• 4 GB RAM
• 6 Mbps
• MySQL
• Χρόνος μεταξύ 2 αιτημάτων στον ίδιο
server: 5 δευτερόλεπτα
Επίπεδο 1
Επίπεδο 2
Επίπεδο 3
Επίπεδο 4
Φόρμα Γραφικής Διεπαφής
16
Πειράματα με χρήση SpiTag
www.dailymail.co.uk
www.sourceforge.net
www.gamespot.com
www.gametrailers.com
17
Πειράματα με χρήση SpiTag
Κανονικοποιημένα διαγράμματα βαθμολογίας για
www.dailymail.co.uk
18
SpiTag VS Nutch
• Στόχος: Αντικειμενική Σύγκριση
• Κοινές συνθήκες λειτουργίας
A. Οι ιστοσελίδες φιλτράρονται με βάση το domain
name τους
B. Οι ιστοσελίδες φιλτράρονται με βάση την επέκτασή
τους
C. Επιλέχθηκαν έξι αρχικές ιστοσελίδες
• Προσφέρουν διακύμανση στο σημασιολογικό
περιεχόμενο
D. Επίπεδο ανάλυσης = 8 έως 10
E. Ιστοσελίδες ανά επίπεδο = 500
19
Σύγκριση SpiTag - Nutch
-100,000
0
100,000
200,000
300,000
400,000
500,000
600,000
1 2 3 4 5 6 7 8 9 10
DailyMail Uefa Weather Wired Telegraph Guardian
Διάγραμμα διαφοράς του αθροίσματος των metatags ανά επίπεδο
20
Σύγκριση SpiTag - Nutch
Διάγραμμα διαφοράς % του αθροίσματος των metatags ανά επίπεδο
-60%
-40%
-20%
0%
20%
40%
60%
80%
1 2 3 4 5 6 7 8 9 10
DailyMail Uefa Weather Wired Telegraph Guardian
21
Σύγκριση SpiTag - Nutch
Διάγραμμα διαφοράς % του μέσου όρου του αθροίσματος των metatags ανά
επίπεδο
-60%
-40%
-20%
0%
20%
40%
60%
80%
1 2 3 4 5 6 7 8 9 10
DailyMail Uefa Weather Wired Telegraph Guardian
22
Σύγκριση SpiTag - Nutch
SpiTag Nutch Διαφορά
Σύνολο metatag 4,576,134 2,634,496
1,941,638
73.70%
Ιστότοποι που
αναλύθηκαν
34,315 35,022
Μέσος όρος
metatag ανά
ιστότοπο
133.3 75.22
58.13
77.21%
23
Συμπεράσματα
• Επίσκεψη ιστότοπων με περισσότερα
metatags
• Διακύμανση ανάλογα με τον ιστότοπο και το
επίπεδο
• Ικανοποιητική διαφορά σε απόλυτους
αριθμούς και σε ποσοστό %
24
ΣΑΣ ΕΥΧΑΡΙΣΤΩ ΓΙΑ ΤΗΝ ΠΡΟΣΟΧΗ ΣΑΣ
25

More Related Content

Viewers also liked

Χαρίτων Καραμήτας 5755
Χαρίτων Καραμήτας 5755Χαρίτων Καραμήτας 5755
Χαρίτων Καραμήτας 5755ISSEL
 
Κλέαρχος Θωμόπουλος 7435
Κλέαρχος Θωμόπουλος 7435Κλέαρχος Θωμόπουλος 7435
Κλέαρχος Θωμόπουλος 7435ISSEL
 
Κωνσταντίνος Σιδέρης 7254
Κωνσταντίνος Σιδέρης 7254Κωνσταντίνος Σιδέρης 7254
Κωνσταντίνος Σιδέρης 7254ISSEL
 
Σωτήριος Αγγελής
Σωτήριος ΑγγελήςΣωτήριος Αγγελής
Σωτήριος ΑγγελήςISSEL
 
Ζακιά Αλαουί Τζαμαλί
Ζακιά Αλαουί ΤζαμαλίΖακιά Αλαουί Τζαμαλί
Ζακιά Αλαουί ΤζαμαλίISSEL
 
Λυκάρτσης Ιωάννης
Λυκάρτσης ΙωάννηςΛυκάρτσης Ιωάννης
Λυκάρτσης ΙωάννηςISSEL
 
Νούτσος Αντώνης 6992
Νούτσος Αντώνης 6992Νούτσος Αντώνης 6992
Νούτσος Αντώνης 6992ISSEL
 
Ιωάννης Αντωνιάδης 7137
Ιωάννης Αντωνιάδης 7137Ιωάννης Αντωνιάδης 7137
Ιωάννης Αντωνιάδης 7137ISSEL
 
Κωνσταντίνος Παπαγγέλου 7498
Κωνσταντίνος Παπαγγέλου 7498 Κωνσταντίνος Παπαγγέλου 7498
Κωνσταντίνος Παπαγγέλου 7498 ISSEL
 
Ναταλία Μιχαηλίδου
Ναταλία ΜιχαηλίδουΝαταλία Μιχαηλίδου
Ναταλία ΜιχαηλίδουISSEL
 
Δούμας Οδυσσέας 7168
Δούμας Οδυσσέας 7168Δούμας Οδυσσέας 7168
Δούμας Οδυσσέας 7168ISSEL
 
Αλεξάνδρα Μπαλτζή 7485
Αλεξάνδρα Μπαλτζή 7485Αλεξάνδρα Μπαλτζή 7485
Αλεξάνδρα Μπαλτζή 7485ISSEL
 
Βασίλειος Λώλης 5638
Βασίλειος Λώλης 5638Βασίλειος Λώλης 5638
Βασίλειος Λώλης 5638ISSEL
 

Viewers also liked (13)

Χαρίτων Καραμήτας 5755
Χαρίτων Καραμήτας 5755Χαρίτων Καραμήτας 5755
Χαρίτων Καραμήτας 5755
 
Κλέαρχος Θωμόπουλος 7435
Κλέαρχος Θωμόπουλος 7435Κλέαρχος Θωμόπουλος 7435
Κλέαρχος Θωμόπουλος 7435
 
Κωνσταντίνος Σιδέρης 7254
Κωνσταντίνος Σιδέρης 7254Κωνσταντίνος Σιδέρης 7254
Κωνσταντίνος Σιδέρης 7254
 
Σωτήριος Αγγελής
Σωτήριος ΑγγελήςΣωτήριος Αγγελής
Σωτήριος Αγγελής
 
Ζακιά Αλαουί Τζαμαλί
Ζακιά Αλαουί ΤζαμαλίΖακιά Αλαουί Τζαμαλί
Ζακιά Αλαουί Τζαμαλί
 
Λυκάρτσης Ιωάννης
Λυκάρτσης ΙωάννηςΛυκάρτσης Ιωάννης
Λυκάρτσης Ιωάννης
 
Νούτσος Αντώνης 6992
Νούτσος Αντώνης 6992Νούτσος Αντώνης 6992
Νούτσος Αντώνης 6992
 
Ιωάννης Αντωνιάδης 7137
Ιωάννης Αντωνιάδης 7137Ιωάννης Αντωνιάδης 7137
Ιωάννης Αντωνιάδης 7137
 
Κωνσταντίνος Παπαγγέλου 7498
Κωνσταντίνος Παπαγγέλου 7498 Κωνσταντίνος Παπαγγέλου 7498
Κωνσταντίνος Παπαγγέλου 7498
 
Ναταλία Μιχαηλίδου
Ναταλία ΜιχαηλίδουΝαταλία Μιχαηλίδου
Ναταλία Μιχαηλίδου
 
Δούμας Οδυσσέας 7168
Δούμας Οδυσσέας 7168Δούμας Οδυσσέας 7168
Δούμας Οδυσσέας 7168
 
Αλεξάνδρα Μπαλτζή 7485
Αλεξάνδρα Μπαλτζή 7485Αλεξάνδρα Μπαλτζή 7485
Αλεξάνδρα Μπαλτζή 7485
 
Βασίλειος Λώλης 5638
Βασίλειος Λώλης 5638Βασίλειος Λώλης 5638
Βασίλειος Λώλης 5638
 

Similar to Καρβούνης Ευάγγελος

Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων για την Εξαγωγή Προτύπων Διόρθωσης σε Σφ...
Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων για την Εξαγωγή Προτύπων Διόρθωσης σε Σφ...Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων για την Εξαγωγή Προτύπων Διόρθωσης σε Σφ...
Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων για την Εξαγωγή Προτύπων Διόρθωσης σε Σφ...ISSEL
 
Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...
Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...
Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...ISSEL
 
Panagiotis Doxopoulos
Panagiotis DoxopoulosPanagiotis Doxopoulos
Panagiotis DoxopoulosISSEL
 
Evangelos Papathomas: Semantic Code Search in Software Repositories using Neu...
Evangelos Papathomas: Semantic Code Search in Software Repositories using Neu...Evangelos Papathomas: Semantic Code Search in Software Repositories using Neu...
Evangelos Papathomas: Semantic Code Search in Software Repositories using Neu...Manos Tsardoulias
 
Evangelos papathomas diploma thesis presentation
Evangelos papathomas diploma thesis presentationEvangelos papathomas diploma thesis presentation
Evangelos papathomas diploma thesis presentationISSEL
 
Konstantinos Koukoutegos Diploma Thesis Presentation
Konstantinos Koukoutegos Diploma Thesis PresentationKonstantinos Koukoutegos Diploma Thesis Presentation
Konstantinos Koukoutegos Diploma Thesis PresentationISSEL
 
Βασίλης Μπούντρης
Βασίλης ΜπούντρηςΒασίλης Μπούντρης
Βασίλης ΜπούντρηςISSEL
 
Angelos kaltsikis
Angelos kaltsikisAngelos kaltsikis
Angelos kaltsikisISSEL
 
Τεχνολογίες_Διαδικτύου.pdf
Τεχνολογίες_Διαδικτύου.pdfΤεχνολογίες_Διαδικτύου.pdf
Τεχνολογίες_Διαδικτύου.pdfssuser9421c7
 
Θεμιστοκλής Παπαβασιλείου
Θεμιστοκλής ΠαπαβασιλείουΘεμιστοκλής Παπαβασιλείου
Θεμιστοκλής ΠαπαβασιλείουISSEL
 
DEEP WEB DYNAMICS: ΕΝΤΟΠΙΣΜΟΣ, ΠΡΟΣΒΑΣΗ ΚΑΙ ΚΑΤΑΓΡΑΦΗ ΕΞΕΛΙΚΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ...
DEEP WEB DYNAMICS: ΕΝΤΟΠΙΣΜΟΣ, ΠΡΟΣΒΑΣΗ ΚΑΙ ΚΑΤΑΓΡΑΦΗ ΕΞΕΛΙΚΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ...DEEP WEB DYNAMICS: ΕΝΤΟΠΙΣΜΟΣ, ΠΡΟΣΒΑΣΗ ΚΑΙ ΚΑΤΑΓΡΑΦΗ ΕΞΕΛΙΚΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ...
DEEP WEB DYNAMICS: ΕΝΤΟΠΙΣΜΟΣ, ΠΡΟΣΒΑΣΗ ΚΑΙ ΚΑΤΑΓΡΑΦΗ ΕΞΕΛΙΚΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ...Aggelos Tzani
 
Giannopoulos Nikolaos: Ανάπτυξη Τεχνικών Εξατομίκευσης Διαφημιστικών Προβολών...
Giannopoulos Nikolaos: Ανάπτυξη Τεχνικών Εξατομίκευσης Διαφημιστικών Προβολών...Giannopoulos Nikolaos: Ανάπτυξη Τεχνικών Εξατομίκευσης Διαφημιστικών Προβολών...
Giannopoulos Nikolaos: Ανάπτυξη Τεχνικών Εξατομίκευσης Διαφημιστικών Προβολών...Manos Tsardoulias
 
Όλγα Βρούσγου
Όλγα Βρούσγου Όλγα Βρούσγου
Όλγα Βρούσγου ISSEL
 
Creating an Open Archival Information System compliant archive for CERN
Creating an Open Archival Information System compliant archive for CERNCreating an Open Archival Information System compliant archive for CERN
Creating an Open Archival Information System compliant archive for CERNISSEL
 
Δημιουργία ενός Ανοιχτού Αρχειακού Πληροφοριακού Συστήματος για το CERN
Δημιουργία ενός Ανοιχτού Αρχειακού Πληροφοριακού Συστήματος για το CERNΔημιουργία ενός Ανοιχτού Αρχειακού Πληροφοριακού Συστήματος για το CERN
Δημιουργία ενός Ανοιχτού Αρχειακού Πληροφοριακού Συστήματος για το CERNISSEL
 
Εφαρµογή Τεχνικών Μηχανικής Μάθησης για την Ανάλυση Αλλαγών Κώδικα µε στόχο τ...
Εφαρµογή Τεχνικών Μηχανικής Μάθησης για την Ανάλυση Αλλαγών Κώδικα µε στόχο τ...Εφαρµογή Τεχνικών Μηχανικής Μάθησης για την Ανάλυση Αλλαγών Κώδικα µε στόχο τ...
Εφαρµογή Τεχνικών Μηχανικής Μάθησης για την Ανάλυση Αλλαγών Κώδικα µε στόχο τ...ISSEL
 
Konstantinos Papadopoulos Diploma Thesis presenation
Konstantinos Papadopoulos Diploma Thesis presenationKonstantinos Papadopoulos Diploma Thesis presenation
Konstantinos Papadopoulos Diploma Thesis presenationISSEL
 
Κεφ 3 - Υλικό - Εφαρμογές Υπολογιστών
Κεφ 3 - Υλικό - Εφαρμογές ΥπολογιστώνΚεφ 3 - Υλικό - Εφαρμογές Υπολογιστών
Κεφ 3 - Υλικό - Εφαρμογές Υπολογιστώνleftos21
 
Συλλογή Μεταφορά και Έλεγχος Δεδομένων Θεωρία κεφ. 6 Βιβλίο ΣΜΕΔ
Συλλογή Μεταφορά και Έλεγχος Δεδομένων Θεωρία κεφ. 6 Βιβλίο ΣΜΕΔΣυλλογή Μεταφορά και Έλεγχος Δεδομένων Θεωρία κεφ. 6 Βιβλίο ΣΜΕΔ
Συλλογή Μεταφορά και Έλεγχος Δεδομένων Θεωρία κεφ. 6 Βιβλίο ΣΜΕΔTheodoros Leftheroudis
 

Similar to Καρβούνης Ευάγγελος (20)

Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων για την Εξαγωγή Προτύπων Διόρθωσης σε Σφ...
Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων για την Εξαγωγή Προτύπων Διόρθωσης σε Σφ...Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων για την Εξαγωγή Προτύπων Διόρθωσης σε Σφ...
Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων για την Εξαγωγή Προτύπων Διόρθωσης σε Σφ...
 
Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...
Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...
Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...
 
Panagiotis Doxopoulos
Panagiotis DoxopoulosPanagiotis Doxopoulos
Panagiotis Doxopoulos
 
Evangelos Papathomas: Semantic Code Search in Software Repositories using Neu...
Evangelos Papathomas: Semantic Code Search in Software Repositories using Neu...Evangelos Papathomas: Semantic Code Search in Software Repositories using Neu...
Evangelos Papathomas: Semantic Code Search in Software Repositories using Neu...
 
Evangelos papathomas diploma thesis presentation
Evangelos papathomas diploma thesis presentationEvangelos papathomas diploma thesis presentation
Evangelos papathomas diploma thesis presentation
 
Konstantinos Koukoutegos Diploma Thesis Presentation
Konstantinos Koukoutegos Diploma Thesis PresentationKonstantinos Koukoutegos Diploma Thesis Presentation
Konstantinos Koukoutegos Diploma Thesis Presentation
 
Βασίλης Μπούντρης
Βασίλης ΜπούντρηςΒασίλης Μπούντρης
Βασίλης Μπούντρης
 
Angelos kaltsikis
Angelos kaltsikisAngelos kaltsikis
Angelos kaltsikis
 
Τεχνολογίες_Διαδικτύου.pdf
Τεχνολογίες_Διαδικτύου.pdfΤεχνολογίες_Διαδικτύου.pdf
Τεχνολογίες_Διαδικτύου.pdf
 
Θεμιστοκλής Παπαβασιλείου
Θεμιστοκλής ΠαπαβασιλείουΘεμιστοκλής Παπαβασιλείου
Θεμιστοκλής Παπαβασιλείου
 
DEEP WEB DYNAMICS: ΕΝΤΟΠΙΣΜΟΣ, ΠΡΟΣΒΑΣΗ ΚΑΙ ΚΑΤΑΓΡΑΦΗ ΕΞΕΛΙΚΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ...
DEEP WEB DYNAMICS: ΕΝΤΟΠΙΣΜΟΣ, ΠΡΟΣΒΑΣΗ ΚΑΙ ΚΑΤΑΓΡΑΦΗ ΕΞΕΛΙΚΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ...DEEP WEB DYNAMICS: ΕΝΤΟΠΙΣΜΟΣ, ΠΡΟΣΒΑΣΗ ΚΑΙ ΚΑΤΑΓΡΑΦΗ ΕΞΕΛΙΚΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ...
DEEP WEB DYNAMICS: ΕΝΤΟΠΙΣΜΟΣ, ΠΡΟΣΒΑΣΗ ΚΑΙ ΚΑΤΑΓΡΑΦΗ ΕΞΕΛΙΚΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ...
 
Giannopoulos Nikolaos: Ανάπτυξη Τεχνικών Εξατομίκευσης Διαφημιστικών Προβολών...
Giannopoulos Nikolaos: Ανάπτυξη Τεχνικών Εξατομίκευσης Διαφημιστικών Προβολών...Giannopoulos Nikolaos: Ανάπτυξη Τεχνικών Εξατομίκευσης Διαφημιστικών Προβολών...
Giannopoulos Nikolaos: Ανάπτυξη Τεχνικών Εξατομίκευσης Διαφημιστικών Προβολών...
 
Όλγα Βρούσγου
Όλγα Βρούσγου Όλγα Βρούσγου
Όλγα Βρούσγου
 
Creating an Open Archival Information System compliant archive for CERN
Creating an Open Archival Information System compliant archive for CERNCreating an Open Archival Information System compliant archive for CERN
Creating an Open Archival Information System compliant archive for CERN
 
Δημιουργία ενός Ανοιχτού Αρχειακού Πληροφοριακού Συστήματος για το CERN
Δημιουργία ενός Ανοιχτού Αρχειακού Πληροφοριακού Συστήματος για το CERNΔημιουργία ενός Ανοιχτού Αρχειακού Πληροφοριακού Συστήματος για το CERN
Δημιουργία ενός Ανοιχτού Αρχειακού Πληροφοριακού Συστήματος για το CERN
 
Εφαρµογή Τεχνικών Μηχανικής Μάθησης για την Ανάλυση Αλλαγών Κώδικα µε στόχο τ...
Εφαρµογή Τεχνικών Μηχανικής Μάθησης για την Ανάλυση Αλλαγών Κώδικα µε στόχο τ...Εφαρµογή Τεχνικών Μηχανικής Μάθησης για την Ανάλυση Αλλαγών Κώδικα µε στόχο τ...
Εφαρµογή Τεχνικών Μηχανικής Μάθησης για την Ανάλυση Αλλαγών Κώδικα µε στόχο τ...
 
Konstantinos Papadopoulos Diploma Thesis presenation
Konstantinos Papadopoulos Diploma Thesis presenationKonstantinos Papadopoulos Diploma Thesis presenation
Konstantinos Papadopoulos Diploma Thesis presenation
 
Κεφ 3 - Υλικό - Εφαρμογές Υπολογιστών
Κεφ 3 - Υλικό - Εφαρμογές ΥπολογιστώνΚεφ 3 - Υλικό - Εφαρμογές Υπολογιστών
Κεφ 3 - Υλικό - Εφαρμογές Υπολογιστών
 
Avouris teaching python
Avouris teaching pythonAvouris teaching python
Avouris teaching python
 
Συλλογή Μεταφορά και Έλεγχος Δεδομένων Θεωρία κεφ. 6 Βιβλίο ΣΜΕΔ
Συλλογή Μεταφορά και Έλεγχος Δεδομένων Θεωρία κεφ. 6 Βιβλίο ΣΜΕΔΣυλλογή Μεταφορά και Έλεγχος Δεδομένων Θεωρία κεφ. 6 Βιβλίο ΣΜΕΔ
Συλλογή Μεταφορά και Έλεγχος Δεδομένων Θεωρία κεφ. 6 Βιβλίο ΣΜΕΔ
 

More from ISSEL

Implementation of a platform for assessing indoor spaces regarding their frie...
Implementation of a platform for assessing indoor spaces regarding their frie...Implementation of a platform for assessing indoor spaces regarding their frie...
Implementation of a platform for assessing indoor spaces regarding their frie...ISSEL
 
Autonomous car position calculation with particle filters using traffic data ...
Autonomous car position calculation with particle filters using traffic data ...Autonomous car position calculation with particle filters using traffic data ...
Autonomous car position calculation with particle filters using traffic data ...ISSEL
 
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...ISSEL
 
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...ISSEL
 
Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...
Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...
Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...ISSEL
 
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής Νοημοσύνης
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής ΝοημοσύνηςΑνάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής Νοημοσύνης
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής ΝοημοσύνηςISSEL
 
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptx
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptxΑνάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptx
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptxISSEL
 
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...ISSEL
 
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...ISSEL
 
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...ISSEL
 
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας Ισχυρισμών
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας ΙσχυρισμώνΔημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας Ισχυρισμών
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας ΙσχυρισμώνISSEL
 
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµαταΕξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµαταISSEL
 
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των διαδικασιών κατασκευής συστημάτων λο...
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των  διαδικασιών κατασκευής συστημάτων λο...Ανάπτυξη Μηχανισμών Αυτοματοποίησης των  διαδικασιών κατασκευής συστημάτων λο...
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των διαδικασιών κατασκευής συστημάτων λο...ISSEL
 
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...ISSEL
 
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...ISSEL
 
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικού
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικούΕξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικού
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικούISSEL
 
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία Εφαρµογής
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία ΕφαρµογήςΑνάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία Εφαρµογής
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία ΕφαρµογήςISSEL
 
Camera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environmentsCamera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environmentsISSEL
 
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...ISSEL
 
Design and implementation of an automation mechanism to automatically develop...
Design and implementation of an automation mechanism to automatically develop...Design and implementation of an automation mechanism to automatically develop...
Design and implementation of an automation mechanism to automatically develop...ISSEL
 

More from ISSEL (20)

Implementation of a platform for assessing indoor spaces regarding their frie...
Implementation of a platform for assessing indoor spaces regarding their frie...Implementation of a platform for assessing indoor spaces regarding their frie...
Implementation of a platform for assessing indoor spaces regarding their frie...
 
Autonomous car position calculation with particle filters using traffic data ...
Autonomous car position calculation with particle filters using traffic data ...Autonomous car position calculation with particle filters using traffic data ...
Autonomous car position calculation with particle filters using traffic data ...
 
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...
 
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
 
Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...
Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...
Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...
 
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής Νοημοσύνης
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής ΝοημοσύνηςΑνάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής Νοημοσύνης
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής Νοημοσύνης
 
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptx
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptxΑνάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptx
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptx
 
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...
 
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...
 
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...
 
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας Ισχυρισμών
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας ΙσχυρισμώνΔημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας Ισχυρισμών
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας Ισχυρισμών
 
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµαταΕξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
 
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των διαδικασιών κατασκευής συστημάτων λο...
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των  διαδικασιών κατασκευής συστημάτων λο...Ανάπτυξη Μηχανισμών Αυτοματοποίησης των  διαδικασιών κατασκευής συστημάτων λο...
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των διαδικασιών κατασκευής συστημάτων λο...
 
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...
 
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...
 
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικού
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικούΕξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικού
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικού
 
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία Εφαρµογής
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία ΕφαρµογήςΑνάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία Εφαρµογής
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία Εφαρµογής
 
Camera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environmentsCamera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environments
 
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
 
Design and implementation of an automation mechanism to automatically develop...
Design and implementation of an automation mechanism to automatically develop...Design and implementation of an automation mechanism to automatically develop...
Design and implementation of an automation mechanism to automatically develop...
 

Καρβούνης Ευάγγελος

  • 1. ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΑΠΟΔΟΣΗΣ ΤΟΥ ΜΗΧΑΝΙΣΜΟΥ ΔΙΑΣΧΙΣΗΣ ΤΟΥ ΔΙΑΔΙΚΤΥΟΥ ΜΕ ΒΑΣΗ ΤΟ ΣΗΜΑΣΙΟΛΟΓΙΚΟ ΠΕΡΙΕΧΟΜΕΝΟ ΚΑΡΒΟΥΝΗΣ ΕΥΑΓΓΕΛΟΣ υπό την επίβλεψη του κ. Συμεωνίδη Ανδρέα ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΠΛΗΡΟΦΟΡΙΩΝ ΚΑΙ ΥΠΟΛΟΓΙΣΜΩΝ
  • 2. Σκοπός διπλωματικής • Κατανόηση τρόπου λειτουργίας των Μηχανισμών Διάσχισης του Διαδικτύου • Επιλογή Apache Nutch – Δοκιμή σε ιστοσελίδες – Ανάλυση αποτελεσμάτων – Εξοικείωση με αλγόριθμο βαθμολόγησης OPIC • Δημιουργία του SpiTag – Δίνει βαρύτητα στα metatags των σελίδων – Βαθμολόγηση με βάση το σημασιολογικό περιεχόμενο • Σύγκριση SpiTag-Nutch 2
  • 3. Υπόθεση • Μεγαλύτερο πλήθος σημασιολογικού περιεχομένου  Μεγαλύτερη αξία της ιστοσελίδας • Περισσότερες και πλουσιότερες ιστοσελίδες που παραπέμπουν σε μία ιστοσελίδα  Μεγαλύτερη αξία της ιστοσελίδας • Επισκεπτόμαστε σημασιολογικά πλουσιότερες ιστοσελίδες;;; 3
  • 4. Σημασιολογικός Ιστός • Semantic Web / Web 3.0 • Δημιούργημα του Tim Berners-Lee, 2001 • Δεδομένα που μπορούν να καταλάβουν και οι μηχανές • eXtensible Markup Language - XML • Resource Description Framework – RDF • Ontologies 4
  • 5. Μηχανισμοί Διάσχισης του Διαδικτύου • Web Crawlers ή Spiders • Ο Matthew Gray το 1993 δημιούργησε τον πρώτο και ονομάστηκε World Wide Web Wanderer • Λειτουργία – Επισκέπτονται τις ιστοσελίδες – Κατεβάζουν το περιεχόμενό τους – Το αποθηκεύουν σε τοπικό αποθηκευτικό χώρο 5
  • 6. Ταξινόμηση Μηχανισμών Διάσχισης Crawlers Περιοχή κάλυψης Unfocused Crawler Focused Crawler Ευελιξία Mobile Crawler Συγκεκριμένης διεύθυνσης Διαδικτύου Topic Specific Crawler Ontology Based / Semantic Based Crawler Διανομή φορτίου Intra-Site Parallel Crawler Distributed Crawler 6
  • 7. Μηχανισμοί Διάσχισης του Διαδικτύου • Δημοφιλέστεροι – Apache Nutch – WebSPHINX – Mercator – BingBot – BioCrawler – Slug – OntoCrawler 7
  • 8. Προσθήκη ιστοσελίδων στην Ουρά Επεξεργασίας Επιλογή μίας ιστοσελίδας από την Ουρά Επεξεργασίας Ανάκτηση – Fetch της ιστοσελίδας Ανάλυση – Parse της ιστοσελίδας Προσθήκη αποτελεσμάτων στην Ουρά Επεξεργασίας Επιλογή αρχικών ιστοσελίδων Επανέλαβε μέχρι να αδειάσει η Ουρά Επεξεργασίας Τυπικός κύκλος λειτουργίας ενός Web Crawler 8
  • 9. Γιατί Apache Nutch • Ανοιχτού κώδικα γραμμένος σε Java • Επεκτάσιμος • Διανεμημένος – Διανεμημένο Σύστημα Αρχείων (NDFS) – Μοντέλο MapReduce • Βαθμολόγηση σύμφωνα με αλγόριθμο OPIC – Μεταβλητές “μετρητά”, “ιστορικό μετρητών” 9
  • 10. Μοντέλο MapReduce • Προγραμματιστικό μοντέλο • Παράλληλη Επεξεργασία Προβλημάτων • Χρησιμοποιεί μεγάλο αριθμό υπολογιστών •Διαδικασία Map() i. Ο κόμβος-άρχοντας συλλέγει τα δεδομένα ii. Τα διαιρεί σε υπο-προβλήματα iii. Τα μοιράζει στους κόμβους- εργάτες iv. Οι κόμβοι-εργάτες τα επεξεργάζονται και ενημερώνουν τον κόμβο-άρχοντα •Διαδικασία Reduce() i. Ο κόμβος-άρχοντας συλλέγει τα αποτελέσματα από όλους τους κόμβους-εργάτες ii. Τα συνδυάζει κατάλληλα ώστε να σχηματίσει το τελικό αποτέλεσμα 10
  • 11. Κύκλος Crawling του Nutch i. Εισαγωγή αρχικών ιστοσελίδων ii. Παραγωγή (΄Generate΄)  topN: Επιλογή Ν ιστοσελίδων με την υψηλότερη βαθμολογία iii. Ανάκτηση (΄Fetch΄) iv. Ανάλυση (΄Parse΄) v. Ανανέωση Βάσης Δεδομένων (΄Update Database΄) vi. Εάν δεν τελείωσε, πήγαινε στο βήμα ii Παραγωγή Ανάκτηση Ανάλυση Ανανέωση Βάσης Δεδομένων Εισαγωγή ιστοσελίδων / seed.txt 11
  • 12. SpiTag • Νέος Μηχανισμός Διάσχισης του Διαδικτύου • Spi(der) και (meta)Tag • Βασισμένος στον Apache Nutch 2.2.1 • Αλλαγές – Παραγωγή • Βαθμολόγηση ιστοσελίδων που επιλέγονται για ανάκτηση – Ανάλυση ιστοσελίδων • Άντληση των metatags • Καταμέτρηση των metatags – Ανανέωση Βάσης Δεδομένων • Βαθμολόγηση ιστοσελίδων 12
  • 13. Στόχοι • Βαθμολόγηση ιστοσελίδων με βάση το περιεχόμενο τους • Επίσκεψη ιστοσελίδων με πλουσιότερο περιεχόμενο • Καταμέτρηση και αποθήκευση των metatags του περιεχομένου i. Image Tags ii. Video Tags iii. Meta Name iv. Meta Property v. Meta Equiv vi. Meta Item Property vii. Twitter Tags viii. Facebook Tags ix. Script x. Rel 13
  • 14. • Βαθμολογία ιστοσελίδας που αναλύθηκε – Άντληση των μετρητών των metatags – Άντληση των βαρών των metatags – Υπολογισμός βαθμολογίας 𝜄=1 𝑛 ( 𝑊𝑒𝑖𝑔ℎ𝑡 ∗ 𝑁𝑢𝑚𝑏𝑒𝑟𝑂𝑓𝑀𝑒𝑡𝑎𝑡𝑎𝑔𝑠) όπου i = ο αριθμός των metatags που εξετάζουμε, 0 ≤ Weight ≤ 1 Βαθμολόγηση • Βαθμολογία ιστοσελίδας- παιδιού 𝑖=1 𝑛 𝑆𝑐𝑜𝑟𝑒𝑂𝑓𝑃𝑎𝑟𝑒𝑛𝑡𝑠 𝑁𝑢𝑚𝑏𝑒𝑟𝑂𝑓𝑃𝑎𝑟𝑒𝑛𝑡𝑠 όπου i = ο αριθμός γονέων της νεοεισερχόμενης σελίδας 14
  • 15. Σύνολο Πειραμάτων Πειράματα Nutch SpiTag SpiTagVSNutch Αριθμός αρχικών ιστοσελίδων 4 9 6 Πειράματα σε κάθε ιστοσελίδα 15 3 2 Διάρκεια πειράματος 30 λεπτά – 5 ώρες 24 – 62 ώρες 12-24 ώρες 15 • Ubuntu Linux 13.04 • 4 GB RAM • 6 Mbps • MySQL • Χρόνος μεταξύ 2 αιτημάτων στον ίδιο server: 5 δευτερόλεπτα Επίπεδο 1 Επίπεδο 2 Επίπεδο 3 Επίπεδο 4
  • 17. Πειράματα με χρήση SpiTag www.dailymail.co.uk www.sourceforge.net www.gamespot.com www.gametrailers.com 17
  • 18. Πειράματα με χρήση SpiTag Κανονικοποιημένα διαγράμματα βαθμολογίας για www.dailymail.co.uk 18
  • 19. SpiTag VS Nutch • Στόχος: Αντικειμενική Σύγκριση • Κοινές συνθήκες λειτουργίας A. Οι ιστοσελίδες φιλτράρονται με βάση το domain name τους B. Οι ιστοσελίδες φιλτράρονται με βάση την επέκτασή τους C. Επιλέχθηκαν έξι αρχικές ιστοσελίδες • Προσφέρουν διακύμανση στο σημασιολογικό περιεχόμενο D. Επίπεδο ανάλυσης = 8 έως 10 E. Ιστοσελίδες ανά επίπεδο = 500 19
  • 20. Σύγκριση SpiTag - Nutch -100,000 0 100,000 200,000 300,000 400,000 500,000 600,000 1 2 3 4 5 6 7 8 9 10 DailyMail Uefa Weather Wired Telegraph Guardian Διάγραμμα διαφοράς του αθροίσματος των metatags ανά επίπεδο 20
  • 21. Σύγκριση SpiTag - Nutch Διάγραμμα διαφοράς % του αθροίσματος των metatags ανά επίπεδο -60% -40% -20% 0% 20% 40% 60% 80% 1 2 3 4 5 6 7 8 9 10 DailyMail Uefa Weather Wired Telegraph Guardian 21
  • 22. Σύγκριση SpiTag - Nutch Διάγραμμα διαφοράς % του μέσου όρου του αθροίσματος των metatags ανά επίπεδο -60% -40% -20% 0% 20% 40% 60% 80% 1 2 3 4 5 6 7 8 9 10 DailyMail Uefa Weather Wired Telegraph Guardian 22
  • 23. Σύγκριση SpiTag - Nutch SpiTag Nutch Διαφορά Σύνολο metatag 4,576,134 2,634,496 1,941,638 73.70% Ιστότοποι που αναλύθηκαν 34,315 35,022 Μέσος όρος metatag ανά ιστότοπο 133.3 75.22 58.13 77.21% 23
  • 24. Συμπεράσματα • Επίσκεψη ιστότοπων με περισσότερα metatags • Διακύμανση ανάλογα με τον ιστότοπο και το επίπεδο • Ικανοποιητική διαφορά σε απόλυτους αριθμούς και σε ποσοστό % 24
  • 25. ΣΑΣ ΕΥΧΑΡΙΣΤΩ ΓΙΑ ΤΗΝ ΠΡΟΣΟΧΗ ΣΑΣ 25

Editor's Notes

  1. Αρχικά, στόχος αυτής της διπλωματικής εργασίας είναι η κατανόηση του τρόπου λειτουργίας των Web Crawlers μέσα στον Σημασιολογικό Ιστό (Semantic Web). Συγκεκριμένα, επιλέχθηκε ο Apache Nutch και έγινε μια πρώτη ανάλυση των αποτελεσμάτων του σε διάφορους ιστότοπους με συγκεκριμένα χαρακτηριστικά. Μέσα από τη διαδικασία αυτή έγινε και η εξοικείωση με τον αλγόριθμο OPIC [ABI03] , ο οποίος χρησιμοποιείται για τη βαθμολόγηση των ιστοσελίδων. Στη συνέχεια αναπτύχθηκε ένας νέος αλγόριθμος βαθμολόγησης των σελίδων με βάση το σημασιολογικό περιεχόμενο τους. Τροποποιώντας τον Nutch, δημιουργήσαμε τον SpiTag, ο οποίος δίνει βαρύτητα στα metatags που περιέχουν οι ιστοσελίδες, βαθμολογεί και επιλέγει ιστοσελίδες πλουσιότερες σε σημασιολογικό περιεχόμενο. Τα αποτελέσματα του SpiTag συγκρίθηκαν με τα αποτελέσματα του Nutch, σε μια προσπάθεια να συγκρίνουμε την αποτελεσματικότητα του νέου αλγόριθμου βαθμολόγησης και διάσχισης.
  2. XML: XML was designed to carry data, not to display data. Maybe it is a little hard to understand, but XML does not DO anything. XML was created to structure, store, and transport information. a markup language that defines a set of rules for encoding documents in a format that is both human-readable and machine-readable. παρέχει μία βασική σύνταξη για τη δόμηση των περιεχομένων μέσα στα αρχεία. RDF: ονομάζεται η γλώσσα που χρησιμοποιείται για την περιγραφή των μοντέλων πληροφορίας. Τα μοντέλα αυτά αναφέρονται στα αντικείμενα και τις σχέσεις μεταξύ τους ενώ υπάρχουν και διάφορες συντά Ontologies are the structural frameworks for organizing information.  an ontology formally represents knowledge as a hierarchy of concepts within a domain, using a shared vocabulary to denote the types, properties and interrelationships of those concepts.