Τα τελευταία χρόνια έχει καταστεί δηµοφιλής η ανάλυση σχεσιακών δεδοµένων οργανώνο ντας δείγµατα ως κορυφές γράφων µε ακµές τις µεταξύ τους συσχετίσεις. ΄Ενα διαδεδοµένο εργαλείο για την ανάλυση γράφων -ιδιαίτερα όταν αυτοί περιγράφουν δεδοµένα µεγάλης κλίµακας- είναι η γραφική επεξεργασία σήµατος. Αυτή η ϑεωρία γενικεύει την ψηφιακή επεξεργασία σήµατος µε τον ορισµό γραφικών ϕίλτρων, τα οποία εκτελούν µετατοπίσεις πληροφορίας µεταξύ γειτονικών κορυφών ως ισοδύναµο του ϕασµατικού ϕιλτραρίσµατος στον χώρο των ιδιοτιµών. ∆υστυχώς, γραφικά ϕίλτρα που παρέχονται από συστήµατα δια χείρισης και ανάλυσης γράφων συνήθως δεν µπορούν να επεξεργαστούν δεδοµένα µεγάλης κλίµακας που ξεπερνούν τη χωρητικότητα της µνήµης τυχαίας προσπέλασης (RAM) των υπολογιστικών υποδοµών. ΄Ετσι, η χρήση τους περιορίζεται από το πλήθος των ακµών που µπορούν να επεξεργαστούν ταυτόχρονα. Αυτή η διπλωµατική εξετάζει υποσχόµενες τεχνικές για την εκτέλεση του γραφικού ϕιλτραρίσµατος όταν υποκείµενα υπολογιστικά συ στήµατα µπορούν να διατηρήσουν στη µνήµη µόνο τις κορυφές αλλά όχι τις ακµές γράφων (οι κορυφές είναι συχνά εκατοντάδες ϕορές λιγότερες σε πλήθος). Για την ακρίβεια, προ τείνεται ότι οι ακµές µπορούν να αποθηκευτούν σε µόνιµα µέσα αποθήκευσης, όπως ο σκληρός δίσκος, και µελετώνται δύο τρόποι οργάνωσής τους για αποτελεσµατική διάσχι ση κατά τον υπολογισµό ϕίλτρων γράφων, εκ των οποίων ο πρώτος αποθηκεύει όλες τις ακµές σε ένα αρχείο ανά γράφο, ενώ ο δεύτερος αποθηκεύει τις ακµές σε ένα αρχείο ανά σχετιζόµενη κορυφή. Οι προσεγγίσεις αυτές υλοποιούνται σε ένα σύστηµα διαχείρισης και ϕιλτραρίσµατος µεγάλων γράφων στη γλώσσα προγραµµατισµού Java, το οποίο εκτελείται τοπικά σε µηχάνηµα µε ενδεχοµένως περιορισµένη µνήµη. Πειραµατική σύγκριση µε ισοδύναµες υλοποιήσεις που διατηρούν όλες τις ακµές στη µνήµη τυχαίας προσπέλασης δείχνουν ότι οι προτεινόµενες τεχνικές επιτρέπουν γραφική επεξεργασία σήµατος ακόµη και όταν οι γράφοι υπερβαίνουν τη χωρητικότητας της µνήµης. Τέλος, αναλύονται οι α συµπτωτικοί και ωρολογιακοί χρόνοι εκτέλεσης των επιµέρους λειτουργιών συγκρινόµενων προσεγγίσεων, καταλήγοντας σε διαφορετική προτεινόµενη προσέγγιση για διαφορετικούς τρόπους χρήσης του ανεπτυγµένου συστήµατος.
20. Αποτελέσματα – 1ο Μέρος
Μνήμη : μικρότεροι χρόνοι
απόκρισης, αδυναμία επεξεργασίας
ολόκληρου του γράφου
PartitionedDiscGraph : μεγάλες
καθυστερήσεις στην επιστροφή των
ακμών
DiscGraph: καθυστερήσεις στην
διαγραφή ακμής, σταθερότητα στην
προσθήκη ακμής
Γραφική Επεξεργασία Σήματος σε Μεγάλους Γράφους 20
Κεσσόπουλος Ι.
21. Αποτελέσματα – 1ο Μέρος
Γραφική Επεξεργασία Σήματος σε Μεγάλους Γράφους 21
Κεσσόπουλος Ι.
22. Αποτελέσματα – 2ο Μέρος
• LoadedGraph: αδυναμία εκτέλεσης φίλτρων
στους μεγάλους γράφους
• TinkerPop : αδυναμία εκτέλεσης γραφικών
φίλτρων ακόμη και στους μεσαίους γράφους
• PartitionedDiscGraph : μεγάλες
καθυστερήσεις που προκύπτουν από την
επιστροφή ακμών
• DiscGraph : χρόνοι ίδιας κλίμακας με τη
μνήμη, αποτελεσματική και γρήγορη ακόμα
και σε μεγάλους γράφου
Γραφική Επεξεργασία Σήματος σε Μεγάλους Γράφους 22
Ενδεικτικά αποτελέσματα
Κεσσόπουλος Ι.