SlideShare une entreprise Scribd logo
1  sur  25
Ανίχνευση και Ανάλυση
Συναισθήματος Πτυχών
Κριτικών
Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης
Πολυτεχνική Σχολή
Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Ομάδα Ευφυών Συστημάτων και Τεχνολογίας Λογισμικού
Εκπόνηση:
Αθανάσιος Παρασκευάς
ΑΕΜ: 9197
Επιβλέποντες:
Ανδρέας Συμεωνίδης
Αν. Καθηγητής Α.Π.Θ.
Νικόλαος Μάλαμας
Υποψήφιος Διδάκτωρ
Θεσσαλονίκη, 1/4/2022
Παραγωγή περιεχομένου από χρήστες
στο διαδίκτυο
1/4/2022 2
Περιγραφή του Προβλήματος
• Μη διαχειρίσιμος όγκος δεδομένων
• Αναζήτηση αυτοματοποιημένου τρόπου εξόρυξης/κατηγοριοποίησης/φιλτραρίσματος της
πληροφορίας
• Σημαντικό μέρος των δεδομένων από χρήστες → κριτικές προϊόντων
◦ Επιθυμητή η ανάλυση του συναισθήματος που εκφράζεται μέσα από κριτικές
• Έλλειψη συστημάτων ανάλυσης συναισθήματος για τα ελληνικά
◦ Απουσία συνόλων δεδομένων
1/4/2022 3
Σκοπός της Διπλωματικής Εργασίας
Ανάλυση συνολικού
συναισθήματος κριτικών
• Ανάλυση συναισθήματος
πτυχών κριτικών
1/4/2022 4
Σύνολο Δεδομένων
• Έλλειψη ελληνικών συνόλων δεδομένων για ανάλυση συναισθήματος πτυχών σε ελληνικές
κριτικές
• Ανάγκη υλοποίησης συστήματος συγκέντρωσης και σχολιασμού δεδομένων
◦ Λήψη δεδομένων από δημοφιλείς ιστοσελίδες πώλησης προϊόντων
◦ Θόρυβος στα δεδομένα (ορθογραφικά λάθη, λανθασμένο συναίσθημα, πτυχές που δεν αναφέρονται
στο κείμενο κλπ.)
◦ Δημιουργία μίας διαδικτυακής διεπαφής με εύχρηστο γραφικό περιβάλλον, για σχολιασμό
δεδομένων
1/4/2022 5
1/4/2022 6
Ανάλυση Συνόλου Δεδομένων
1/4/2022 7
Ιστόγραμμα μήκους κειμένου
για τις κριτικές του συνόλου
δεδομένων Ιστόγραμμα τύπου προϊόντος
για τις κριτικές του συνόλου
δεδομένων
Ανάλυση Συνόλου Δεδομένων (2)
1/4/2022 8
Ιστόγραμμα συνολικού
συναισθήματος για τις κριτικές
του συνόλου δεδομένων
Συχνότητα εμφάνισης κάθε πτυχής
Προεπεξεργασία Συνόλου Δεδομένων
• Αφαίρεση θορύβου από τα δεδομένα
• Κεφαλαία γράμματα → Πεζά γράμματα
• Αφαίρεση τόνων
• Αφαίρεση αριθμών
• Παράδειγμα:
◦ Δεν ξέρω αν ο υπολογισμός των θερμίδων που κάνει είναι σωστός γιατί στα 20000 βήματα του βγάζει
μόνο 200 θερμίδες περίπου ότι έκαψε.
↓
◦ δεν ξερω αν ο υπολογισμος των θερμιδων που κανει ειναι σωστος γιατι στα βηματα του βγαζει μονο
θερμιδες περιπου οτι εκαψε.
1/4/2022 9
Διαχωρισμός
Συνόλου
Δεδομένων
• Ένα υποσύνολο εκπαίδευσης, με
το 80% των δεδομένων
• 5-πτυχη Διασταυρωμένη Επικύρωση
(5-fold cross validation)
• Ένα υποσύνολο αξιολόγησης, με το
20% των δεδομένων
1/4/2022 10
Ενσωματώσεις Λέξεων (Word
Embeddings)
• Λέξεις → Διανύσματα
◦ Μοντέλα Διανυσματικού Χώρου (Vector Space Models)
• Βασική ιδέα: Τοποθέτηση σημασιολογικά όμοιων λέξεων σε κοντινή απόσταση
• Υπόθεση κατανομής (distributional hypothesis): λέξεις που συνοδεύονται από παρόμοια
συμφραζόμενα τείνουν να έχουν παρόμοιες σημασίες
1/4/2022 11
Ανάλυση Συνολικού Συναισθήματος
• Ταξινόμηση συνολικού συναισθήματος μίας κριτικής σε Αρνητικό, Ουδέτερο, Θετικό
• Μετατροπή λέξεων σε embeddings
• SVM: μέσος όρος των embeddings σαν είσοδος
• Bidirectional LSTM
• Transformers
1/4/2022 12
Μοντέλα
Transformer
Παραλλαγές στα ελληνικά:
Greek-BERT, ELECTRA
1/4/2022 13
Επίπεδο Προσοχής
• Απόδοση προσοχής σε συγκεκριμένες λέξεις μιας κριτικής και απόρριψη μη χρήσιμης
πληροφορίας
• Παράδειγμα:
◦ Ένα έχω να πω για την κάμερα του κινητού: την χρησιμοποιώ συνέχεια και είναι τέλεια.
1/4/2022 14
Aspect-Based Sentiment Analysis (ABSA)
• Δύο επιμέρους εργασίες:
◦ Ανίχνευση κατηγοριών και πτυχών (Aspect Category Detection ‐ ACD)
◦ Ανάλυση Συναισθήματος (Sentiment Polarity ‐ SP)
• Εκπαίδευση δύο μοντέλων ξεχωριστά, ένα για κάθε εργασία
• Συνδυασμός αυτών για την δημιουργία ενός συγκεντρωτικού (end-to-end) μοντέλου
1/4/2022 15
Μοντέλο ACD
• Ένα μοντέλο για κάθε πτυχή
ξεχωριστά (one-vs-all)
• Ταξινόμηση κάθε πτυχής ως
• Θετική αν περιέχεται στην κριτική
• Αρνητική αν δεν περιέχεται στην
κριτική
1/4/2022 16
Μοντέλο SP
• Είσοδος: embeddings κριτικής +
embeddings πτυχής προς ανάλυση
• Συνδυασμός της πληροφορίας των
δύο εισόδων
• Απόδοση προσοχής ανάλογα με
την ζητούμενη πτυχή
• Ταξινόμηση συναισθήματος
πτυχής σε
• Αρνητικό
• Ουδέτερο
• Θετικό
1/4/2022 17
End-to-End
Μοντέλο
• Συνδυασμός ACD και SP
• Έμμεση εύρεση του πιθανότερου
τύπου προϊόντος από τις
ανιχνευμένες πτυχές
• Απόρριψη ανιχνευμένων πτυχών
που δεν ανήκουν στον πιθανότερο
τύπο προϊόντος
• Ποσοτικοποίηση της προσοχής
που αποδόθηκε σε κάθε λέξη κατά
τον υπολογισμό του
συναισθήματος κάθε πτυχής
1/4/2022 18
Μετρικές Αξιολόγησης
• Ακρίβεια (Precision):
TP
TP+FP
• Ανάκληση (Recall):
TP
TP+FN
• Μέτρο F1 (F1 Score): 2
Precision⋅Recall
Precision+Recall
◦ Μέσος όρος των F1 Score για κάθε κλάση
1/4/2022 19
Αποτελέσματα Συνολικού
Συναισθήματος
• Καλύτερη απόδοση από το μοντέλο
Greek-BERT
• Μέγιστο μήκος εισόδου για το μοντέλο
ELECTRA: 128 λέξεις < Greek-BERT: 512
• Μεγάλη πολυπλοκότητα και αριθμός
παραμέτρων των μοντέλων transformer
1/4/2022 20
Αποτελέσματα ACD μοντέλου
• Αξιοπρεπής απόδοση σε όλες τις πτυχές
• Χαμηλότερη απόδοση σε μερικές πτυχές
(πχ. Αντοχή στο χρόνο για τα PS4 Games)
◦ Πιο σύνθετο λεξιλόγιο για την περιγραφή τους
◦ Δυσκολία ανίχνευσης αφαιρετικών εννοιών
1/4/2022 21
Αποτελέσματα SP μοντέλου
• Αυξημένη διακύμανση του F1 Score
μεταξύ πτυχών
• Μικρό σύνολο δεδομένων →
έλλειψη επαρκούς αριθμού
παραδειγμάτων για τις 3 κλάσεις
• Πτυχές με λίγα παραδείγματα →
μεγαλύτερη απόκλιση από τη μέση
τιμή του F1 score
1/4/2022 22
1/4/2022 23
Μελλοντική Εργασία
• Συμμετοχή μεγαλύτερου πλήθους σχολιαστών και πιο συστηματική συγκέντρωση δεδομένων
• Μείωση διακύμανσης της απόδοσης σε πτυχές με λίγα παραδείγματα
• Δοκιμή σε δεδομένα άλλων κλάδων, όπως κριτικές ξενοδοχείων, σχόλια χρηστών σε
πλατφόρμες αναπαραγωγής βίντεο, συνομιλίες χρηστών σε φόρουμ
• Χρήση του end-to-end μοντέλου στο cloud με πραγματικά δεδομένα (Azure, AWS)
• Συνεχής βελτίωση της ποιότητας των προβλέψεων μέσω κύκλου ζωής του μοντέλου
1/4/2022 24
Ευχαριστώ πολύ για την
προσοχή σας
28/2/2022 25
Ερωτήσεις;

Contenu connexe

Similaire à Aspect-Based Sentiment Analysis for Reviews

Επανοργάνωση πηγαίου κώδικα από γράφους εξαρτήσεων οντοτήτων µε βάση παραδείγ...
Επανοργάνωση πηγαίου κώδικα από γράφους εξαρτήσεων οντοτήτων µε βάση παραδείγ...Επανοργάνωση πηγαίου κώδικα από γράφους εξαρτήσεων οντοτήτων µε βάση παραδείγ...
Επανοργάνωση πηγαίου κώδικα από γράφους εξαρτήσεων οντοτήτων µε βάση παραδείγ...
ISSEL
 
Source code remodularization based on component dependency graphs
Source code remodularization based on component dependency graphsSource code remodularization based on component dependency graphs
Source code remodularization based on component dependency graphs
ISSEL
 
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία Εφαρµογής
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία ΕφαρµογήςΑνάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία Εφαρµογής
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία Εφαρµογής
ISSEL
 
Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...
Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...
Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...
ISSEL
 
Evangelos Papathomas: Semantic Code Search in Software Repositories using Neu...
Evangelos Papathomas: Semantic Code Search in Software Repositories using Neu...Evangelos Papathomas: Semantic Code Search in Software Repositories using Neu...
Evangelos Papathomas: Semantic Code Search in Software Repositories using Neu...
Manos Tsardoulias
 
Αναγνώριση Κατηγορίας Νοητικής Έκπτωσης μέσω Χαρακτηριστικών Ομιλίας.pptx
Αναγνώριση Κατηγορίας Νοητικής Έκπτωσης μέσω Χαρακτηριστικών Ομιλίας.pptxΑναγνώριση Κατηγορίας Νοητικής Έκπτωσης μέσω Χαρακτηριστικών Ομιλίας.pptx
Αναγνώριση Κατηγορίας Νοητικής Έκπτωσης μέσω Χαρακτηριστικών Ομιλίας.pptx
ISSEL
 
Cognitive decline detection using speech features: A machine learning approach
Cognitive decline detection using speech features: A machine learning approachCognitive decline detection using speech features: A machine learning approach
Cognitive decline detection using speech features: A machine learning approach
ISSEL
 
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής Νοημοσύνης
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής ΝοημοσύνηςΑνάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής Νοημοσύνης
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής Νοημοσύνης
ISSEL
 
Απόσταξη Γνώσης σε Δίκτυα BiLSTM για τη Συμπίεση του Μοντέλου Greek-BERT
Απόσταξη Γνώσης σε Δίκτυα BiLSTM για τη Συμπίεση του Μοντέλου Greek-BERTΑπόσταξη Γνώσης σε Δίκτυα BiLSTM για τη Συμπίεση του Μοντέλου Greek-BERT
Απόσταξη Γνώσης σε Δίκτυα BiLSTM για τη Συμπίεση του Μοντέλου Greek-BERT
ISSEL
 
Knowledge Distillation into BiLSTM Networks for the Compression of the Greek‐...
Knowledge Distillation into BiLSTM Networks for the Compression of the Greek‐...Knowledge Distillation into BiLSTM Networks for the Compression of the Greek‐...
Knowledge Distillation into BiLSTM Networks for the Compression of the Greek‐...
ISSEL
 
Real time news assistant
Real time news assistantReal time news assistant
Real time news assistant
ISSEL
 
Ανάπτυξη ειδησεογραφικού ψηφιακού βοηθού πραγματικού χρόνου
Ανάπτυξη ειδησεογραφικού ψηφιακού βοηθού πραγματικού χρόνουΑνάπτυξη ειδησεογραφικού ψηφιακού βοηθού πραγματικού χρόνου
Ανάπτυξη ειδησεογραφικού ψηφιακού βοηθού πραγματικού χρόνου
ISSEL
 

Similaire à Aspect-Based Sentiment Analysis for Reviews (20)

Επανοργάνωση πηγαίου κώδικα από γράφους εξαρτήσεων οντοτήτων µε βάση παραδείγ...
Επανοργάνωση πηγαίου κώδικα από γράφους εξαρτήσεων οντοτήτων µε βάση παραδείγ...Επανοργάνωση πηγαίου κώδικα από γράφους εξαρτήσεων οντοτήτων µε βάση παραδείγ...
Επανοργάνωση πηγαίου κώδικα από γράφους εξαρτήσεων οντοτήτων µε βάση παραδείγ...
 
Source code remodularization based on component dependency graphs
Source code remodularization based on component dependency graphsSource code remodularization based on component dependency graphs
Source code remodularization based on component dependency graphs
 
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία Εφαρµογής
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία ΕφαρµογήςΑνάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία Εφαρµογής
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία Εφαρµογής
 
Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...
Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...
Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...
 
Employing Machine Learning and Intelligent Information Management Techniques ...
Employing Machine Learning and Intelligent Information Management Techniques ...Employing Machine Learning and Intelligent Information Management Techniques ...
Employing Machine Learning and Intelligent Information Management Techniques ...
 
Χριστίνα Μποϊδίδου
Χριστίνα ΜποϊδίδουΧριστίνα Μποϊδίδου
Χριστίνα Μποϊδίδου
 
A rule-based approach for the real-time semantic annotation in context-aware ...
A rule-based approach for the real-time semantic annotation in context-aware ...A rule-based approach for the real-time semantic annotation in context-aware ...
A rule-based approach for the real-time semantic annotation in context-aware ...
 
Evangelos Papathomas: Semantic Code Search in Software Repositories using Neu...
Evangelos Papathomas: Semantic Code Search in Software Repositories using Neu...Evangelos Papathomas: Semantic Code Search in Software Repositories using Neu...
Evangelos Papathomas: Semantic Code Search in Software Repositories using Neu...
 
Evangelos papathomas diploma thesis presentation
Evangelos papathomas diploma thesis presentationEvangelos papathomas diploma thesis presentation
Evangelos papathomas diploma thesis presentation
 
Nikolaos Oikonomou
Nikolaos OikonomouNikolaos Oikonomou
Nikolaos Oikonomou
 
Αναγνώριση Κατηγορίας Νοητικής Έκπτωσης μέσω Χαρακτηριστικών Ομιλίας.pptx
Αναγνώριση Κατηγορίας Νοητικής Έκπτωσης μέσω Χαρακτηριστικών Ομιλίας.pptxΑναγνώριση Κατηγορίας Νοητικής Έκπτωσης μέσω Χαρακτηριστικών Ομιλίας.pptx
Αναγνώριση Κατηγορίας Νοητικής Έκπτωσης μέσω Χαρακτηριστικών Ομιλίας.pptx
 
Cognitive decline detection using speech features: A machine learning approach
Cognitive decline detection using speech features: A machine learning approachCognitive decline detection using speech features: A machine learning approach
Cognitive decline detection using speech features: A machine learning approach
 
Elpida Falara
Elpida FalaraElpida Falara
Elpida Falara
 
Ιωάννη Α. Ζαφειρίου
Ιωάννη Α. ΖαφειρίουΙωάννη Α. Ζαφειρίου
Ιωάννη Α. Ζαφειρίου
 
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής Νοημοσύνης
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής ΝοημοσύνηςΑνάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής Νοημοσύνης
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής Νοημοσύνης
 
Απόσταξη Γνώσης σε Δίκτυα BiLSTM για τη Συμπίεση του Μοντέλου Greek-BERT
Απόσταξη Γνώσης σε Δίκτυα BiLSTM για τη Συμπίεση του Μοντέλου Greek-BERTΑπόσταξη Γνώσης σε Δίκτυα BiLSTM για τη Συμπίεση του Μοντέλου Greek-BERT
Απόσταξη Γνώσης σε Δίκτυα BiLSTM για τη Συμπίεση του Μοντέλου Greek-BERT
 
Knowledge Distillation into BiLSTM Networks for the Compression of the Greek‐...
Knowledge Distillation into BiLSTM Networks for the Compression of the Greek‐...Knowledge Distillation into BiLSTM Networks for the Compression of the Greek‐...
Knowledge Distillation into BiLSTM Networks for the Compression of the Greek‐...
 
Real time news assistant
Real time news assistantReal time news assistant
Real time news assistant
 
Ανάπτυξη ειδησεογραφικού ψηφιακού βοηθού πραγματικού χρόνου
Ανάπτυξη ειδησεογραφικού ψηφιακού βοηθού πραγματικού χρόνουΑνάπτυξη ειδησεογραφικού ψηφιακού βοηθού πραγματικού χρόνου
Ανάπτυξη ειδησεογραφικού ψηφιακού βοηθού πραγματικού χρόνου
 
Theofilos Georgiadis: Library recommendation system for the reuse of software...
Theofilos Georgiadis: Library recommendation system for the reuse of software...Theofilos Georgiadis: Library recommendation system for the reuse of software...
Theofilos Georgiadis: Library recommendation system for the reuse of software...
 

Plus de ISSEL

Implementation of a platform for assessing indoor spaces regarding their frie...
Implementation of a platform for assessing indoor spaces regarding their frie...Implementation of a platform for assessing indoor spaces regarding their frie...
Implementation of a platform for assessing indoor spaces regarding their frie...
ISSEL
 
Autonomous car position calculation with particle filters using traffic data ...
Autonomous car position calculation with particle filters using traffic data ...Autonomous car position calculation with particle filters using traffic data ...
Autonomous car position calculation with particle filters using traffic data ...
ISSEL
 
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...
ISSEL
 
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
ISSEL
 
Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...
Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...
Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...
ISSEL
 
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptx
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptxΑνάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptx
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptx
ISSEL
 
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...
ISSEL
 
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...
ISSEL
 
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...
ISSEL
 
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας Ισχυρισμών
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας ΙσχυρισμώνΔημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας Ισχυρισμών
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας Ισχυρισμών
ISSEL
 
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµαταΕξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
ISSEL
 
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των διαδικασιών κατασκευής συστημάτων λο...
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των  διαδικασιών κατασκευής συστημάτων λο...Ανάπτυξη Μηχανισμών Αυτοματοποίησης των  διαδικασιών κατασκευής συστημάτων λο...
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των διαδικασιών κατασκευής συστημάτων λο...
ISSEL
 
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...
ISSEL
 
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...
ISSEL
 
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικού
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικούΕξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικού
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικού
ISSEL
 
Camera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environmentsCamera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environments
ISSEL
 
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
ISSEL
 
Design and implementation of an automation mechanism to automatically develop...
Design and implementation of an automation mechanism to automatically develop...Design and implementation of an automation mechanism to automatically develop...
Design and implementation of an automation mechanism to automatically develop...
ISSEL
 
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
ISSEL
 
Static Analysis of Python code and Identification of Potential Security Vulne...
Static Analysis of Python code and Identification of Potential Security Vulne...Static Analysis of Python code and Identification of Potential Security Vulne...
Static Analysis of Python code and Identification of Potential Security Vulne...
ISSEL
 

Plus de ISSEL (20)

Implementation of a platform for assessing indoor spaces regarding their frie...
Implementation of a platform for assessing indoor spaces regarding their frie...Implementation of a platform for assessing indoor spaces regarding their frie...
Implementation of a platform for assessing indoor spaces regarding their frie...
 
Autonomous car position calculation with particle filters using traffic data ...
Autonomous car position calculation with particle filters using traffic data ...Autonomous car position calculation with particle filters using traffic data ...
Autonomous car position calculation with particle filters using traffic data ...
 
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...
 
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
 
Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...
Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...
Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...
 
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptx
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptxΑνάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptx
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptx
 
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...
 
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...
 
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...
 
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας Ισχυρισμών
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας ΙσχυρισμώνΔημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας Ισχυρισμών
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας Ισχυρισμών
 
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµαταΕξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
 
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των διαδικασιών κατασκευής συστημάτων λο...
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των  διαδικασιών κατασκευής συστημάτων λο...Ανάπτυξη Μηχανισμών Αυτοματοποίησης των  διαδικασιών κατασκευής συστημάτων λο...
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των διαδικασιών κατασκευής συστημάτων λο...
 
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...
 
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...
 
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικού
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικούΕξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικού
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικού
 
Camera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environmentsCamera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environments
 
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
 
Design and implementation of an automation mechanism to automatically develop...
Design and implementation of an automation mechanism to automatically develop...Design and implementation of an automation mechanism to automatically develop...
Design and implementation of an automation mechanism to automatically develop...
 
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΗΧΑΝΙΣΜΟΥ ΑΥΤΟΜΑΤΟΠΟΙΗΣΗΣ ΤΗΣ ΑΝΑΠΤΥΞΗΣ ΓΡΑΦΙΚΩΝ ΕΝΤΟΛ...
 
Static Analysis of Python code and Identification of Potential Security Vulne...
Static Analysis of Python code and Identification of Potential Security Vulne...Static Analysis of Python code and Identification of Potential Security Vulne...
Static Analysis of Python code and Identification of Potential Security Vulne...
 

Aspect-Based Sentiment Analysis for Reviews

  • 1. Ανίχνευση και Ανάλυση Συναισθήματος Πτυχών Κριτικών Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Ομάδα Ευφυών Συστημάτων και Τεχνολογίας Λογισμικού Εκπόνηση: Αθανάσιος Παρασκευάς ΑΕΜ: 9197 Επιβλέποντες: Ανδρέας Συμεωνίδης Αν. Καθηγητής Α.Π.Θ. Νικόλαος Μάλαμας Υποψήφιος Διδάκτωρ Θεσσαλονίκη, 1/4/2022
  • 2. Παραγωγή περιεχομένου από χρήστες στο διαδίκτυο 1/4/2022 2
  • 3. Περιγραφή του Προβλήματος • Μη διαχειρίσιμος όγκος δεδομένων • Αναζήτηση αυτοματοποιημένου τρόπου εξόρυξης/κατηγοριοποίησης/φιλτραρίσματος της πληροφορίας • Σημαντικό μέρος των δεδομένων από χρήστες → κριτικές προϊόντων ◦ Επιθυμητή η ανάλυση του συναισθήματος που εκφράζεται μέσα από κριτικές • Έλλειψη συστημάτων ανάλυσης συναισθήματος για τα ελληνικά ◦ Απουσία συνόλων δεδομένων 1/4/2022 3
  • 4. Σκοπός της Διπλωματικής Εργασίας Ανάλυση συνολικού συναισθήματος κριτικών • Ανάλυση συναισθήματος πτυχών κριτικών 1/4/2022 4
  • 5. Σύνολο Δεδομένων • Έλλειψη ελληνικών συνόλων δεδομένων για ανάλυση συναισθήματος πτυχών σε ελληνικές κριτικές • Ανάγκη υλοποίησης συστήματος συγκέντρωσης και σχολιασμού δεδομένων ◦ Λήψη δεδομένων από δημοφιλείς ιστοσελίδες πώλησης προϊόντων ◦ Θόρυβος στα δεδομένα (ορθογραφικά λάθη, λανθασμένο συναίσθημα, πτυχές που δεν αναφέρονται στο κείμενο κλπ.) ◦ Δημιουργία μίας διαδικτυακής διεπαφής με εύχρηστο γραφικό περιβάλλον, για σχολιασμό δεδομένων 1/4/2022 5
  • 7. Ανάλυση Συνόλου Δεδομένων 1/4/2022 7 Ιστόγραμμα μήκους κειμένου για τις κριτικές του συνόλου δεδομένων Ιστόγραμμα τύπου προϊόντος για τις κριτικές του συνόλου δεδομένων
  • 8. Ανάλυση Συνόλου Δεδομένων (2) 1/4/2022 8 Ιστόγραμμα συνολικού συναισθήματος για τις κριτικές του συνόλου δεδομένων Συχνότητα εμφάνισης κάθε πτυχής
  • 9. Προεπεξεργασία Συνόλου Δεδομένων • Αφαίρεση θορύβου από τα δεδομένα • Κεφαλαία γράμματα → Πεζά γράμματα • Αφαίρεση τόνων • Αφαίρεση αριθμών • Παράδειγμα: ◦ Δεν ξέρω αν ο υπολογισμός των θερμίδων που κάνει είναι σωστός γιατί στα 20000 βήματα του βγάζει μόνο 200 θερμίδες περίπου ότι έκαψε. ↓ ◦ δεν ξερω αν ο υπολογισμος των θερμιδων που κανει ειναι σωστος γιατι στα βηματα του βγαζει μονο θερμιδες περιπου οτι εκαψε. 1/4/2022 9
  • 10. Διαχωρισμός Συνόλου Δεδομένων • Ένα υποσύνολο εκπαίδευσης, με το 80% των δεδομένων • 5-πτυχη Διασταυρωμένη Επικύρωση (5-fold cross validation) • Ένα υποσύνολο αξιολόγησης, με το 20% των δεδομένων 1/4/2022 10
  • 11. Ενσωματώσεις Λέξεων (Word Embeddings) • Λέξεις → Διανύσματα ◦ Μοντέλα Διανυσματικού Χώρου (Vector Space Models) • Βασική ιδέα: Τοποθέτηση σημασιολογικά όμοιων λέξεων σε κοντινή απόσταση • Υπόθεση κατανομής (distributional hypothesis): λέξεις που συνοδεύονται από παρόμοια συμφραζόμενα τείνουν να έχουν παρόμοιες σημασίες 1/4/2022 11
  • 12. Ανάλυση Συνολικού Συναισθήματος • Ταξινόμηση συνολικού συναισθήματος μίας κριτικής σε Αρνητικό, Ουδέτερο, Θετικό • Μετατροπή λέξεων σε embeddings • SVM: μέσος όρος των embeddings σαν είσοδος • Bidirectional LSTM • Transformers 1/4/2022 12
  • 14. Επίπεδο Προσοχής • Απόδοση προσοχής σε συγκεκριμένες λέξεις μιας κριτικής και απόρριψη μη χρήσιμης πληροφορίας • Παράδειγμα: ◦ Ένα έχω να πω για την κάμερα του κινητού: την χρησιμοποιώ συνέχεια και είναι τέλεια. 1/4/2022 14
  • 15. Aspect-Based Sentiment Analysis (ABSA) • Δύο επιμέρους εργασίες: ◦ Ανίχνευση κατηγοριών και πτυχών (Aspect Category Detection ‐ ACD) ◦ Ανάλυση Συναισθήματος (Sentiment Polarity ‐ SP) • Εκπαίδευση δύο μοντέλων ξεχωριστά, ένα για κάθε εργασία • Συνδυασμός αυτών για την δημιουργία ενός συγκεντρωτικού (end-to-end) μοντέλου 1/4/2022 15
  • 16. Μοντέλο ACD • Ένα μοντέλο για κάθε πτυχή ξεχωριστά (one-vs-all) • Ταξινόμηση κάθε πτυχής ως • Θετική αν περιέχεται στην κριτική • Αρνητική αν δεν περιέχεται στην κριτική 1/4/2022 16
  • 17. Μοντέλο SP • Είσοδος: embeddings κριτικής + embeddings πτυχής προς ανάλυση • Συνδυασμός της πληροφορίας των δύο εισόδων • Απόδοση προσοχής ανάλογα με την ζητούμενη πτυχή • Ταξινόμηση συναισθήματος πτυχής σε • Αρνητικό • Ουδέτερο • Θετικό 1/4/2022 17
  • 18. End-to-End Μοντέλο • Συνδυασμός ACD και SP • Έμμεση εύρεση του πιθανότερου τύπου προϊόντος από τις ανιχνευμένες πτυχές • Απόρριψη ανιχνευμένων πτυχών που δεν ανήκουν στον πιθανότερο τύπο προϊόντος • Ποσοτικοποίηση της προσοχής που αποδόθηκε σε κάθε λέξη κατά τον υπολογισμό του συναισθήματος κάθε πτυχής 1/4/2022 18
  • 19. Μετρικές Αξιολόγησης • Ακρίβεια (Precision): TP TP+FP • Ανάκληση (Recall): TP TP+FN • Μέτρο F1 (F1 Score): 2 Precision⋅Recall Precision+Recall ◦ Μέσος όρος των F1 Score για κάθε κλάση 1/4/2022 19
  • 20. Αποτελέσματα Συνολικού Συναισθήματος • Καλύτερη απόδοση από το μοντέλο Greek-BERT • Μέγιστο μήκος εισόδου για το μοντέλο ELECTRA: 128 λέξεις < Greek-BERT: 512 • Μεγάλη πολυπλοκότητα και αριθμός παραμέτρων των μοντέλων transformer 1/4/2022 20
  • 21. Αποτελέσματα ACD μοντέλου • Αξιοπρεπής απόδοση σε όλες τις πτυχές • Χαμηλότερη απόδοση σε μερικές πτυχές (πχ. Αντοχή στο χρόνο για τα PS4 Games) ◦ Πιο σύνθετο λεξιλόγιο για την περιγραφή τους ◦ Δυσκολία ανίχνευσης αφαιρετικών εννοιών 1/4/2022 21
  • 22. Αποτελέσματα SP μοντέλου • Αυξημένη διακύμανση του F1 Score μεταξύ πτυχών • Μικρό σύνολο δεδομένων → έλλειψη επαρκούς αριθμού παραδειγμάτων για τις 3 κλάσεις • Πτυχές με λίγα παραδείγματα → μεγαλύτερη απόκλιση από τη μέση τιμή του F1 score 1/4/2022 22
  • 24. Μελλοντική Εργασία • Συμμετοχή μεγαλύτερου πλήθους σχολιαστών και πιο συστηματική συγκέντρωση δεδομένων • Μείωση διακύμανσης της απόδοσης σε πτυχές με λίγα παραδείγματα • Δοκιμή σε δεδομένα άλλων κλάδων, όπως κριτικές ξενοδοχείων, σχόλια χρηστών σε πλατφόρμες αναπαραγωγής βίντεο, συνομιλίες χρηστών σε φόρουμ • Χρήση του end-to-end μοντέλου στο cloud με πραγματικά δεδομένα (Azure, AWS) • Συνεχής βελτίωση της ποιότητας των προβλέψεων μέσω κύκλου ζωής του μοντέλου 1/4/2022 24
  • 25. Ευχαριστώ πολύ για την προσοχή σας 28/2/2022 25 Ερωτήσεις;

Notes de l'éditeur

  1. Η παραγωγή περιεχομένου από τους χρήστες στο διαδίκτυο έχει αυξηθεί σημαντικά τα τελευταία χρόνια, αφού υπηρεσίες όπως τα μέσα κοινωνικής δικτύωσης, οι ιστοσελίδες/εφαρμογές καταστημάτων πώλησης προϊόντων και φαγητών, τα φόρουμ, τα wiki και πολλά άλλα αποτελούν αναπόσπαστο κομμάτι της καθημερινότητας. Το περιεχόμενο αυτό μπορεί να έχει τη μορφή δημοσιεύσεων, κριτικών, σχολίων, εγκυκλοπαιδικών γνώσεων κλπ.