SlideShare une entreprise Scribd logo
1  sur  36
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ
ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ
ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ
ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ
Διπλωματική Εργασία
Ένα Πλαίσιο Εξόρυξης Γράφων για την Εκτίμηση της Εξέλιξης
Ακολουθιών και Εφαρμογές του στη Βιοπληροφορική
Αμπραχαμιάν Σεροβπέ
ΑΕΜ: 8773
Επιβλέπων: Περικλής Α. Μήτκας, Καθηγητής Α.Π.Θ.
Συνεπιβλέπων: Θεμιστοκλής Διαμαντόπουλος, Μεταδιδακτορικός Ερευνητής
Συνεπιβλέπων: Φώτης Ε. Ψωμόπουλος, Κύριος Ερευνητής ΙΝΕΒ|ΕΚΕΤΑ
Εργαστήριο Ευφυών Συστημάτων και Τεχνολογίας Λογισμικού (ISSEL)
Θεσσαλονίκη, 3 Απριλίου 2023
1
Θέμα Διπλωματικής Εργασίας
• Με είσοδο ένα πλήθος διαφορετικών γράφων, κάθε
ένας από τους οποίους αποτυπώνει μια διαφορετική
πορεία/εξέλιξη μιας ακολουθίας ανοσοσφαιρίνης σε
καρκινικά κύτταρα ενός ασθενή με λευχαιμία,
Στόχος είναι:
 Να εντοπισθούν κοινά μοτίβα και να συνδεθούν
οι γράφοι σε μεγαλύτερα υπερδίκτυα, τα οποία
θα μπορούν να ερμηνεύουν και τη γενικότερη
πορεία εξέλιξης της ασθένειας.
2
Θεωρητικό Υπόβαθρο – Τι είναι η ανοσοσφαιρίνη
• Ανοσοσφαιρίνη – αντίσωμα => πρωτεΐνη => καταπολέμηση παθογόνων
μικροοργανισμών => διέγερση από αντιγόνο
• Δύο μεγάλες βαριές αλυσίδες (H) και δύο μικρές ελαφριές αλυσίδες (L)
• Σταθερή περιοχή => κοινή για όλα τα αντισώματα
Μεταβλητή περιοχή => εξαιρετικά ποικιλόμορφη
• Τεράστια ποικιλότητα αντισωμάτων =>
αναγνώριση εξίσου μεγάλης
ποικιλίας αντιγόνων
3
Θεωρητικό Υπόβαθρο
Τι είναι η λευχαιμία και πώς προκαλείται
• Λευχαιμία => καρκίνος του αίματος ή του μυελού των οστών =>
οξεία/χρόνια και λεμφοκυτταρική/μυελογενής.
• Χρόνια Λεμφοκυτταρική Λευχαιμία (CLL) => Β – λεμφοκύτταρα =>
υπερβολική παραγωγή ανώριμων μη φυσιολογικών μορφών.
• Φυσιολογικό: ενεργοποίηση με αντιγόνο => σωματική υπερμετάλλαξη
(SHM) => μεγάλο φάσμα αντισωμάτων => συγγενής ωρίμανση.
• Λευχαιμία: κάποιοι κλώνοι μεταλλάσσονται και αναπαράγονται
ανεξέλεγκτα => συσσώρευση καρκινικών κυττάρων.
 ΣΤΟΧΟΣ:
Μοντελοποίηση της πορείας εξέλιξης τέτοιων κλωνικών ακολουθιών
4
Γράφος – Παράδειγμα δείγματος
5
Δεδομένα Εισόδου – Παράδειγμα
αρχείου ομαδοποιημένων κλωνότυπων
6
Δεδομένα Εισόδου – Παράδειγμα αρχείου αλληλουχίας
βάσεων
7
Γενική Δομή Μεθοδολογίας
8
Κατηγορίες και Υποκατηγορίες
Δειγμάτων
Type of
Leukemia
Subtype of
Leukemia
Frequent Immunoglobulin
Genes
Number of
Samples
CLL Subset 2 IGHV3 – 21, IGLV3 – 21 73
CLL Subset 4 IGHV4 – 34 7
CLL Subset 6 IGHV1 – 69 4
CLL Subset 8 IGHV4 – 39 5
CLL Subset 169 IGHV3 – 48 7
CLL Non – Subset IGHV4 – 34 5
MBL Monoclonal IGHV3 – 23, IGLV2 – 14 41
MBL Oligoclonal
IGHV3 – 23,
IGHV4 – 34
48
SMZL N/A IGHV1 – 2 61
9
1η Μέθοδος – Εξόρυξη Συχνών
Υπογράφων (FSM)
10
FSM – Γενική μορφή αρχείου εισόδου
gSpan
11
FSM - Αποτελέσματα
• 27 συχνοί μοναδιαίοι κόμβοι =>
π.χ. {a80g a82g g107c g129a a167t a193g} =>
support = 3 δείγματα, CLL Subset 2, IGLV3-21 =>
συχνά υποσύνολα μεταλλάξεων.
• 4 μέγιστοι συχνοί υπογράφοι =>
2-3 επίπεδα εξέλιξης =>
3-5 σημειακές μεταλλάξεις.
• Ελάχιστο support = 3, Μέγιστο support = 11 (για μοναδιαίο κόμβο).
12
FSM – 1ο παράδειγμα μοτίβου
CLL Subset 2. IGLV3-21. min_support = 3
13
FSM – 2ο παράδειγμα μοτίβου
Monoclonal MBL. IGLV2-14. min_support = 3 14
2η Μέθοδος – Εξόρυξη Κανόνων
Συσχέτισης (ARM)
Κανόνες: A => B
15
ARM – Διαμόρφωση αρχείου
εισόδου A – priori
16
ARM – Διαδικασία εξόρυξης
17
Αποτελέσματα ARM – Μεμονωμένες
μεταλλάξεις
18
Αποτελέσματα ARM – Ζεύγη μεταλλάξεων (support)
19
Αποτελέσματα ARM – Ζεύγη μεταλλάξεων (confidence)
20
Αποτελέσματα ARM – Διάγραμμα
διασποράς (lift)
21
Αποτελέσματα ARM – Διάγραμμα
διασποράς (πλήθος μεταλλάξεων)
22
ARM – 1ο παράδειγμα μοτίβου
CLL Subset 169. IGHV3-48. min_support = 4. min_confidence = 80%
23
ARM – 2ο παράδειγμα μοτίβου
SMZL. IGHV3-23. min_support = 4. min_confidence = 80%
24
ARM – Αποτελέσματα
• 68 μέγιστοι συχνοί υπογράφοι =>
2-10 επίπεδα εξέλιξης =>
3-10 σημειακές μεταλλάξεις
• Ελάχιστο support = 4
Μέγιστο support = 36 (για σημειακή μετάλλαξη)
• Ελάχιστο confidence = 80%
Μέγιστο confidence = 100%
• Αύξηση τιμών:
- Μέσο support από 3 σε 4-6
- Εύρος από 2-3 επίπεδα εξέλιξης σε 2-10
- Πλήθος εμπλεκόμενων μεταλλάξεων από 3-5 σε 3-10
- Πλήθος ανακαλυφθέντων μοτίβων από 4 σε 68
25
3η Μέθοδος – Σύνθεση Υπερδικτύων
και Αποτελέσματα
• Πρωταρχική ταξινόμηση βάσει γονιδίου => 5 υπερδίκτυα: IGHV3-21, IGHV3-23, IGHV4-34,
IGLV2-14, IGLV3-21.
• Δευτερογενής ταξινόμηση βάσει τύπου λευχαιμίας => 7 εξειδικευμένα υπερδίκτυα:
Ελάχιστο support = 3 – 5, Ελάχιστο confidence = 80%. 26
Σύνθεση υπερδικτύων βάσει γονιδίου
ανοσοσφαιρίνης - Παράδειγμα
IGHV3-21. min_support = 3. min_confidence = 80%
27
Σύνθεση υπερδικτύων βάσει γονιδίου
ανοσοσφαιρίνης - Παράδειγμα
IGHV3-21. min_support = 3. min_confidence = 80% 28
Σύνθεση υπερδικτύων βάσει γονιδίου
ανοσοσφαιρίνης - Παράδειγμα
IGHV3-21. min_support = 3. min_confidence = 80%
29
Σύνθεση Υπερδικτύων – Συστάδες και
κατηγορίες δειγμάτων
Immunoglobulin
Gene
Type of
Leukemia
Number of
Samples
Min
Support
Min
Confidence
IGHV3 – 21 CLL subset 2 24 3 (0.12) 80% (0.8)
IGHV3 – 21 MBL
3 (no strong
rules)
- -
IGHV3 – 21 SMZL
1 (not enough
samples)
- -
IGHV3 – 23 MBL 4 3 (0.75) 80% (0.8)
IGHV3 – 23 SMZL 9 3 (0.33) 80% (0.8)
IGHV4 – 34
CLL non –
subset
5 4 (0.8) 80% (0.8)
IGHV4 – 34 CLL subset 4
1 (not enough
samples)
- -
IGHV4 – 34 MBL 11 4 (0.36) 80% (0.8)
IGHV4 – 34 SMZL
8 (no strong
rules)
- -
IGLV2 – 14
monoclonal
MBL
11 3 (0.27) 80% (0.8)
IGLV3 – 21 CLL subset 2 44 5 (0.11) 80% (0.8)
IGLV3 – 21
monoclonal
MBL
1 (not enough
samples)
- -
30
Σύνθεση Υπερδικτύων – 1ο
παράδειγμα υπερδικτύου
Monoclonal MBL. IGLV2-14. min_support = 3. min_confidence = 80% 31
Σύνθεση Υπερδικτύων – 2ο
παράδειγμα υπερδικτύου
CLL Subset 2. IGLV3-21. min_support = 5. min_confidence = 80% 32
Συμπεράσματα και Συνολική Αξιολόγηση
• Τρεις μεθοδολογίες => αξιοσημείωτο πλήθος ποικιλόμορφων μοτίβων.
• Αποτελέσματα/Μοτίβα => 3 βασικές μεταβλητές:
 πλήθος και πληροφορία εξέλιξης μεταλλάξεων
 κατηγορία γονιδίου ανοσοσφαιρίνης
 κατηγορία τύπου ασθένειας.
• Ποιοτική αξιοποίηση => 3 κύριοι άξονες:
 αναγνώριση/ταυτοποίηση μοτίβων (pattern recognition)
 πρόβλεψη/εκτίμηση εξέλιξης καταστάσεων (evolution prediction)
 κατηγοριοποίηση περιστατικών (case classification).
• Ποσοτική αξιολόγηση => support, confidence και υπόλοιπες μετρικές =>
συχνότητα και ισχύς μοτίβων.
33
Μελλοντικές Επεκτάσεις
• Δημιουργία ενός γενετικού μοντέλου (generative model) από τους
γράφους που παράγονται.
• Επέκταση της μεθόδου ώστε να λαμβάνει υπόψη επιπλέον
κλινικοβιολογικά χαρακτηριστικά ανά δείγμα.
• Επέκταση της μεθόδου ώστε να αξιολογεί την εγγύτητα των αμινοξέων
στις μεταλλάξεις, με βάση τις φυσικοχημικές ιδιότητες.
• Διερεύνηση εφαρμογής της μεθόδου σε αντίστοιχα δεδομένα
χρονοσειρών και όχι απαραίτητα σε επιστήμες ζωής.
34
Σύνδεσμοι Εργαλείων
• IgIDivA (R): https://github.com/laurazara/IgIDivA
• gSpan (Python): https://github.com/betterenvi/gSpan
• A – priori (R): https://www.datacamp.com/tutorial/market-basket-
analysis-r
35
Ευχαριστίες
Ευχαριστώ πολύ τον κ. Μήτκα, όπως και τον κ.
Διαμαντόπουλο και τον κ. Ψωμόπουλο για την
εμπιστοσύνη τους και τη βοήθειά τους κατά τη
συγγραφή της παρούσας διπλωματικής.
36

Contenu connexe

Tendances

Συνεχής έµµεση αυθεντικοποίηση χρηστών κινητού τηλεφώνου µέσω ανάλυσης συµπερ...
Συνεχής έµµεση αυθεντικοποίηση χρηστών κινητού τηλεφώνου µέσω ανάλυσης συµπερ...Συνεχής έµµεση αυθεντικοποίηση χρηστών κινητού τηλεφώνου µέσω ανάλυσης συµπερ...
Συνεχής έµµεση αυθεντικοποίηση χρηστών κινητού τηλεφώνου µέσω ανάλυσης συµπερ...
ISSEL
 
FIT2012招待講演「異常検知技術のビジネス応用最前線」
FIT2012招待講演「異常検知技術のビジネス応用最前線」FIT2012招待講演「異常検知技術のビジネス応用最前線」
FIT2012招待講演「異常検知技術のビジネス応用最前線」
Shohei Hido
 
Normalization of microarray
Normalization of microarrayNormalization of microarray
Normalization of microarray
弘毅 露崎
 
整数計画法に基づく説明可能性な機械学習へのアプローチ
整数計画法に基づく説明可能性な機械学習へのアプローチ整数計画法に基づく説明可能性な機械学習へのアプローチ
整数計画法に基づく説明可能性な機械学習へのアプローチ
Kentaro Kanamori
 

Tendances (20)

Συνεχής έµµεση αυθεντικοποίηση χρηστών κινητού τηλεφώνου µέσω ανάλυσης συµπερ...
Συνεχής έµµεση αυθεντικοποίηση χρηστών κινητού τηλεφώνου µέσω ανάλυσης συµπερ...Συνεχής έµµεση αυθεντικοποίηση χρηστών κινητού τηλεφώνου µέσω ανάλυσης συµπερ...
Συνεχής έµµεση αυθεντικοποίηση χρηστών κινητού τηλεφώνου µέσω ανάλυσης συµπερ...
 
FIT2012招待講演「異常検知技術のビジネス応用最前線」
FIT2012招待講演「異常検知技術のビジネス応用最前線」FIT2012招待講演「異常検知技術のビジネス応用最前線」
FIT2012招待講演「異常検知技術のビジネス応用最前線」
 
Dimitra Ntzioni
Dimitra NtzioniDimitra Ntzioni
Dimitra Ntzioni
 
Anomaly detection survey
Anomaly detection surveyAnomaly detection survey
Anomaly detection survey
 
ECCV2020 Oral論文 完全読破(1/2)
ECCV2020 Oral論文 完全読破(1/2)ECCV2020 Oral論文 完全読破(1/2)
ECCV2020 Oral論文 完全読破(1/2)
 
Normalization of microarray
Normalization of microarrayNormalization of microarray
Normalization of microarray
 
[DL輪読会]Opening the Black Box of Deep Neural Networks via Information
[DL輪読会]Opening the Black Box of Deep Neural Networks via Information[DL輪読会]Opening the Black Box of Deep Neural Networks via Information
[DL輪読会]Opening the Black Box of Deep Neural Networks via Information
 
テンソル多重線形ランクの推定法について(Estimation of Multi-linear Tensor Rank)
テンソル多重線形ランクの推定法について(Estimation of Multi-linear Tensor Rank)テンソル多重線形ランクの推定法について(Estimation of Multi-linear Tensor Rank)
テンソル多重線形ランクの推定法について(Estimation of Multi-linear Tensor Rank)
 
整数計画法に基づく説明可能性な機械学習へのアプローチ
整数計画法に基づく説明可能性な機械学習へのアプローチ整数計画法に基づく説明可能性な機械学習へのアプローチ
整数計画法に基づく説明可能性な機械学習へのアプローチ
 
[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報
 
CTCに基づく音響イベントからの擬音語表現への変換
CTCに基づく音響イベントからの擬音語表現への変換CTCに基づく音響イベントからの擬音語表現への変換
CTCに基づく音響イベントからの擬音語表現への変換
 
Random Forest による分類
Random Forest による分類Random Forest による分類
Random Forest による分類
 
Deep Learning Lab 異常検知入門
Deep Learning Lab 異常検知入門Deep Learning Lab 異常検知入門
Deep Learning Lab 異常検知入門
 
Devil is in the Edges: Learning Semantic Boundaries from Noisy Annotations
Devil is in the Edges: Learning Semantic Boundaries from Noisy AnnotationsDevil is in the Edges: Learning Semantic Boundaries from Noisy Annotations
Devil is in the Edges: Learning Semantic Boundaries from Noisy Annotations
 
機械学習を用いたfNIRSの解析手法の提案
機械学習を用いたfNIRSの解析手法の提案機械学習を用いたfNIRSの解析手法の提案
機械学習を用いたfNIRSの解析手法の提案
 
SSII2021 [OS3-03] 画像と点群を用いた、森林という広域空間のゾーニングと施業管理
SSII2021 [OS3-03] 画像と点群を用いた、森林という広域空間のゾーニングと施業管理SSII2021 [OS3-03] 画像と点群を用いた、森林という広域空間のゾーニングと施業管理
SSII2021 [OS3-03] 画像と点群を用いた、森林という広域空間のゾーニングと施業管理
 
Active Learning と Bayesian Neural Network
Active Learning と Bayesian Neural NetworkActive Learning と Bayesian Neural Network
Active Learning と Bayesian Neural Network
 
[Tutorial] Sentence Representation
[Tutorial] Sentence Representation[Tutorial] Sentence Representation
[Tutorial] Sentence Representation
 
【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptx
【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptx【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptx
【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptx
 
バイオインフォマティクスによる遺伝子発現解析
バイオインフォマティクスによる遺伝子発現解析バイオインフォマティクスによる遺伝子発現解析
バイオインフォマティクスによる遺伝子発現解析
 

Similaire à Ένα Πλαίσιο Εξόρυξης Γράφων για την Εκτίμηση της Εξέλιξης Ακολουθιών και Εφαρμογές του στη Βιοπληροφορική

Συνεχής έμμεση αυθεντικοποίηση χρηστών κινητού τηλεφώνου με συνδυασμό των δεδ...
Συνεχής έμμεση αυθεντικοποίηση χρηστών κινητού τηλεφώνου με συνδυασμό των δεδ...Συνεχής έμμεση αυθεντικοποίηση χρηστών κινητού τηλεφώνου με συνδυασμό των δεδ...
Συνεχής έμμεση αυθεντικοποίηση χρηστών κινητού τηλεφώνου με συνδυασμό των δεδ...
ISSEL
 
Παρουσίαση MSc Avgeris
Παρουσίαση MSc AvgerisΠαρουσίαση MSc Avgeris
Παρουσίαση MSc Avgeris
Efthimis Avgeris
 
System Development for Prediction of Static Analysis Metrics of Source Code
System Development for Prediction of Static Analysis Metrics of Source CodeSystem Development for Prediction of Static Analysis Metrics of Source Code
System Development for Prediction of Static Analysis Metrics of Source Code
ISSEL
 
Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ...
Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ...Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ...
Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ...
ISSEL
 
Ανάλυση αθλητικών επιδόσεων με τη χρήση του συστήματος REMEDES
Ανάλυση αθλητικών επιδόσεων με τη χρήση του συστήματος REMEDESΑνάλυση αθλητικών επιδόσεων με τη χρήση του συστήματος REMEDES
Ανάλυση αθλητικών επιδόσεων με τη χρήση του συστήματος REMEDES
ISSEL
 

Similaire à Ένα Πλαίσιο Εξόρυξης Γράφων για την Εκτίμηση της Εξέλιξης Ακολουθιών και Εφαρμογές του στη Βιοπληροφορική (17)

Περδικίδης Μιχάλης 7594
Περδικίδης Μιχάλης 7594Περδικίδης Μιχάλης 7594
Περδικίδης Μιχάλης 7594
 
Συνεχής έμμεση αυθεντικοποίηση χρηστών κινητού τηλεφώνου με συνδυασμό των δεδ...
Συνεχής έμμεση αυθεντικοποίηση χρηστών κινητού τηλεφώνου με συνδυασμό των δεδ...Συνεχής έμμεση αυθεντικοποίηση χρηστών κινητού τηλεφώνου με συνδυασμό των δεδ...
Συνεχής έμμεση αυθεντικοποίηση χρηστών κινητού τηλεφώνου με συνδυασμό των δεδ...
 
λυρατζοπουλος τεχνικές - ορμόνες - αντισώματα - μελέτη γονιδίου
λυρατζοπουλος   τεχνικές - ορμόνες - αντισώματα - μελέτη γονιδίουλυρατζοπουλος   τεχνικές - ορμόνες - αντισώματα - μελέτη γονιδίου
λυρατζοπουλος τεχνικές - ορμόνες - αντισώματα - μελέτη γονιδίου
 
Μαρίνα Γέραλη
Μαρίνα Γέραλη Μαρίνα Γέραλη
Μαρίνα Γέραλη
 
Konstantinos Koukoutegos Diploma Thesis Presentation
Konstantinos Koukoutegos Diploma Thesis PresentationKonstantinos Koukoutegos Diploma Thesis Presentation
Konstantinos Koukoutegos Diploma Thesis Presentation
 
ISO 15189 Accreditation - Genetic testing in Hematological neoplasms
ISO 15189 Accreditation - Genetic testing in Hematological neoplasms ISO 15189 Accreditation - Genetic testing in Hematological neoplasms
ISO 15189 Accreditation - Genetic testing in Hematological neoplasms
 
Παρουσίαση MSc Avgeris
Παρουσίαση MSc AvgerisΠαρουσίαση MSc Avgeris
Παρουσίαση MSc Avgeris
 
System Development for Prediction of Static Analysis Metrics of Source Code
System Development for Prediction of Static Analysis Metrics of Source CodeSystem Development for Prediction of Static Analysis Metrics of Source Code
System Development for Prediction of Static Analysis Metrics of Source Code
 
Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ...
Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ...Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ...
Ανάπτυξη συστήματος πρόβλεψης της εξέλιξης των μετρικών στατικής ανάλυσης πηγ...
 
Γεροκώστα
ΓεροκώσταΓεροκώστα
Γεροκώστα
 
Μοσχογλου Στυλιανός
Μοσχογλου ΣτυλιανόςΜοσχογλου Στυλιανός
Μοσχογλου Στυλιανός
 
Αναστασία Ηροδότου
Αναστασία ΗροδότουΑναστασία Ηροδότου
Αναστασία Ηροδότου
 
Melpomeni Seraki Diploma Thesis Presentation
Melpomeni Seraki Diploma Thesis PresentationMelpomeni Seraki Diploma Thesis Presentation
Melpomeni Seraki Diploma Thesis Presentation
 
diplomatiki_vatikiotis
diplomatiki_vatikiotisdiplomatiki_vatikiotis
diplomatiki_vatikiotis
 
Presentation__
Presentation__Presentation__
Presentation__
 
Ανάλυση αθλητικών επιδόσεων με τη χρήση του συστήματος REMEDES
Ανάλυση αθλητικών επιδόσεων με τη χρήση του συστήματος REMEDESΑνάλυση αθλητικών επιδόσεων με τη χρήση του συστήματος REMEDES
Ανάλυση αθλητικών επιδόσεων με τη χρήση του συστήματος REMEDES
 
Basketball data analytics via Machine Learning techniques using the REMEDES s...
Basketball data analytics via Machine Learning techniques using the REMEDES s...Basketball data analytics via Machine Learning techniques using the REMEDES s...
Basketball data analytics via Machine Learning techniques using the REMEDES s...
 

Plus de ISSEL

Implementation of a platform for assessing indoor spaces regarding their frie...
Implementation of a platform for assessing indoor spaces regarding their frie...Implementation of a platform for assessing indoor spaces regarding their frie...
Implementation of a platform for assessing indoor spaces regarding their frie...
ISSEL
 
Autonomous car position calculation with particle filters using traffic data ...
Autonomous car position calculation with particle filters using traffic data ...Autonomous car position calculation with particle filters using traffic data ...
Autonomous car position calculation with particle filters using traffic data ...
ISSEL
 
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...
ISSEL
 
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
ISSEL
 
Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...
Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...
Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...
ISSEL
 
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής Νοημοσύνης
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής ΝοημοσύνηςΑνάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής Νοημοσύνης
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής Νοημοσύνης
ISSEL
 
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptx
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptxΑνάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptx
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptx
ISSEL
 
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...
ISSEL
 
Εφαρµογή Τεχνικών Μηχανικής Μάθησης για την Ανάλυση Αλλαγών Κώδικα µε στόχο τ...
Εφαρµογή Τεχνικών Μηχανικής Μάθησης για την Ανάλυση Αλλαγών Κώδικα µε στόχο τ...Εφαρµογή Τεχνικών Μηχανικής Μάθησης για την Ανάλυση Αλλαγών Κώδικα µε στόχο τ...
Εφαρµογή Τεχνικών Μηχανικής Μάθησης για την Ανάλυση Αλλαγών Κώδικα µε στόχο τ...
ISSEL
 
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...
ISSEL
 
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...
ISSEL
 
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας Ισχυρισμών
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας ΙσχυρισμώνΔημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας Ισχυρισμών
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας Ισχυρισμών
ISSEL
 
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµαταΕξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
ISSEL
 
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των διαδικασιών κατασκευής συστημάτων λο...
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των  διαδικασιών κατασκευής συστημάτων λο...Ανάπτυξη Μηχανισμών Αυτοματοποίησης των  διαδικασιών κατασκευής συστημάτων λο...
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των διαδικασιών κατασκευής συστημάτων λο...
ISSEL
 
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...
ISSEL
 
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...
ISSEL
 
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικού
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικούΕξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικού
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικού
ISSEL
 
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία Εφαρµογής
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία ΕφαρµογήςΑνάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία Εφαρµογής
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία Εφαρµογής
ISSEL
 
Camera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environmentsCamera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environments
ISSEL
 
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
ISSEL
 

Plus de ISSEL (20)

Implementation of a platform for assessing indoor spaces regarding their frie...
Implementation of a platform for assessing indoor spaces regarding their frie...Implementation of a platform for assessing indoor spaces regarding their frie...
Implementation of a platform for assessing indoor spaces regarding their frie...
 
Autonomous car position calculation with particle filters using traffic data ...
Autonomous car position calculation with particle filters using traffic data ...Autonomous car position calculation with particle filters using traffic data ...
Autonomous car position calculation with particle filters using traffic data ...
 
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...
Ανίχνευση αντικειµένων από λίγα δείγµατα µε χρήση γραφηµάτων και τεχνικών ΜΕΤ...
 
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
 
Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...
Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...
Ανάπτυξη ∆υναµικού και Προσωποποιηµένου Συστήµατος Ερωταπαντήσεων µε Πηγή το ...
 
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής Νοημοσύνης
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής ΝοημοσύνηςΑνάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής Νοημοσύνης
Ανάπτυξη Φίλτρων Ανεπιθύμητων Μηνυμάτων με Χρήση Τεχνικών Τεχνητής Νοημοσύνης
 
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptx
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptxΑνάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptx
Ανάπτυξη Ελληνικών Μοντέλων Εντοπισμού Ρητορικής Μίσους.pptx
 
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...
Σχεδιασμός και υλοποίηση πλήρους και αυτοματοποιημένου εργαλείου ελέγχων ασφά...
 
Εφαρµογή Τεχνικών Μηχανικής Μάθησης για την Ανάλυση Αλλαγών Κώδικα µε στόχο τ...
Εφαρµογή Τεχνικών Μηχανικής Μάθησης για την Ανάλυση Αλλαγών Κώδικα µε στόχο τ...Εφαρµογή Τεχνικών Μηχανικής Μάθησης για την Ανάλυση Αλλαγών Κώδικα µε στόχο τ...
Εφαρµογή Τεχνικών Μηχανικής Μάθησης για την Ανάλυση Αλλαγών Κώδικα µε στόχο τ...
 
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...
Ανάπτυξη συστήματος ιεραρχικής ομαδοποίησης και διαχείρισης κειμένων για αποκ...
 
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...
Ανάπτυξη γραφικής διεπαφής σε σύστημα προσομοίωσης ηλεκτρονικών αγορών με στό...
 
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας Ισχυρισμών
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας ΙσχυρισμώνΔημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας Ισχυρισμών
Δημιουργία Ολοκληρωμένου Συστήματος Επαλήθευσης Ορθότητας Ισχυρισμών
 
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµαταΕξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
Εξόρυξη δεδοµένων για τη δυναµική ενσωµάτωση γνώσης σε πολυπρακτορικά συστήµατα
 
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των διαδικασιών κατασκευής συστημάτων λο...
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των  διαδικασιών κατασκευής συστημάτων λο...Ανάπτυξη Μηχανισμών Αυτοματοποίησης των  διαδικασιών κατασκευής συστημάτων λο...
Ανάπτυξη Μηχανισμών Αυτοματοποίησης των διαδικασιών κατασκευής συστημάτων λο...
 
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...
ΕΥΦΥΗΣ ΜΕΘΟΔΟΛΟΓΙΑ ΑΠΟΤΙΜΗΣΗΣ ΤΟΥ ΒΑΘΜΟΥ ΔΙΑΤΗΡΗΣΙΜΟΤΗΤΑΣ ΕΡΓΩΝ ΛΟΓΙΣΜΙΚΟΥ ΜΕ...
 
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...
Μηχανισμοί αυτοματοποίησης διαδικασιών σχεδίασης, υλοποίησης και ανάπτυξης λο...
 
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικού
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικούΕξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικού
Εξόρυξη δεδομένων τεχνολογίας λογισμικού για επαναχρησιμοποίηση λογισμικού
 
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία Εφαρµογής
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία ΕφαρµογήςΑνάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία Εφαρµογής
Ανάλυση ∆εδοµένων ΄Εργων Λογισµικού για Ανάπτυξη σε Νέα Πεδία Εφαρµογής
 
Camera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environmentsCamera-based localization of annotated objects in indoor environments
Camera-based localization of annotated objects in indoor environments
 
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
Εντοπισμός θέσης επισημασμένου αντικειμένου σε εσωτερικό χώρο με χρήση πολλαπ...
 

Ένα Πλαίσιο Εξόρυξης Γράφων για την Εκτίμηση της Εξέλιξης Ακολουθιών και Εφαρμογές του στη Βιοπληροφορική

  • 1. ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Διπλωματική Εργασία Ένα Πλαίσιο Εξόρυξης Γράφων για την Εκτίμηση της Εξέλιξης Ακολουθιών και Εφαρμογές του στη Βιοπληροφορική Αμπραχαμιάν Σεροβπέ ΑΕΜ: 8773 Επιβλέπων: Περικλής Α. Μήτκας, Καθηγητής Α.Π.Θ. Συνεπιβλέπων: Θεμιστοκλής Διαμαντόπουλος, Μεταδιδακτορικός Ερευνητής Συνεπιβλέπων: Φώτης Ε. Ψωμόπουλος, Κύριος Ερευνητής ΙΝΕΒ|ΕΚΕΤΑ Εργαστήριο Ευφυών Συστημάτων και Τεχνολογίας Λογισμικού (ISSEL) Θεσσαλονίκη, 3 Απριλίου 2023 1
  • 2. Θέμα Διπλωματικής Εργασίας • Με είσοδο ένα πλήθος διαφορετικών γράφων, κάθε ένας από τους οποίους αποτυπώνει μια διαφορετική πορεία/εξέλιξη μιας ακολουθίας ανοσοσφαιρίνης σε καρκινικά κύτταρα ενός ασθενή με λευχαιμία, Στόχος είναι:  Να εντοπισθούν κοινά μοτίβα και να συνδεθούν οι γράφοι σε μεγαλύτερα υπερδίκτυα, τα οποία θα μπορούν να ερμηνεύουν και τη γενικότερη πορεία εξέλιξης της ασθένειας. 2
  • 3. Θεωρητικό Υπόβαθρο – Τι είναι η ανοσοσφαιρίνη • Ανοσοσφαιρίνη – αντίσωμα => πρωτεΐνη => καταπολέμηση παθογόνων μικροοργανισμών => διέγερση από αντιγόνο • Δύο μεγάλες βαριές αλυσίδες (H) και δύο μικρές ελαφριές αλυσίδες (L) • Σταθερή περιοχή => κοινή για όλα τα αντισώματα Μεταβλητή περιοχή => εξαιρετικά ποικιλόμορφη • Τεράστια ποικιλότητα αντισωμάτων => αναγνώριση εξίσου μεγάλης ποικιλίας αντιγόνων 3
  • 4. Θεωρητικό Υπόβαθρο Τι είναι η λευχαιμία και πώς προκαλείται • Λευχαιμία => καρκίνος του αίματος ή του μυελού των οστών => οξεία/χρόνια και λεμφοκυτταρική/μυελογενής. • Χρόνια Λεμφοκυτταρική Λευχαιμία (CLL) => Β – λεμφοκύτταρα => υπερβολική παραγωγή ανώριμων μη φυσιολογικών μορφών. • Φυσιολογικό: ενεργοποίηση με αντιγόνο => σωματική υπερμετάλλαξη (SHM) => μεγάλο φάσμα αντισωμάτων => συγγενής ωρίμανση. • Λευχαιμία: κάποιοι κλώνοι μεταλλάσσονται και αναπαράγονται ανεξέλεγκτα => συσσώρευση καρκινικών κυττάρων.  ΣΤΟΧΟΣ: Μοντελοποίηση της πορείας εξέλιξης τέτοιων κλωνικών ακολουθιών 4
  • 6. Δεδομένα Εισόδου – Παράδειγμα αρχείου ομαδοποιημένων κλωνότυπων 6
  • 7. Δεδομένα Εισόδου – Παράδειγμα αρχείου αλληλουχίας βάσεων 7
  • 9. Κατηγορίες και Υποκατηγορίες Δειγμάτων Type of Leukemia Subtype of Leukemia Frequent Immunoglobulin Genes Number of Samples CLL Subset 2 IGHV3 – 21, IGLV3 – 21 73 CLL Subset 4 IGHV4 – 34 7 CLL Subset 6 IGHV1 – 69 4 CLL Subset 8 IGHV4 – 39 5 CLL Subset 169 IGHV3 – 48 7 CLL Non – Subset IGHV4 – 34 5 MBL Monoclonal IGHV3 – 23, IGLV2 – 14 41 MBL Oligoclonal IGHV3 – 23, IGHV4 – 34 48 SMZL N/A IGHV1 – 2 61 9
  • 10. 1η Μέθοδος – Εξόρυξη Συχνών Υπογράφων (FSM) 10
  • 11. FSM – Γενική μορφή αρχείου εισόδου gSpan 11
  • 12. FSM - Αποτελέσματα • 27 συχνοί μοναδιαίοι κόμβοι => π.χ. {a80g a82g g107c g129a a167t a193g} => support = 3 δείγματα, CLL Subset 2, IGLV3-21 => συχνά υποσύνολα μεταλλάξεων. • 4 μέγιστοι συχνοί υπογράφοι => 2-3 επίπεδα εξέλιξης => 3-5 σημειακές μεταλλάξεις. • Ελάχιστο support = 3, Μέγιστο support = 11 (για μοναδιαίο κόμβο). 12
  • 13. FSM – 1ο παράδειγμα μοτίβου CLL Subset 2. IGLV3-21. min_support = 3 13
  • 14. FSM – 2ο παράδειγμα μοτίβου Monoclonal MBL. IGLV2-14. min_support = 3 14
  • 15. 2η Μέθοδος – Εξόρυξη Κανόνων Συσχέτισης (ARM) Κανόνες: A => B 15
  • 16. ARM – Διαμόρφωση αρχείου εισόδου A – priori 16
  • 17. ARM – Διαδικασία εξόρυξης 17
  • 18. Αποτελέσματα ARM – Μεμονωμένες μεταλλάξεις 18
  • 19. Αποτελέσματα ARM – Ζεύγη μεταλλάξεων (support) 19
  • 20. Αποτελέσματα ARM – Ζεύγη μεταλλάξεων (confidence) 20
  • 21. Αποτελέσματα ARM – Διάγραμμα διασποράς (lift) 21
  • 22. Αποτελέσματα ARM – Διάγραμμα διασποράς (πλήθος μεταλλάξεων) 22
  • 23. ARM – 1ο παράδειγμα μοτίβου CLL Subset 169. IGHV3-48. min_support = 4. min_confidence = 80% 23
  • 24. ARM – 2ο παράδειγμα μοτίβου SMZL. IGHV3-23. min_support = 4. min_confidence = 80% 24
  • 25. ARM – Αποτελέσματα • 68 μέγιστοι συχνοί υπογράφοι => 2-10 επίπεδα εξέλιξης => 3-10 σημειακές μεταλλάξεις • Ελάχιστο support = 4 Μέγιστο support = 36 (για σημειακή μετάλλαξη) • Ελάχιστο confidence = 80% Μέγιστο confidence = 100% • Αύξηση τιμών: - Μέσο support από 3 σε 4-6 - Εύρος από 2-3 επίπεδα εξέλιξης σε 2-10 - Πλήθος εμπλεκόμενων μεταλλάξεων από 3-5 σε 3-10 - Πλήθος ανακαλυφθέντων μοτίβων από 4 σε 68 25
  • 26. 3η Μέθοδος – Σύνθεση Υπερδικτύων και Αποτελέσματα • Πρωταρχική ταξινόμηση βάσει γονιδίου => 5 υπερδίκτυα: IGHV3-21, IGHV3-23, IGHV4-34, IGLV2-14, IGLV3-21. • Δευτερογενής ταξινόμηση βάσει τύπου λευχαιμίας => 7 εξειδικευμένα υπερδίκτυα: Ελάχιστο support = 3 – 5, Ελάχιστο confidence = 80%. 26
  • 27. Σύνθεση υπερδικτύων βάσει γονιδίου ανοσοσφαιρίνης - Παράδειγμα IGHV3-21. min_support = 3. min_confidence = 80% 27
  • 28. Σύνθεση υπερδικτύων βάσει γονιδίου ανοσοσφαιρίνης - Παράδειγμα IGHV3-21. min_support = 3. min_confidence = 80% 28
  • 29. Σύνθεση υπερδικτύων βάσει γονιδίου ανοσοσφαιρίνης - Παράδειγμα IGHV3-21. min_support = 3. min_confidence = 80% 29
  • 30. Σύνθεση Υπερδικτύων – Συστάδες και κατηγορίες δειγμάτων Immunoglobulin Gene Type of Leukemia Number of Samples Min Support Min Confidence IGHV3 – 21 CLL subset 2 24 3 (0.12) 80% (0.8) IGHV3 – 21 MBL 3 (no strong rules) - - IGHV3 – 21 SMZL 1 (not enough samples) - - IGHV3 – 23 MBL 4 3 (0.75) 80% (0.8) IGHV3 – 23 SMZL 9 3 (0.33) 80% (0.8) IGHV4 – 34 CLL non – subset 5 4 (0.8) 80% (0.8) IGHV4 – 34 CLL subset 4 1 (not enough samples) - - IGHV4 – 34 MBL 11 4 (0.36) 80% (0.8) IGHV4 – 34 SMZL 8 (no strong rules) - - IGLV2 – 14 monoclonal MBL 11 3 (0.27) 80% (0.8) IGLV3 – 21 CLL subset 2 44 5 (0.11) 80% (0.8) IGLV3 – 21 monoclonal MBL 1 (not enough samples) - - 30
  • 31. Σύνθεση Υπερδικτύων – 1ο παράδειγμα υπερδικτύου Monoclonal MBL. IGLV2-14. min_support = 3. min_confidence = 80% 31
  • 32. Σύνθεση Υπερδικτύων – 2ο παράδειγμα υπερδικτύου CLL Subset 2. IGLV3-21. min_support = 5. min_confidence = 80% 32
  • 33. Συμπεράσματα και Συνολική Αξιολόγηση • Τρεις μεθοδολογίες => αξιοσημείωτο πλήθος ποικιλόμορφων μοτίβων. • Αποτελέσματα/Μοτίβα => 3 βασικές μεταβλητές:  πλήθος και πληροφορία εξέλιξης μεταλλάξεων  κατηγορία γονιδίου ανοσοσφαιρίνης  κατηγορία τύπου ασθένειας. • Ποιοτική αξιοποίηση => 3 κύριοι άξονες:  αναγνώριση/ταυτοποίηση μοτίβων (pattern recognition)  πρόβλεψη/εκτίμηση εξέλιξης καταστάσεων (evolution prediction)  κατηγοριοποίηση περιστατικών (case classification). • Ποσοτική αξιολόγηση => support, confidence και υπόλοιπες μετρικές => συχνότητα και ισχύς μοτίβων. 33
  • 34. Μελλοντικές Επεκτάσεις • Δημιουργία ενός γενετικού μοντέλου (generative model) από τους γράφους που παράγονται. • Επέκταση της μεθόδου ώστε να λαμβάνει υπόψη επιπλέον κλινικοβιολογικά χαρακτηριστικά ανά δείγμα. • Επέκταση της μεθόδου ώστε να αξιολογεί την εγγύτητα των αμινοξέων στις μεταλλάξεις, με βάση τις φυσικοχημικές ιδιότητες. • Διερεύνηση εφαρμογής της μεθόδου σε αντίστοιχα δεδομένα χρονοσειρών και όχι απαραίτητα σε επιστήμες ζωής. 34
  • 35. Σύνδεσμοι Εργαλείων • IgIDivA (R): https://github.com/laurazara/IgIDivA • gSpan (Python): https://github.com/betterenvi/gSpan • A – priori (R): https://www.datacamp.com/tutorial/market-basket- analysis-r 35
  • 36. Ευχαριστίες Ευχαριστώ πολύ τον κ. Μήτκα, όπως και τον κ. Διαμαντόπουλο και τον κ. Ψωμόπουλο για την εμπιστοσύνη τους και τη βοήθειά τους κατά τη συγγραφή της παρούσας διπλωματικής. 36