dc.contributor.advisor | Ζήμερας, Στυλιανός | el_GR |
dc.contributor.author | Γιουβάνης, Δημήτριος | el_GR |
dc.coverage.spatial | Σάμος | el_GR |
dc.date.accessioned | 2024-02-05T11:54:30Z | |
dc.date.available | 2024-02-05T11:54:30Z | |
dc.date.issued | 2023-06-15 | |
dc.identifier.uri | http://hdl.handle.net/11610/26137 | |
dc.description.abstract | Η PCA είναι μια μέθοδος υψηλής πρακτικής σημασίας σε πολλές εφαρμογές στατιστικής συμπερασματολογίας, ιδίως όταν αντιμετωπίζεται το πρόβλημα της συσχέτισης πολλών ανεξάρτητων μεταβλητών με πολλές εξαρτημένες μεταβλητές
αποτελέσματα χωρίς αρκετές παρατηρήσεις για την αξιόπιστη εκτέλεση της ανάλυσης. Σε τέτοιες περιπτώσεις, σπάνια υπάρχει αρκετά δεδομένα για την εξαγωγή αξιόπιστων συμπερασμάτων λόγω του μεγάλου αριθμού των μεταβλητών πρόβλεψης. Το μέθοδος PCA αντιμετωπίζει αυτό το πρόβλημα αναθέτοντας τους αρχικούς προγνωστικούς παράγοντες σε ένα σύνολο νέων μεταβλητών γνωστές ως κύριες συνιστώσες. Ένας τέτοιος μετασχηματισμός συνοδεύεται συνήθως από απώλεια πληροφορία. Η ανάλυση κύριων συνιστωσών έχει εφαρμογές σε πολλούς τομείς, όπως η πληθυσμιακή γενετική, μελέτες μικροβιώματος και ατμοσφαιρική επιστήμη. Στην παρούσα εργασία χρησιμοποιούμε την ανάλυση κύριων συνιστωσών για να αναλύσουμε ορισμένα γονίδια για το αν είναι ορυκτά ή όχι και αν είναι συμβιωτικά ή όχι. Στην συνέχεια χρυσημοποιήσαμε την OPLS-DA εξηγώντας γιατί εξηγεί και οπτικοποιεί καλύτερα την συσχέτηση που έχουν τα δεδομένα μας.
Η OPLS είναι μια μοντελοποίηση παλινδρόμησης πολλαπλών εξαρτημένων μεταβλητών σε πολλαπλές ανεξάρτητες μεταβλητές. Το μεγαλύτερο χαρακτηριστικό της είναι ότι μπορεί να αφαιρέσει τη διακύμανση των δεδομένων που δεν έχει καμία σχέση με τις κατηγορικές μεταβλητές, έτσι ώστε να οι κατηγορικές πληροφορίες συγκεντρώνονται κυρίως σε μία κύρια συνιστώσα. Ως εκ τούτου, το μοντέλο
είναι απλό και εύκολο να εξηγηθεί, και το αποτέλεσμα διάκρισης και το αποτέλεσμα οπτικοποίησης του χάρτη βαθμολογίας κύριας συνιστώσας είναι πιο εμφανή.
Το OPLS προήλθε από το PLS και αποτελεί ειδική περίπτωση προβλημάτων του PLS. Η διαφορά μεταξύ της OPLS και της PLS είναι ότι η ανάλυση κρυμμένων συνιστωσών στην OPLS εφαρμόζεται μόνο στους προγνωστικούς μεταβλητές, ενώ η PLS εργάζεται από κοινού τόσο στις μεταβλητές πρόβλεψης όσο και στις μεταβλητές απόκρισης. Έτσι, μόνο εξάγονται τα διανύσματα προβολής από τις μεταβλητές πρόβλεψης. Όπως η παλινδρόμηση PLS και η PLS-DA, η OPLS αναπτύσσει επίσης δύο εκδόσεις. Η μία είναι η παλινδρόμηση OPLS και η άλλη είναι η OPLS-DA για
προβλήματα ταξινόμησης. | el_GR |
dc.format.extent | 71 σ. | el_GR |
dc.language.iso | en | en_US |
dc.rights | Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές | |
dc.rights.uri | https://creativecommons.org/licenses/by-nc-sa/4.0/ | |
dc.subject | ανάλυση κύριων συνιστωσών | el_GR |
dc.subject | γονιδιακή έκφραση | el_GR |
dc.subject | ορθογωνοποιημένα μερικά ελάχιστα τετράγωνα | el_GR |
dc.subject | principal componet analysis | en_US |
dc.subject | gene expression | en_US |
dc.subject | orthogonal partial least squares | en_US |
dc.subject.lcsh | Principal components analysis | en_US |
dc.subject.lcsh | Bioinformatics | en_US |
dc.subject.lcsh | Gene expression | en_US |
dc.title | Ανάλυση κύριων συνιστωσών (PCA, OPLS-DA MODELS): εφαρμογές στην βιοπληροφορική | el_GR |
dcterms.accessRights | free | el_GR |
dcterms.rights | Πλήρες Κείμενο - Ελεύθερη Δημοσίευση | el_GR |
heal.type | bachelorThesis | el_GR |
heal.recordProvider | aegean | el_GR |
heal.committeeMemberName | Παπαροκίδου, Χριστίνα | el_GR |
heal.academicPublisher | Πανεπιστήμιο Αιγαίου - Σχολή Θετικών Επιστημών - Τμήμα Σ.Α.Χ.Μ. | el_GR |
heal.academicPublisherID | aegean | el_GR |
heal.fullTextAvailability | true | el_GR |