Recent advances on dimensionality reduction for high-dimensional data analysis with applications
Πρόσφατες εξελίξεις για μείωση διάστασης στην πολυδιάστατη ανάλυση δεδομένων με εφαρμογές
dc.contributor.advisor | Καραγρηγορίου, Αλέξανδρος | el_GR |
dc.contributor.author | Ντότσης, Κίμων | el_GR |
dc.contributor.author | Ntotsis, Kimon | en_US |
dc.coverage.spatial | Σάμος | el_GR |
dc.date.accessioned | 2023-01-10T10:35:37Z | |
dc.date.available | 2023-01-10T10:35:37Z | |
dc.date.issued | 2022-10-17 | |
dc.identifier.uri | http://hdl.handle.net/11610/24480 | |
dc.description.abstract | Μεγάλης κλίμακος ακατέργαστα δεδομένα μπορεί να αποτύχουν στην ορθή επιλογή και εκτίμηση ενός μοντέλου, γεγονός που συχνά αποδίδεται στην ύπαρξη πολυσυγγραμμικότητας μεταξύ των μεταβλητών, και γι' αυτό συστήνεται η προεπεξεργασία των δεδομένων ώστε να επιτευχθεί καλύτερη μοντελοποίηση και οπτικοποίηση. Για την αντιμετώπιση της τροχοπέδης που δημιουργούν τα ακατέργαστα δεδομένα, μεταξύ άλλων δυσκολιών, αναπτύχθηκαν οι Τεχνικές Μείωσης Διάστασης σε μια προσπάθεια να μετριαστεί το μέγεθος των υπερβολικά παραμετροποιημένων λύσεων που προκύπτουν σε χώρους υψηλών διαστάσεων. Στόχος αυτής της διατριβής, η οποία χρησιμοποιεί εργαλεία πολυμεταβλητής στατιστικής ανάλυσης δεδομένων, είναι να διερευνήσει, να αναλύσει, να συγκρίνει και να βελτιώσει υφιστάμενες τεχνικές, ενώ παράλληλα να εισάγει νέες για την αντιμετώπιση της πολυσυγγραμμικότητας και τη μείωση του χώρου (διάστασης) δεδομένων υψηλών διαστάσεων. Ειδικότερα, η παρούσα διδακτορική διατριβή σκιαγραφεί αρχικά το θεωρητικό πλαίσιο της μη επιβλεπόμενης τεχνικής της Ανάλυσης Κύριων Συνιστωσών καθώς και της αντίστοιχης επιβλεπόμενης δηλ. της μεθόδου Μερικών Ελάχιστων Τετράγωνων. Λόγω της ικανότητάς τους να επιτυγχάνουν μείωση διάστασης κατά την ανάλυση συνόλων δεδομένων υψηλών διαστάσεων, και οι δύο τεχνικές θεωρούνται βέλτιστες για δημιουργία νέων μεταβλητών. Η χρήση της πρώτης σε συνδυασμό με άλλες τεχνικές μείωσης διάστασης, καθώς και η τροποποίηση της δεύτερης, - ώστε να λειτουργεί ταυτόχρονα και ως τεχνική επιλογής μεταβλητών αλλά και ως τεχνική δημιουργίας μεταβλητών-, εφαρμόστηκαν και μελετήθηκαν διεξοδικά στους τομείς της οικονομετρίας, χρηματοοικονομικής και αναλογιστικής επιστήμης. Τέλος, στη διατριβή αυτή προτείνεται ένα εύρωστο και εύκολα ερμηνεύσιμο μη επιβλεπόμενο κριτήριο επιλογής μεταβλητών (Elastic Information Criterion), το οποίο είναι ικανό να εντοπίζει μοτίβα αλληλεξάρτησης μεταξύ των μεταβλητών ενός dataset. Το συγκεκριμένο κριτήριο δρα ταυτόχρονα (i) ως κριτήριο αξιολόγησης της ύπαρξης ή/και του βαθμού της πολυσυγγραμμικότητας και (ii) ως τεχνική επιλογής μεταβλητών. | el_GR |
dc.description.abstract | Large amounts of raw data often can fail to perform properly for model estima- tion, attributed to the existence of multicollinearity between variables, and that is why they must be pre-processed for better modeling and visualization. To address raw data barriers, among other difficulties, Dimension Reduction Techniques were developed in an effort to mitigate the magnitude of over-parametrized solutions that arise in high-dimensional spaces. The aim of this dissertation, which utilizes multivariate analysis tools, is to investigate, analyze, compare, and improve cur- rent techniques while still introducing new ones for dealing with multicollinearity and reducing the feature space of high-dimensional data. In particular, this doc- toral thesis initially outlines the theoretical framework concerning the unsupervised technique, Principal Component Analysis, and its supervised counterpart, the Par- tial Least Squares method. Due to their ability to obtain dimension reduction when analyzing high-dimensional datasets, both techniques are considered optimal for feature extraction. The use of the former in conjunction with other dimension reduc- tion techniques, as well as the modification of the latter, - so that it may be applied as a feature selection and feature extraction simultaneously-, were implemented and thoroughly studied in the fields of econometrics, finance and actuarial science. Fi- nally, a new unsupervised linear feature selection technique is proposed as a robust and easily interpretable methodology, termed Elastic Information Criterion, that is capable of capturing multicollinearity rather accurately and effectively and thus pro- viding a proper dataset assessment. | en_US |
dc.format.extent | 143 σ. | el_GR |
dc.language.iso | en | en_US |
dc.rights | Default License | |
dc.subject | μείωση διαστάσεων | el_GR |
dc.subject | πολυσυγγραμμικότητα | el_GR |
dc.subject | επιλογή μεταβλητών | el_GR |
dc.subject | dimension reduction | en_US |
dc.subject | model selection | en_US |
dc.subject | multicollinearity | en_US |
dc.subject.lcsh | Data reduction | en_US |
dc.subject.lcsh | Dimension reduction (Statistics) | en_US |
dc.subject.lcsh | Multicollinearity | en_US |
dc.title | Recent advances on dimensionality reduction for high-dimensional data analysis with applications | en_US |
dc.title | Πρόσφατες εξελίξεις για μείωση διάστασης στην πολυδιάστατη ανάλυση δεδομένων με εφαρμογές | el_GR |
dcterms.accessRights | free | el_GR |
dcterms.rights | Πλήρες Κείμενο - Ελεύθερη Δημοσίευση | el_GR |
heal.type | doctoralThesis | el_GR |
heal.recordProvider | aegean | el_GR |
heal.committeeMemberName | Ρακιτζής, Αθανάσιος | el_GR |
heal.committeeMemberName | Αρτεμίου, Ανδρέας | el_GR |
heal.committeeMemberName | Χατζόπουλος, Πέτρος | el_GR |
heal.committeeMemberName | Κουντζάκης, Χρήστος | el_GR |
heal.committeeMemberName | Γάκη, Ελένη | el_GR |
heal.committeeMemberName | Τσιλίκα, Κυριακή | el_GR |
heal.academicPublisher | Πανεπιστήμιο Αιγαίου - Σχολή Θετικών Επιστημών - Τμήμα Σ.Α.Χ.Μ. | el_GR |
heal.academicPublisherID | aegean | el_GR |
heal.fullTextAvailability | true | el_GR |
dc.contributor.department | Στατιστική και Αναλογιστικά - Χρηματοοικονομικά Μαθηματικά | el_GR |
Files in this item
This item appears in the following Collection(s)
-
Τμήμα Στατιστικής και Αναλογιστικών - Χρηματοοικονομικών Μαθηματικών [17]
Τμήμα Μαθηματικών - Εισαγωγική Κατεύθυνση Στατιστικής και Αναλογιστικών - Χρηματοοικονομικών Μαθηματικών (έως 1.09.2018)