dc.contributor.advisor | Σταματάτος, Ευστάθιος | el_GR |
dc.contributor.author | Τριπιντή-Ιγνατίου, Ηρώ | el_GR |
dc.coverage.spatial | Σάμος | el_GR |
dc.date.accessioned | 2024-05-23T08:42:06Z | |
dc.date.available | 2024-05-23T08:42:06Z | |
dc.date.issued | 2024-02-12 | |
dc.identifier.uri | http://hdl.handle.net/11610/26379 | |
dc.description.abstract | Η ραγδαία αύξηση του όγκου των δεδομένων που ανεβαίνουν στο διαδίκτυο καθιστά πιο δύσκολη τη διαχείριση των πληροφοριών που φέρνει μαζί του, με νέες τεχνολογίες που εισάγονται στον τομέα των Big Data για τον σκοπό αυτό. Με την πλειονότητα των δεδομένων στο διαδίκτυο να έχουν τη μορφή μη δομημένου κειμένου, ένας νέος κλάδος έχει αναδυθεί από την εξόρυξη δεδομένων. Το Text Mining θεωρείται ως ένα πολύ σημαντικό εξειδικευμένο εργαλείο στον τρόπο ανάλυσης δεδομένων σε μορφή κειμένου. Τα δεδομένα σε κείμενο δεν είναι αυστηρά καθορισμένοι και εύκολα διαχειρίσιμοι πόροι, ενώ οι ασάφειες και η διαρκώς μεταβαλλόμενη φύση του περιεχομένου οδηγούν σε δυσκολία στην κατανόηση και την εξόρυξη δεδομένων. Σημαντικό στάδιο και θεμέλιος λίθος για στην εξόρυξη κειμένου αποτελεί η Ταξινόμηση Κειμένου/Text Classification. Μέσω της μηχανικής μάθησης, η Ταξινόμηση Κειμένων καλείται να δώσει λύση στο ζήτημα της διαχείρισης και κατηγοριοποίησης κειμένων σε ηλεκτρονική μορφή. Η ταξινόμηση κειμένων γίνεται συνήθως μέσω μιας ποικιλίας αλγορίθμων και διαδικασιών που αποτελούν διαφορετικά μοντέλα. Όλα αυτά τα μοντέλα απαιτούν μια διαδικασία «εκπαίδευσης» και «δοκιμής» όπου τους δίνεται ένα σύνολο κειμένων και πρέπει να τα κατηγοριοποιήσουν χωρίς λάθη. Σε αυτό το σημείο, γίνεται η σύγκριση απόδοσης των αλγορίθμων Ταξινόμησης Κειμένων, όπου γνωστά και καθιερωμένα μοντέλα Ταξινόμησης Κειμένων δοκιμάζονται στο ίδιο σύνολο κειμένων και αξιολογείται η απόδοσή τους. Σε αυτή την εργασία γίνεται υλοποίηση του αλγορίθμου (Fei, et al., 2016) και στην συνέχεια γίνονται πειράματα κάνοντας χρήση των datasets που αναφέρονται στο (Pritsos. et al., 2019) με σκοπό να συγκριθούν τα αποτελέσματα. | el_GR |
dc.format.extent | 63 σ. | el_GR |
dc.language.iso | el_GR | el_GR |
dc.rights | Αναφορά Δημιουργού - Παρόμοια Διανομή 4.0 Διεθνές | |
dc.rights.uri | http://creativecommons.org/licenses/by-sa/4.0/ | |
dc.subject | αλγόριθμοι ταξινόμησης κειμένου | el_GR |
dc.subject | εξόρυξη πληροφορίας | el_GR |
dc.subject | μηχανική μάθηση | el_GR |
dc.subject | machine learning | en_US |
dc.subject | text classification algorithms | en_US |
dc.subject | data mining | en_US |
dc.subject.lcsh | Text data mining | en_US |
dc.subject.lcsh | Machine learning | en_US |
dc.subject.lcsh | Text processing (Computer science) | en_US |
dc.title | Ταξινόμηση κειμένων ανοικτού συνόλου με χρήση της ομοιότητας βάσει κέντρων | el_GR |
dcterms.accessRights | free | el_GR |
dcterms.rights | Πλήρες Κείμενο - Ελεύθερη Δημοσίευση | el_GR |
heal.type | masterThesis | el_GR |
heal.recordProvider | aegean | el_GR |
heal.committeeMemberName | Καβαλιεράτου, Εργίνα | el_GR |
heal.committeeMemberName | Κωστούλας, Θεόδωρος | el_GR |
heal.academicPublisher | Πανεπιστήμιο Αιγαίου - Πολυτεχνική Σχολή - Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτων | el_GR |
heal.academicPublisherID | aegean | el_GR |
heal.fullTextAvailability | true | el_GR |
dc.contributor.department | Πληροφοριακά και Επικοινωνιακά Συστήματα | el_GR |