Ταξινόμηση κειμένων πολιτισμικού περιεχομένου με τη χρήση λανθάνουσας σημασιολογικής δεικτοδότησης
Abstract
Αντικείμενο της παρούσας πτυχιακής εργασίας είναι η ταξινόμηση κειμένων πολιτισμικού περιεχόμενου, με τη χρήση της λανθάνουσας σημασιολογικής δεικτοδότησης (Latent Semantic Indexing-LSI). Η μέθοδος LSI είναι μια ευρέως διαδεδομένη μαθηματική τεχνική, στην ανάκτηση πληροφοριών και στην κατηγοριοποίηση κειμένων. Αφορά τις αλληλεξαρτήσεις μεταξύ των όρων ενός κειμένου με το ίδιο το κείμενο. Η τεχνική του LSI, βασίζεται στην διαδικασία της αποσύνθεσης μοναδικής αξίας (Singular Value Decomposition-S...Scope of this thesis is the classification of texts of cultural content, using latent semantic indexing (LSI). The LSI method is a widely used mathematical technique in information retrieval and text categorization. It concerns the interrelationships between conditions of a text with the text itself. The technique of LSI is based on the process of singular value decomposition (SVD). In this thesis, a combination of these methods is used, to create a platform, where a user can search for documen...
Σημειώσεις
Στα πλαίσια της πτυχιακής εργασίας έχει αναπτυχθεί εφαρμογή που βρίσκεται στη συλλογή οπτικοακουστικού υλικού
Ο συγγραφέας ΔΕΝ δίνει τα απαραίτητα δικαιώματα για την πρόσβαση στο πλήρες κείμενο του ηλεκτρονικού αρχείου