Ταξινόμηση κειμένων ανοικτού συνόλου με χρήση της ομοιότητας βάσει κέντρων
Abstract
Η ραγδαία αύξηση του όγκου των δεδομένων που ανεβαίνουν στο διαδίκτυο καθιστά πιο δύσκολη τη διαχείριση των πληροφοριών που φέρνει μαζί του, με νέες τεχνολογίες που εισάγονται στον τομέα των Big Data για τον σκοπό αυτό. Με την πλειονότητα των δεδομένων στο διαδίκτυο να έχουν τη μορφή μη δομημένου κειμένου, ένας νέος κλάδος έχει αναδυθεί από την εξόρυξη δεδομένων. Το Text Mining θεωρείται ως ένα πολύ σημαντικό εξειδικευμένο εργαλείο στον τρόπο ανάλυσης δεδομένων σε μορφή κειμένου. Τα δεδομένα σε...