Ανίχνευση ρητορικής μίσους με χρήση του γλωσσικού μοντέλου BERT
Hate speech detection using BERT language model
dc.contributor.advisor | Σταματάτος, Ευστάθιος | el_GR |
dc.contributor.author | Ζιώζας, Γεώργιος | el_GR |
dc.contributor.author | Ziozas, George | en_US |
dc.coverage.spatial | Σάμος | el_GR |
dc.date.accessioned | 2023-01-10T10:58:37Z | |
dc.date.available | 2023-01-10T10:58:37Z | |
dc.date.issued | 2021-10-20 | |
dc.identifier.uri | http://hdl.handle.net/11610/24503 | |
dc.description.abstract | Ο τεράστιος όγκος πληροφοριών που παράγεται καθημερινά στο διαδίκτυο και η μαζική χρήση μέσων κοινωνικής δικτύωσης έχουν δημιουργήσει πρωτόγνωρα φαινόμενα ρητορικής μίσους. Η πρόσφατη ραγδαία εξέλιξη του τομέα της τεχνητής νοημοσύνης και ιδιαίτερα των αρχιτεκτονικών βαθιάς μάθησης όπως η Transformer, έχει βοηθήσει σημαντικά την διαδικασία αυτόματης ταξινόμησης κειμένων με βάση το περιεχόμενο τους. Στην έρευνα μας ξεκινάμε αναλύοντας τον τομέα της τεχνητής νοημοσύνης και της ταξινόμησης ρητορικής μίσους. Στην συνέχεια επικεντρωνόμαστε στην εξέταση συνόλων δεδομένων ρητορικής μίσους και προτείνουμε μια μεθοδολογία επιλογής αυτών με βάση την αντικειμενικότα. Στην πειραματική μας προσέγγιση, μετά την εκτενή επεξεργασία των δεδομένων, υλοποιούμε την αρχιτεκτονική Transformer B.E.R.T με σκοπό την δημιουργία ταξινομητή πολλαπλών ετικετών 6 κλάσεων στόχων. Τα αποτελέσματα μας παρουσιάζουν τις καλύτερες επιδόσεις στο συγκεκριμένο σύνολο δεδομένων και δίνουν κατευθύνσεις για μελλοντικές έρευνες. | el_GR |
dc.description.abstract | The huge daily volume of information produced on the internet and the massive use of social media has created unprecedented phenomena of hate speech. The recent rapid development of the field of artificial intelligence and especially of deep learning architectures such as Transformer has significantly helped the process of automatic text classification based on their content. In our research, we start by analyzing the field of artificial intelligence and the classification of hate speech. We then focus on examining hate speech data sets and proposing a methodology for selecting them based on the objective. In our experimental approach, after extensive data processing, we created the Transformer B.E.R.T architecture with the aim of creating a multi-tag classifier of 6 target classes. Our results show the best performance in this data set and give directions for future research. | en_US |
dc.format.extent | 102 σ. | el_GR |
dc.language.iso | el_GR | el_GR |
dc.rights | Αναφορά Δημιουργού 4.0 Διεθνές | * |
dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | * |
dc.subject | ανάλυση ρητορικής μίσους | el_GR |
dc.subject | τεχνητή νοημοσύνη | el_GR |
dc.subject | γλωσσικό μοντέλο BERT | el_GR |
dc.subject | hate speech analysis | en_US |
dc.subject | artificial intelligence | en_US |
dc.subject | BERT language model | en_US |
dc.subject.lcsh | Artificial intelligence | en_US |
dc.subject.lcsh | Hate speech | en_US |
dc.title | Ανίχνευση ρητορικής μίσους με χρήση του γλωσσικού μοντέλου BERT | el_GR |
dc.title | Hate speech detection using BERT language model | en_US |
dcterms.accessRights | free | el_GR |
dcterms.rights | Πλήρες Κείμενο - Ελεύθερη Δημοσίευση | el_GR |
heal.type | bachelorThesis | el_GR |
heal.recordProvider | aegean | el_GR |
heal.committeeMemberName | Συμεωνίδης, Παναγιώτης | el_GR |
heal.committeeMemberName | Κωστούλας, Θεώδορος | el_GR |
heal.academicPublisher | Πανεπιστήμιο Αιγαίου - Πολυτεχνική Σχολή - Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτων | el_GR |
heal.academicPublisherID | aegean | el_GR |
heal.fullTextAvailability | true | el_GR |