Show simple item record

Δια-τομεακή αναγνώριση συγγραφέα με χρήση προ-εκπαιδευμένων γλωσσικών μοντέλων

dc.contributor.advisorΕυστάθιος, Σταματάτοςel_GR
dc.contributor.authorΜπάρλας, Γεώργιοςel_GR
dc.coverage.spatialΣάμοςel_GR
dc.date.accessioned2021-02-10T13:25:47Z
dc.date.available2021-02-10T13:25:47Z
dc.date.issued2020-06
dc.identifier.urihttp://hdl.handle.net/11610/21473
dc.description.abstractΗ δια-τομεακή αναγνώριση συγγραφέα είναι μια κατηγορία ρεαλιστικών προβλημάτων αναγνώρισης συγγραφέων με όρους εφαρμογών κυρίως στην εγκληματολογία. Στα δια-τομεακά σενάρια τα κείμενα με γνωστό συγγραφέα (σετ εκπαίδευσης) είναι σε διαφορετικό τομέα (δια-τομεακή) από τα κείμενα αγνώστου συγγραφέα (σετ δοκιμών). Η χρήση προ-εκπαιδευμένων γλωσσικών μοντέλων σε διάφορα καθήκοντα επεξεργασίας φυσικής γλώσσας μας ενέπνευσε να διερευνήσουμε τις δυνατότητές τους στο πρόβλημα της αναγνώρισης του συγγραφέα. Σε αυτή την εργασία, πειραματιζόμαστε με τέσσερα διαφορετικής αρχιτεκτονικής προ-εκπαιδευμένα γλωσσικά μοντέλα (BERT, ELMo, GPT-2 και ULMFiT). Η προτεινόμενη μέθοδος είναι μια τροποποίηση μιας επιτυχούς προσέγγισης επαλήθευσης συγγραφέα, που βασίζεται σε ένα μοντέλο γλώσσας νευρωνικών δικτύων πολλαπλών κεφαλών για να συνδυαστεί με τα προ-εκπαιδευμένα γλωσσικά μοντέλα. Αξιολογήσαμε την προτεινόμενη μέθοδο σε δύο συλλογές κειμένων (CMCC, PAN18) σε τρία δια-τομεακά σενάρια. Τα επιτευχθέντα αποτελέσματα είναι πολύ ελπιδοφόρα και καταδεικνύουν την κρίσιμη επίδραση του σετ κανονικοποίησης στην δια-τομεακή αναγνώριση συγγραφέα.el_GR
dc.format.extent35 σ.el_GR
dc.language.isoen_USen_US
dc.rightsCC0 1.0 Παγκόσμια*
dc.rights.urihttp://creativecommons.org/publicdomain/zero/1.0/*
dc.subjectαναγνώριση συγγραφέαel_GR
dc.subjectπρο-εκπαιδευμένα γλωσσικά μοντέλαel_GR
dc.subjectνευρωνικά δίκτυαel_GR
dc.subjectauthorship attributionen_US
dc.subjectpre-trained language modelsen_US
dc.subjectneural networksen_US
dc.subject.lcshAuthorship, Disputeden_US
dc.subject.lcshNeural networks (Computer science)en_US
dc.subject.lcshNatural language processing (Computer science)en_US
dc.titleCross-domain authorship attribution using pre-trained language modelsen_US
dc.titleΔια-τομεακή αναγνώριση συγγραφέα με χρήση προ-εκπαιδευμένων γλωσσικών μοντέλωνel_GR
dcterms.accessRightsfreeel_GR
dcterms.rightsΠλήρες Κείμενο - Ελεύθερη Δημοσίευσηel_GR
heal.typemasterThesisel_GR
heal.recordProvideraegeanel_GR
heal.academicPublisherΠανεπιστήμιο Αιγαίου - Πολυτεχνική Σχολή - Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτωνel_GR
heal.academicPublisherIDaegeanel_GR
heal.fullTextAvailabilitytrueel_GR
dc.contributor.departmentΠληροφοριακά και Επικοινωνιακά Συστήματαel_GR


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

CC0 1.0 Παγκόσμια
Except where otherwise noted, this item's license is described as CC0 1.0 Παγκόσμια