Show simple item record

dc.contributor.advisorΣταματάτος, Ευστάθιοςel_GR
dc.contributor.authorΠροκοπίου, Πέτρος-Μάριοςel_GR
dc.coverage.spatialΣάμοςel_GR
dc.date.accessioned2024-01-10T08:14:59Z
dc.date.available2024-01-10T08:14:59Z
dc.date.issued2023-06-29
dc.identifier.urihttp://hdl.handle.net/11610/25924
dc.description.abstractΑυτή η εργασία εξετάζει την αποτελεσματικότητα της χρήσης διάφορων παραγωγικών γλωσσικών μοντέλων για την δημιουργία απαντήσεων για ερωτήσεις μαθηματικού περιεχομένου. Τα τελευταία χρόνια υπάρχει αυξημένο ενδιαφέρον για ανάκτηση πληροφοριών μαθηματικού περιεχομένου στον κλάδο ανάκτησης πληροφοριών, και η χρήση αναδυόμενων τεχνολογιών, όπως τα παραγωγικά γλωσσικά μοντέλα, θα μπορούσε να βοηθήσει σημαντικά, δημιουργώντας εξατομικευμένες απαντήσεις σε περίπλοκα μαθηματικά ερωτήματα, έχοντας ως βάση μόνο την εκπαίδευση του μοντέλου. Για την εκπόνηση της εργασίας έγινε χρήση και εμπορικών αλλά και open source μοντέλων, και σε κάθε μοντέλο εφαρμόσθηκαν διάφορες κοινές προσεγγίσεις. Οι απαντήσεις που παρήχθησαν συγκρίθηκαν με τις απαντήσεις από τον διαγωνισμό ARQMath-3 που είχε ένα παρόμοιο θέμα, το οποίο αποτέλεσε και την έμπνευση για την εργασία αυτή. Επιπροσθέτως, έγιναν και προσπάθειες βελτίωσης των τρόπων αξιολόγησης των αποτελεσμάτων. Βρέθηκε ότι τα προεκπαιδευμένα μοντέλα που είναι διαθέσιμα στο κοινό επιτυγχάνουν παρόμοια αποτελέσματα, σύμφωνα με τις μετρικές που χρησιμοποιήθηκαν, με πιο εξειδικευμένες προσεγγίσεις, όπως αυτές που έγιναν για το ARQMath-3. Φάνηκε ότι η αποτελεσματικότητα επηρεάζεται τόσο από τον αριθμό των παραμέτρων και των άλλων τεχνικών χαρακτηριστικών των μοντέλων, όσο και από τον τρόπο που τίθενται τα ερωτήματα, τον τρόπο παραμετροποίησης και τον τρόπο προεκπαίδευσης του μοντέλου. Ταυτόχρονα υπήρξαν ενδείξεις ότι οι τωρινοί τρόποι αξιολόγησης δεν επαρκούν για την αξιολόγηση αποτελεσμάτων από παραγωγικά γλωσσικά μοντέλα, ότι υπάρχουν περιθώρια βελτίωσης τους, αλλά και ανάγκη εύρεσης επιπλέον τρόπων αξιολόγησης που θα ανταποκρίνονται στις ανάγκες της συγκεκριμένης προσέγγισης.el_GR
dc.description.abstractThis thesis examines the effectiveness of using various language models for generating answers to mathematics-related questions. In recent years, there has been increased interest in information retrieval of mathematical content in the field of information retrieval, and the use of emerging technologies, such as language models, could greatly assist in creating personalized answers to complex mathematical questions based solely on the model's training. Both commercial and open-source models were used in this study, and different approaches were used for each model. The generated answers were compared with the answers from the ARQMath-3 competition, which had a similar theme and served as inspiration for this work. Additionally, efforts were made to improve the evaluation methods that were used for ARQMath-3. The results showed that publicly available pretrained models achieve similar results, according to the metrics used, with more specialized approaches like those used in ARQMath-3. The effectiveness was found to be influenced by both the number of parameters and other technical characteristics of the models, as well as the way questions are presented, and the parameterization and pretraining method of the model. At the same time, there were indications that the current evaluation methods are not sufficient for evaluating results from language models, that there is room for improvement, and a need for creating additional evaluation methods that meet the specific requirements of this approach.en_US
dc.format.extent123 σ.el_GR
dc.language.isoel_GRel_GR
dc.rightsΑναφορά Δημιουργού 4.0 Διεθνές
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.subjectπαραγωγικά γλωσσικά μοντέλαel_GR
dc.subjectπαραγωγικοί προεκπαιδευμένοι μετασχηματιστέςel_GR
dc.subjectεύρεση μαθηματικών πληροφοριώνel_GR
dc.subjectαπάντηση ερωτήσεωνel_GR
dc.subjectτεχνητή νοημοσύνηel_GR
dc.subjectgenerative language modelsen_US
dc.subjectgenerative pretrained transformersen_US
dc.subjectmath information retrievalen_US
dc.subjectquestion answeringen_US
dc.subjectartificial intelligenceen_US
dc.subjectΑRQMathen_US
dc.subject.lcshInformation storage and retrieval systems--Mathematicsen_US
dc.subject.lcshArtificial intelligenceen_US
dc.titleΑπάντηση μαθηματικών ερωτήσεων με χρήση παραγωγικών γλωσσικών μοντέλωνel_GR
dcterms.accessRightsfreeel_GR
dcterms.rightsΠλήρες Κείμενο - Ελεύθερη Δημοσίευσηel_GR
heal.typemasterThesisel_GR
heal.recordProvideraegeanel_GR
heal.committeeMemberNameΣταματάτος, Ευστάθιοςel_GR
heal.committeeMemberNameΚωστούλας, Θεόδωροςel_GR
heal.committeeMemberNameΚαβαλλιεράτου, Εργίναel_GR
heal.academicPublisherΠανεπιστήμιο Αιγαίου - Πολυτεχνική Σχολή - Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτωνel_GR
heal.academicPublisherIDaegeanel_GR
heal.fullTextAvailabilitytrueel_GR
dc.contributor.departmentΠληροφοριακά και Επικοινωνιακά Συστήματαel_GR


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Αναφορά Δημιουργού 4.0 Διεθνές
Except where otherwise noted, this item's license is described as Αναφορά Δημιουργού 4.0 Διεθνές