dc.contributor.advisor | Σταματάτος, Ευστάθιος | el_GR |
dc.contributor.author | Προκοπίου, Πέτρος-Μάριος | el_GR |
dc.coverage.spatial | Σάμος | el_GR |
dc.date.accessioned | 2024-01-10T08:14:59Z | |
dc.date.available | 2024-01-10T08:14:59Z | |
dc.date.issued | 2023-06-29 | |
dc.identifier.uri | http://hdl.handle.net/11610/25924 | |
dc.description.abstract | Αυτή η εργασία εξετάζει την αποτελεσματικότητα της χρήσης διάφορων παραγωγικών γλωσσικών μοντέλων για την δημιουργία απαντήσεων για ερωτήσεις μαθηματικού περιεχομένου. Τα τελευταία χρόνια υπάρχει αυξημένο ενδιαφέρον για ανάκτηση πληροφοριών μαθηματικού περιεχομένου στον κλάδο ανάκτησης πληροφοριών, και η χρήση αναδυόμενων τεχνολογιών, όπως τα παραγωγικά γλωσσικά μοντέλα, θα μπορούσε να βοηθήσει σημαντικά, δημιουργώντας εξατομικευμένες απαντήσεις σε περίπλοκα μαθηματικά ερωτήματα, έχοντας ως βάση μόνο την εκπαίδευση του μοντέλου. Για την εκπόνηση της εργασίας έγινε χρήση και εμπορικών αλλά και open source μοντέλων, και σε κάθε μοντέλο εφαρμόσθηκαν διάφορες κοινές προσεγγίσεις. Οι απαντήσεις που παρήχθησαν συγκρίθηκαν με τις απαντήσεις από τον διαγωνισμό ARQMath-3 που είχε ένα παρόμοιο θέμα, το οποίο αποτέλεσε και την έμπνευση για την εργασία αυτή. Επιπροσθέτως, έγιναν και προσπάθειες βελτίωσης των τρόπων αξιολόγησης των αποτελεσμάτων. Βρέθηκε ότι τα προεκπαιδευμένα μοντέλα που είναι διαθέσιμα στο κοινό επιτυγχάνουν παρόμοια αποτελέσματα, σύμφωνα με τις μετρικές που χρησιμοποιήθηκαν, με πιο εξειδικευμένες προσεγγίσεις, όπως αυτές που έγιναν για το ARQMath-3. Φάνηκε ότι η αποτελεσματικότητα επηρεάζεται τόσο από τον αριθμό των παραμέτρων και των άλλων τεχνικών χαρακτηριστικών των μοντέλων, όσο και από τον τρόπο που τίθενται τα ερωτήματα, τον τρόπο παραμετροποίησης και τον τρόπο προεκπαίδευσης του μοντέλου. Ταυτόχρονα υπήρξαν ενδείξεις ότι οι τωρινοί τρόποι αξιολόγησης δεν επαρκούν για την αξιολόγηση αποτελεσμάτων από παραγωγικά γλωσσικά μοντέλα, ότι υπάρχουν περιθώρια βελτίωσης τους, αλλά και ανάγκη εύρεσης επιπλέον τρόπων αξιολόγησης που θα ανταποκρίνονται στις ανάγκες της συγκεκριμένης προσέγγισης. | el_GR |
dc.description.abstract | This thesis examines the effectiveness of using various language models for generating answers to mathematics-related questions. In recent years, there has been increased interest in information retrieval of mathematical content in the field of information retrieval, and the use of emerging technologies, such as language models, could greatly assist in creating personalized answers to complex mathematical questions based solely on the model's training. Both commercial and open-source models were used in this study, and different approaches were used for each model. The generated answers were compared with the answers from the ARQMath-3 competition, which had a similar theme and served as inspiration for this work. Additionally, efforts were made to improve the evaluation methods that were used for ARQMath-3. The results showed that publicly available pretrained models achieve similar results, according to the metrics used, with more specialized approaches like those used in ARQMath-3. The effectiveness was found to be influenced by both the number of parameters and other technical characteristics of the models, as well as the way questions are presented, and the parameterization and pretraining method of the model. At the same time, there were indications that the current evaluation methods are not sufficient for evaluating results from language models, that there is room for improvement, and a need for creating additional evaluation methods that meet the specific requirements of this approach. | en_US |
dc.format.extent | 123 σ. | el_GR |
dc.language.iso | el_GR | el_GR |
dc.rights | Αναφορά Δημιουργού 4.0 Διεθνές | |
dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | |
dc.subject | παραγωγικά γλωσσικά μοντέλα | el_GR |
dc.subject | παραγωγικοί προεκπαιδευμένοι μετασχηματιστές | el_GR |
dc.subject | εύρεση μαθηματικών πληροφοριών | el_GR |
dc.subject | απάντηση ερωτήσεων | el_GR |
dc.subject | τεχνητή νοημοσύνη | el_GR |
dc.subject | generative language models | en_US |
dc.subject | generative pretrained transformers | en_US |
dc.subject | math information retrieval | en_US |
dc.subject | question answering | en_US |
dc.subject | artificial intelligence | en_US |
dc.subject | ΑRQMath | en_US |
dc.subject.lcsh | Information storage and retrieval systems--Mathematics | en_US |
dc.subject.lcsh | Artificial intelligence | en_US |
dc.title | Απάντηση μαθηματικών ερωτήσεων με χρήση παραγωγικών γλωσσικών μοντέλων | el_GR |
dcterms.accessRights | free | el_GR |
dcterms.rights | Πλήρες Κείμενο - Ελεύθερη Δημοσίευση | el_GR |
heal.type | masterThesis | el_GR |
heal.recordProvider | aegean | el_GR |
heal.committeeMemberName | Σταματάτος, Ευστάθιος | el_GR |
heal.committeeMemberName | Κωστούλας, Θεόδωρος | el_GR |
heal.committeeMemberName | Καβαλλιεράτου, Εργίνα | el_GR |
heal.academicPublisher | Πανεπιστήμιο Αιγαίου - Πολυτεχνική Σχολή - Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτων | el_GR |
heal.academicPublisherID | aegean | el_GR |
heal.fullTextAvailability | true | el_GR |
dc.contributor.department | Πληροφοριακά και Επικοινωνιακά Συστήματα | el_GR |