Show simple item record

Επιτήρηση της αγοράς μέσα από τις κριτικές προϊόντων, με τη χρήση μέτρων σημασιολογικής ομοιότητας, των μοντέλων BERT και VADER και Επεξεργασία Φυσικής Γλώσσας

dc.contributor.advisorΣυμεωνίδης, Παναγιώτηςel_GR
dc.contributor.authorΘεοχαρίδης, Θεοχάρηςel_GR
dc.contributor.authorTheocharidis, Theocharisen_US
dc.coverage.spatialΣάμοςel_GR
dc.date.accessioned2024-07-31T09:57:33Z
dc.date.available2024-07-31T09:57:33Z
dc.date.issued2024-07-24
dc.identifier.urihttp://hdl.handle.net/11610/26694
dc.description.abstractΣτο δυναμικό τοπίο των ψηφιακών πληροφοριών, η αποτελεσματική επεξεργασία και η εξαγωγή ουσιαστικών πληροφοριών από σύνολα δεδομένων αποκτά ολοένα και μεγαλύτερη σημασία. Η παρούσα διπλωματική ασχολείται με την αποτελεσματικότητα της εποπτείας της αγοράς μέσω της ανάλυσης των αξιολογήσεων των χρηστών, του συνδυασμού μέτρων Σημασιολογικής Ομοιότητας (ΣΟ) με τεχνικές επεξεργασίας φυσικής γλώσσας (NLP) και της απόδοσης των προτεινόμενων αλγορίθμων σε σενάρια πραγματικού κόσμου. Διερευνά την ανάπτυξη και εφαρμογή αλγορίθμων που αξιοποιούν μέτρα ΣΟ και τεχνικές NLP για την ανάλυση δεδομέ-νων κειμένου, ιδίως κριτικές χρηστών και αξιολογήσεις προϊόντων. Με την ποσοτικοποίηση της ΣΟ μεταξύ λέξεων και φράσεων, τα μέτρα αυτά επιτρέπουν μια βαθύτερη σημασιολογική κατανόηση, διευκολύνοντας την εξαγωγή συμπερασμάτων που είναι κρίσιμης σημασίας για την αξιολόγηση της ασφάλειας και της καταλληλό-τητας των προϊόντων με βάση τα σχόλια των χρηστών. Παρουσιάζεται μια ολοκληρωμένη μεθοδολογία, από τη συλλογή και προεπεξεργασία δεδομένων, έως την εφαρμογή μέτρων ΣΟ μέσω προτεινόμενων αλγορίθμων. Η αποτελεσματικότητα αυτών των αλγορίθμων αποδεικνύεται μέσω πειραμάτων, τόσο σε συνθετικά όσο και σε πραγματικά σύνολα δεδομένων, συγκεκριμένα σε κριτικές προϊόντων Amazon στην κατηγορία "Toys and Games". Επιπλέον, αυτή η μελέτη ενσωματώνει τη χρήση προηγμένων μοντέλων NLP, όπως BERT και VADER, παρέχοντας μια συγκριτική ανάλυση της απόδοσής τους σε σύγκριση με τους προτεινόμενους αλγορίθμους. Προτείνονται μελλοντικές κατευθύνσεις για την ενίσχυση των αλγορίθμων και την επέκταση της εφαρμογής τους σε άλλους τομείς, όπως η ενσωμάτωση προηγμένων LLM και της τεχνικής Retrieval-Augmented Generation (RAG) για τη βελτίωση της ακρίβειας και της συνάφειας της ανάλυσης κειμένου.el_GR
dc.description.abstractThis dissertation addresses the effectiveness of market surveillance through user review analysis, the combination of semantic similarity (SemSim) measures with Natural Language Processing (NLP) techniques, and the performance of the proposed algorithms in real-world scenarios. It explores the development and application of algorithms leveraging semantic similarity measures and NLP techniques to analyze textual data, particularly user reviews and product evaluations. By quantifying the SemSim between words and phrases, these measures enable a deeper semantic understanding, facilitating the drawing of conclusions, crucial for evaluating product safety and suitability based on user feedback. This dissertation presents a comprehensive methodology, from data collection and preprocessing to the application of semantic similarity measures through proposed algorithms. The effectiveness of these algorithms is demonstrated through experiments on both synthetic and real-world datasets, specifically Amazon product reviews in the category 'Toys and Games'. The results reveal the strengths and limitations of different semantic similarity measures in categorizing and interpreting user reviews. Additionally, this study incorporates the use of advanced NLP models such as BERT and VADER, providing a comparative analysis of their performance alongside the proposed algorithms. Future directions for enhancing the algorithms and expanding their applicability to other domains are also outlined, including the integration of advanced Large Language Models (LLMs) and the Retrieval-Augmented Generation (RAG) technique to improve the accuracy and relevance of textual analysis.en_US
dc.format.extent95 σ.el_GR
dc.language.isoenen_US
dc.rightsΑναφορά Δημιουργού - Παρόμοια Διανομή 4.0 Διεθνές
dc.rights.urihttp://creativecommons.org/licenses/by-sa/4.0/
dc.subjectσημασιολογική ομοιότηταel_GR
dc.subjectμέτρα σημασιολογικής ομοιότηταςel_GR
dc.subjectεπιτήρηση αγοράςel_GR
dc.subjectασφάλεια προϊόντωνel_GR
dc.subjectεπεξεργασία φυσικής γλώσσαςel_GR
dc.subjectμεγάλα γλωσσικά μοντέλαel_GR
dc.subjectsemantic similarityen_US
dc.subjectsemantic similarity measuresen_US
dc.subjectBERTen_US
dc.subjectVADERen_US
dc.subjectnatural language processing (NLP)en_US
dc.subjectmarket surveillanceen_US
dc.subjectuser reviewsen_US
dc.subjectproduct safetyen_US
dc.subjectlarge language modelsen_US
dc.subjectretrieval-augmented generationen_US
dc.subject.lcshNatural language processing (Computer science)en_US
dc.subject.lcshSemantic computingen_US
dc.subject.lcshMachine learningen_US
dc.subject.lcshArtificial intelligenceen_US
dc.subject.lcshProduct safetyen_US
dc.titleMarket surveillance from product's reviews using semantic similarity measures, BERT, VADER, and Natural Language Processingen_US
dc.titleΕπιτήρηση της αγοράς μέσα από τις κριτικές προϊόντων, με τη χρήση μέτρων σημασιολογικής ομοιότητας, των μοντέλων BERT και VADER και Επεξεργασία Φυσικής Γλώσσαςel_GR
dcterms.accessRightsfreeel_GR
dcterms.rightsΠλήρες Κείμενο - Ελεύθερη Δημοσίευσηel_GR
heal.typemasterThesisel_GR
heal.recordProvideraegeanel_GR
heal.committeeMemberNameΣταματάτος, Ευστάθιοςel_GR
heal.committeeMemberNameΚαπόρης, Αλέξιοςel_GR
heal.academicPublisherΠανεπιστήμιο Αιγαίου - Πολυτεχνική Σχολή - Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτωνel_GR
heal.academicPublisherIDaegeanel_GR
heal.fullTextAvailabilitytrueel_GR
dc.contributor.departmentΔιαδίκτυο των Πραγμάτων: Ευφυή Περιβάλλοντα σε Δίκτυα Νέας Γενιάel_GR


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Αναφορά Δημιουργού - Παρόμοια Διανομή 4.0 Διεθνές
Except where otherwise noted, this item's license is described as Αναφορά Δημιουργού - Παρόμοια Διανομή 4.0 Διεθνές