Show simple item record

dc.contributor.advisorΤσιμήκας, Τζωνel_GR
dc.contributor.authorBaika, Alexia Artemisen_US
dc.contributor.authorΒαΐκα, Αλεξία Άρτεμιςel_GR
dc.coverage.spatialΣάμοςel_GR
dc.date.accessioned2019-10-30T08:57:19Z
dc.date.available2019-10-30T08:57:19Z
dc.date.issued2019-10-07
dc.identifier.urihttp://hdl.handle.net/11610/19523
dc.description.abstractThe data that will be analyzed in this thesis is a Liver Cancer data set which was collected at Shanghai Cang-zheng Hospital in China. The data set includes 145 subjects, of which 54 patients have hepatoma, 39 patients have hepatitis and hepatocirrhosis - chronic liver disease and 52 individuals are healthy. To each subject corespondents 236 Markers. For simplicity, we create two types of groups. The first group consists of healthy individuals and the second group consists of diseased patients. The goal is to correctly classify a subject in one of the two classes, diseased-non-diseased. For this classification task we use two supervised classification methods: Logistic Regression and Support Vector Machines. Logistic Regression was developed by David Cox in 1958 and is one of the most traditional parametric classification methods. Support Vector Machines was created by Vladimir Vapnik (1995). It can efficiently perform a non-linear classification using what is called the kernel trick, by mapping the inputs into a high-dimensional feature spaces. In many cases the goal is to develop a model which can explain the relationship between the features and the dependent variable. A severe mathematical problem is when the dimension of the data is greater than the number of the available data points. For this purpose we will describe methods for feature selection and regularization, including subset selection and lasso.en_US
dc.description.abstractΣτην παρούσα εργασία έγινε ανάλυση δεδομένων καρκίνου στο συκώτι. Τα δεδομένα συλλέχθηκαν σε νοσοκομείο της πολης Shanghai Cangzheng της Κίνας. Τα δεδομένα αποτελούντούσαν απο 145 άτομα εκ των οποίων 93 είχαν την αρρώστια και 52 ήταν υγειής. Ο στόχος της εργασίας είναι με την χρήση στατιστικού μοντέλου να γίνει σωστή ταξινόμηση των ατόμων σε μια απο τις δυο ομάδες, υγειής-άρρωστος. Για τον σκοπό αυτο χρισημοποιήθηκαν δύο μέθοδοι: Λογιστική παλινδρόμηση και Support Vector Machines. Η Λογιστική παλινδρόμηση είναι μια απο τις πιο δημοφιλές παραμετρικές μεθόδους και το Support Vector Machines έχει την ιδιότητα να ταξινομεί μη γραμμικά δεδομένα με την χρήση των Kernel. Στην περίπτωση που ο αριθμός των ανεξάρτητων μεταβλητών είναι μεγαλύτερος απο τον αριθμό των δεδομένων είναι απαραίτητη η χρήση μεθόδων (όπως subset selection και Lasso) που μειώνουν τον αριθμό των ανεξάρτητων μεταβλητών.el_GR
dc.format.extent102 σ.el_GR
dc.language.isoenen_US
dc.rightsDefault License
dc.subjectClassificationen_US
dc.subjectSVMen_US
dc.subjectLassoen_US
dc.subjectTαξινόμησηel_GR
dc.subjectλογιστική παλινδρόμησηel_GR
dc.subjectμείωση ανεξάρτητων μεταβλητώνel_GR
dc.subject.lcshLogistic regression analysisen_US
dc.subject.lcshMedicine--Research--Statistical methodsen_US
dc.subject.lcshMachine learningen_US
dc.titleCombining multiple diagnostic tests for classificationen_US
dcterms.accessRightsfreeel_GR
dcterms.rightsΠλήρες Κείμενο - Ελεύθερη Δημοσίευσηel_GR
heal.typemasterThesisel_GR
heal.recordProvideraegeanel_GR
heal.committeeMemberNameΧατζησπύρος, Σπύροςel_GR
heal.committeeMemberNameΜπαντής, Λεωνίδαςel_GR
heal.committeeMemberNameΤσιμήκας, Τζωνel_GR
heal.academicPublisherΠανεπιστήμιο Αιγαίου - Σχολή Θετικών Επιστημών - Τμήμα Σ.Α.Χ.Μ.el_GR
heal.academicPublisherIDaegeanel_GR
heal.fullTextAvailabilitytrueel_GR
dc.contributor.departmentΣτατιστική και Αναλογιστικά - Χρηματοοικονομικά Μαθηματικάel_GR


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record