Βαθιά ενίσχυση της μάθησης στις επικοινωνίες και στη δικτύωση
Abstract
Τα σύγχρονα δίκτυα, π.χ. του Διαδυκτίου των Πραγμάτων (IoT) και των Μη επανδρωμένων Εναέριων Οχημάτων(UAV), καθίστανται πιο αποκεντρωμένα και αυτόνομα. Σε τέτοια δίκτυα, οι φορείς δικτύου πρέπει να λαμβάνουν αποφάσεις τοπικά γιανα μεγιστοποιούν την απόδοση του δικτύου υπό την αβεβαιότητα του περιβάλλοντος. Η ενίσχυση της μάθησης (RL) έχει χρησιμοποιηθεί αποτελεσματικά για να δώσει τη δυνατότητα στις οντότητες του δικτύου να αποκτήσουν τη βέλτιστη πολιτική, συμπεριλαμβανομένων π.χ. αποφάσεων ή ε...