Circuits et Systèmes

Cette partie traite de l'apprentissage par renforcement où l'on introduit les notions d'agent, de récompense et d'environnement qui sont les éléments de base de tout processus d'apprentissage par renforcement. Les notions de processus décisionnels markoviens et de programmation dynamique sont introduites ainsi que la relation de Bellman. Les algorithmes de Q-learning et SARSA sont étudiés ainsi que les approches "bandits à bras multiples" pour un problème d'allocation de fréquence.

Ce cours traite des techniques d'apprentissage automatique et de leurs applications au domaine des télécommunications. Le cours traite du problème de l'apprentissage au sens large et introduit les notions d'apprentissage supervisé et non supervisé. Les structures d'apprentissage automatique, notamment à base de réseaux de neurones, sont également introduites dans cette partie.