Output feedback Q-learning for linear-quadratic discrete-time finite-horizon control problems

IRIS

An algorithm is proposed to determine output feedback policies that solve finite-horizon linear-quadratic (LQ) optimal control problems without requiring knowledge of the system dynamical matrices. To reach this goal, the Q -factors arising from finite-horizon LQ problems are first characterized in the state feedback case. It is then shown how they can be parameterized as functions of the input-output vectors. A procedure is then proposed for estimating these functions from input/output data and using these estimates for computing the optimal control via the measured inputs and outputs.

Calafiore, G.c., Possieri, C. (2021). Output feedback Q-learning for linear-quadratic discrete-time finite-horizon control problems. IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 32(7), 3274-3281 [10.1109/TNNLS.2020.3010304].

Output feedback Q-learning for linear-quadratic discrete-time finite-horizon control problems

Calafiore G. C.;Possieri C.

2021-01-01

Abstract

An algorithm is proposed to determine output feedback policies that solve finite-horizon linear-quadratic (LQ) optimal control problems without requiring knowledge of the system dynamical matrices. To reach this goal, the Q -factors arising from finite-horizon LQ problems are first characterized in the state feedback case. It is then shown how they can be parameterized as functions of the input-output vectors. A procedure is then proposed for estimating these functions from input/output data and using these estimates for computing the optimal control via the measured inputs and outputs.

Scheda breve

Scheda completa

Scheda completa (DC)

	Data di pubblicazione
	
				2021
			
	Status di pubblicazione
	
				Pubblicato
			
	DOI dell'articolo
	
				https://dx.doi.org/10.1109/TNNLS.2020.3010304
			
	Rilevanza
	
				Rilevanza internazionale
			
	Tipo
	
				Articolo
			
	Referee
	
				Esperti anonimi
			
	Settore disciplinare dell'articolo (valido fino a 24/06/2024)
	
				Settore ING-INF/04 - AUTOMATICA
			
	Settore disciplinare dell'articolo (valido dal 09/05/2024)
	
				Settore IINF-04/A - Automatica
			
	Lingua del contenuto
	
				English
			
	Parole chiave
	
				Linear-quadratic (LQ) optimization
Output feedback
Reinforcement learning
			
	Citazione
	
				Calafiore, G.c., Possieri, C. (2021). Output feedback Q-learning for linear-quadratic discrete-time finite-horizon control problems. IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 32(7), 3274-3281 [10.1109/TNNLS.2020.3010304].
			
	Tutti gli autori
	
						Calafiore, Gc; Possieri, C
					
	Tipologia
	
				Articolo su rivista
			
	Appare nelle tipologie:
	
				01 - Articolo su rivista

File in questo prodotto:

File	Dimensione	Formato
Output_Feedback_Q-Learning_for_Linear-Quadratic_Discrete-Time_Finite-Horizon_Control_Problems.pdf solo utenti autorizzati Tipologia: Versione Editoriale (PDF) Licenza: Copyright dell'editore Dimensione 416.51 kB Formato Adobe PDF Visualizza/Apri Richiedi una copia	416.51 kB	Adobe PDF	Visualizza/Apri Richiedi una copia

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/2108/294482

Citazioni

0

22

19

social impact