A Greedy Gradient Q-learning Approach for Constructing Optimal Policies in Infinite Time Horizon Settings

Zitieren

Zugehöriges Material

Banff International Research Station (BIRS) for Mathematical Innovation and Discovery

Ertefaie, Ashkan

Formale Metadaten

Titel

A Greedy Gradient Q-learning Approach for Constructing Optimal Policies in Infinite Time Horizon Settings

Serientitel

Workshop on the Interface of Machine Learning and Statistical Inference (18w5054)

Anzahl der Teile

Autor

Ertefaie, Ashkan

Lizenz

CC-Namensnennung - keine kommerzielle Nutzung - keine Bearbeitung 4.0 International:
Sie dürfen das Werk bzw. den Inhalt in unveränderter Form zu jedem legalen und nicht-kommerziellen Zweck nutzen, vervielfältigen, verbreiten und öffentlich zugänglich machen, sofern Sie den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen.

Identifikatoren

10.5446/59858 (DOI)

Herausgeber

Banff International Research Station (BIRS) for Mathematical Innovation and Discovery

Erscheinungsjahr

2018

Sprache

Englisch

Inhaltliche Metadaten

Fachgebiet	Informatik Mathematik
Genre	Workshop/Interaktives Format Vorlesung