f-Policy Gradients: A General Framework for Goal-Conditioned RL using f-Divergences

Devs

f-Policy Gradients: A General Framework for Goal-Conditioned RL using f-Divergences | Read Paper on Bytez