Inverse Preference Learning: Preference-based RL without a Reward Function

Devs

Inverse Preference Learning: Preference-based RL without a Reward Function | Read Paper on Bytez