Router-R1: Teaching LLMs Multi-Round Routing and Aggregation via Reinforcement Learning

Devs

Router-R1: Teaching LLMs Multi-Round Routing and Aggregation via Reinforcement Learning | Read Paper on Bytez