Why Only Text: Empowering Vision-and-Language Navigation with Multi-modal Prompts

Devs

Why Only Text: Empowering Vision-and-Language Navigation with Multi-modal Prompts | Read Paper on Bytez