FAME-ViL: Multi-Tasking Vision-Language Model for Heterogeneous Fashion Tasks

Devs

FAME-ViL: Multi-Tasking Vision-Language Model for Heterogeneous Fashion Tasks | Read Paper on Bytez