MobileCLIP: Fast Image-Text Models through Multi-Modal Reinforced Training

Devs

MobileCLIP: Fast Image-Text Models through Multi-Modal Reinforced Training | Read Paper on Bytez