LAVENDER: Unifying Video-Language Understanding As Masked Language Modeling

Devs

LAVENDER: Unifying Video-Language Understanding As Masked Language Modeling | Read Paper on Bytez