Compositional Temporal Visual Grounding of Natural Language Event Descriptions

Devs

Compositional Temporal Visual Grounding of Natural Language Event Descriptions | Read Paper on Bytez