HPE-CogVLM: Advancing Vision Language Models with a Head Pose Grounding Task

Devs

HPE-CogVLM: Advancing Vision Language Models with a Head Pose Grounding Task | Read Paper on Bytez