BridgeVLA: Input-Output Alignment for Efficient 3D Manipulation Learning with Vision-Language Models

Devs

BridgeVLA: Input-Output Alignment for Efficient 3D Manipulation Learning with Vision-Language Models | Read Paper on Bytez