Towards Efficient Pre-Trained Language Model via Feature Correlation Distillation

Devs

Towards Efficient Pre-Trained Language Model via Feature Correlation Distillation | Read Paper on Bytez