ABQ-LLM: Arbitrary-Bit Quantized Inference Acceleration for Large Language Models

Devs

ABQ-LLM: Arbitrary-Bit Quantized Inference Acceleration for Large Language Models | Read Paper on Bytez