MATH-Perturb: Benchmarking LLMs' Math Reasoning Abilities against Hard Perturbations

Devs

MATH-Perturb: Benchmarking LLMs' Math Reasoning Abilities against Hard Perturbations | Read Paper on Bytez