SG-Bench: Evaluating LLM Safety Generalization Across Diverse Tasks and Prompt Types | Read Paper on Bytez

Devs

SG-Bench: Evaluating LLM Safety Generalization Across Diverse Tasks and Prompt Types

6 months ago

·

NeurIPS