2025年07月17日 22 阅读 论文阅读 一个 Token 就能欺骗 LLM 裁判 论文原文One Token to Fool LLM-as-a-Judge论文摘要生成式奖励模型 (也称为 LLM-as-Judge ),即使用大语言模型(LLMs)来评估答案质量的模型,正越来越...