竞赛

LLMs-识别评估论文质量 LLMLLM-as-a-judge 系统的漏洞

LLMs-识别评估论文质量  LLMLLM-as-a-judge 系统的漏洞

本次比赛旨在挑战参赛者找出一个用于评估论文质量的LLM-as-a-judge系统的漏洞。参赛者将获得一份论文主题列表,目标是提交一篇能够最大程度地提升LLM评委之间分歧的论文。参赛者的工作将有助于参赛者更好地理解使用LLM进行大规模主观评估任务的能力和局限性。

点头团队赛事成绩:银牌4枚

9.jpg