MMLU vs OpenCompass

MMLU 和 OpenCompass 都是模型评测领域的主流 AI 工具,下表对比两者差异。

对比项MMLUOpenCompass
简介大规模多任务语言理解基准,覆盖 57 个学科上海人工智能实验室推出的大模型开源开放评测体系(司南)
分类模型评测模型评测

MMLU 的替代品 · OpenCompass 的替代品