FlagEval vs MMLU

FlagEval 和 MMLU 都是模型评测领域的主流 AI 工具,下表对比两者差异。

对比项FlagEvalMMLU
简介智源研究院推出的大模型评测平台(天秤)大规模多任务语言理解基准,覆盖 57 个学科
分类模型评测模型评测

FlagEval 的替代品 · MMLU 的替代品