FlagEval vs MMLU
FlagEval 和 MMLU 都是模型评测领域的主流 AI 工具,下表对比两者差异。
对比项
FlagEval
MMLU
简介
智源研究院推出的大模型评测平台(天秤)
大规模多任务语言理解基准,覆盖 57 个学科
分类
模型评测
模型评测
FlagEval 的替代品
·
MMLU 的替代品