LLMEval3 的替代品

复旦大学 NLP 实验室推出的大模型评测基准。以下是 12 个模型评测领域的同类工具,可作为 LLMEval3 的替代选择。

更多模型评测工具