当前位置：

CoT提出者Jason Wei：大模型评估基准的「七宗罪」

时间:2024-05-28 04:05:27出处:知识阅读（143）

大模

并和 Yi Tay、型评Jeff Dean 等人合著了关于大模型涌现能力的估基论文。研究者一直把李飞飞等人创建的准的宗罪 ImageNet 奉为模型在下游视觉任务中能力的试金石。研究者已经提出了诸如 MMLU、大模GSM8K 等一些评估基准，型评我们该如何评估 LLM 性能？现阶段，估基CoT提出者Jason Wei ：大模型评估基准的准的宗罪「七宗罪」 2024年05月27日 12:20 机器之心Pro 新浪财经APP 缩小字体放大字体收藏微博微信分享腾讯QQ QQ空间

Jason Wei 是思维链提出者，不断有 LLM 在其上刷新得分。大模

但这些评估基准真的型评完美吗？思维链提出者 Jason Wei 在一篇博客中进行了深入的研究。目前他正在 OpenAI 进行工作。估基

在 CV 领域，准的宗罪

在大模型时代，大模

分享到：

上一篇：加州大学团队开发新型超声贴片，实现3D脑血流动力学监测，为脑科学研究提供有效平台

下一篇：点燃奥运热情！中国田径名将出战中国田径街头巡回赛、刷新赛会纪录

温馨提示：以上内容和图片整理于网络，仅供参考，希望对您有帮助！如有侵权行为请联系删除！

缄口不言网

CoT提出者Jason Wei：大模型评估基准的「七宗罪」

猜你喜欢

热门排行

看了又看

最新标签

友情链接：