为金融大模型提供权威“标尺”，上海发布2025金融大模型评测体系2.0版

近期，上海正式推出了2025年金融大模型评估体系，该体系自去年全国首次发布金融大模型评估体系后，首次进行了全面升级至2.0版本。此次升级重点在于推动标准化、数据驱动、安全保障和生态构建等四个领域的发展。

大模型评测体系通常是评估大模型的性能、安全性、可靠性等方面的指标、方法、基准和流程的集合。近年来，国内涌现出多个金融大模型，但行业内还缺少较为权威和被认可的评测体系。而2025金融大模型评测体系，相当于为行业提供了科学选型和与能力对标的重要“标尺”。

据介绍，该评测体系汇聚了4个公开数据集与22个自建数据集，约3.6万条评测数据，采用循环选项打乱机制和多样化提示词，并研发金融裁判大模型，实现评测全流程自动化、标准化，为上海金融领域银行、券商、基金、投资等企业或者机构人员提供权威、精准的大模型能力评估，助力机构选型、优化及风险把控。

在最新的评测体系指导下，本年度的金融大模型测试成绩显著优于去年同期，行业平均分从去年的71.9分跃升至87.37分，展现了显著的进步。值得关注的是，在全球范围内，海内外金融大模型的整体能力差距并不显著。然而，在中文领域，国内金融大模型表现尤为出色，处于领先地位。具体来看，国内金融大模型在语言理解、术语消歧、法规政策更新和合规对齐等方面展现出显著优势。与此同时，国外金融大模型则在数学计算、跨步推理、跨语言推理以及超长文本处理等方面展现出较高的水平。

免责声明：转载目的在于传递更多信息，文章版权归原作者所有，内容为作者个人观点。本站只提供参考并不构成任何投资及应用建议。如涉及作品内容或其它问题，请在30日内与工作人员联系（18731251601），我们将第一时间与您协商。谢谢支持！