您现在的位置:新生活在线 正文

近期,上海正式推出了2025年金融大模型评估体系,该体系自去年全国首次发布金融大模型评估体系后,首次进行了全面升级至2.0版本。此次升级重点在于推动标准化、数据驱动、安全保障和生态构建等四个领域的发展。

大模型评测体系通常是评估大模型的性能、安全性、可靠性等方面的指标、方法、基准和流程的集合。近年来,国内涌现出多个金融大模型,但行业内还缺少较为权威和被认可的评测体系。而2025金融大模型评测体系,相当于为行业提供了科学选型和与能力对标的重要“标尺”。

据介绍,该评测体系汇聚了4个公开数据集与22个自建数据集,约3.6万条评测数据,采用循环选项打乱机制和多样化提示词,并研发金融裁判大模型,实现评测全流程自动化、标准化,为上海金融领域银行、券商、基金、投资等企业或者机构人员提供权威、精准的大模型能力评估,助力机构选型、优化及风险把控。

在最新的评测体系指导下,本年度的金融大模型测试成绩显著优于去年同期,行业平均分从去年的71.9分跃升至87.37分,展现了显著的进步。值得关注的是,在全球范围内,海内外金融大模型的整体能力差距并不显著。然而,在中文领域,国内金融大模型表现尤为出色,处于领先地位。具体来看,国内金融大模型在语言理解、术语消歧、法规政策更新和合规对齐等方面展现出显著优势。与此同时,国外金融大模型则在数学计算、跨步推理、跨语言推理以及超长文本处理等方面展现出较高的水平。

责任编辑:admin

免责声明: 转载目的在于传递更多信息,文章版权归原作者所有,内容为作者个人观点。本站只提供参考并不构成任何投资及应用建议。如涉及作品内容或其它问题,请在30日内与工作人员联系(18731251601),我们将第一时间与您协商。谢谢支持!

进入新闻频道新闻推荐
商讯新闻商讯新闻
资讯资讯