网易首页 > 网易号 > 正文 申请入驻

2025金融大模型评测体系在沪发布

0
分享至

证券时报记者 陈雨康

上海人工智能实验室与上海库帕思科技有限公司联合主办的“2025金融大模型评测体系发布会”日前举办。发布会上,“2025金融大模型评测体系暨金融评测基准”正式发布。同时,上海市委金融办金融科技处等单位联合上海人工智能实验室、库帕思及上海财经大学,共同发布了《金融大模型应用评测报告(2025)》与《金融大模型评测数据集(2025)》。

库帕思COO施佳樑表示,该评测体系汇聚了4个公开数据集与22个自建数据集,约3.6万条评测数据,坚持科学与鲁棒的评测过程,采用循环选项打乱机制和多样化提示词,并研发金融裁判大模型,实现评测全流程自动化、标准化,为上海金融领域银行、券商、基金、投资等企业或者机构人员提供权威、精准的大模型能力评估,助力机构选型、优化及风险把控。

去年库帕思、上海人工智能实验室等单位发布了全国首个“以金融业务为中心”的金融大模型评测体系。所谓大模型评测体系,通常是评估大模型的性能、安全性、可靠性等方面的指标、方法、基准和流程的集合,对于大模型行业的标准化发展有至关重要的作用。近年来,国内涌现出多个金融大模型,但行业还缺少较为权威和认可的评测体系。

例如,金融大模型的实时性与动态适应性不足。施佳樑表示,金融市场行情、政策法规、突发事件(如黑天鹅事件)具有强时效性,而大模型的训练数据存在明显的 “时间滞后性”。 此外,金融领域存在大量专业规则、监管条款和市场逻辑,通用大模型的训练数据多为公开文本,对深度专业内容的理解不足。

上海市委金融办副主任、一级巡视员葛平在致辞中指出,人工智能正在深刻重塑金融行业发展格局,大模型技术在应用场景深化、关键要素强化和应用生态协同推进三方面加速赋能。葛平强调,去年由库帕思、上海人工智能实验室等机构发布的全国首个“以金融业务为中心”的金融大模型评测体系,为行业提供了科学选型与能力对标的重要“标尺”。今年评测体系的全面升级,将助力上海建设具有全球影响力的金融科技中心。

在最新的评测体系下,今年的金融大模型测试结果全面超越去年。数据显示,在测试数据更合理、难度提升的情况下,2025大模型测试结果均分从71.9提升到87.37。 同时,测试结果还发现,海内外大模型整体能力相差不大,但在中文领域,国内大模型处于领先水平。另外,国内金融大模型在语言理解、术语消歧、法规政策更新和合规对齐等领域领先,国外金融大模型则在数学计算、跨步推理、跨语言推理和超长文本处理上领先。

在主题为“新基线引领模型新发展”的圆桌论坛上,上海人工智能实验室刘东瑞主持,上海财经大学张立文教授、库帕思CTO王长冕、商汤科技王凯靖、东方财富郑烨婕等嘉宾深入探讨了金融语料治理、模型安全、评测标准国际化等前沿议题,强调需通过产学研协同,构建开放、安全、可持续的金融AI生态。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊媒称哈梅内伊之子被选为新任最高领袖,但未获官方证实;此前伊朗称新任最高领袖选举进入最后阶段,或将很快公布其人选

伊媒称哈梅内伊之子被选为新任最高领袖,但未获官方证实;此前伊朗称新任最高领袖选举进入最后阶段,或将很快公布其人选

大风新闻
2026-03-04 10:45:04
无语!平顶山母女遗产案爆出操作猛如虎,舅舅舅妈吃绝户!

无语!平顶山母女遗产案爆出操作猛如虎,舅舅舅妈吃绝户!

社会日日鲜
2026-03-04 06:58:18
有钱人是怎样奢侈,看网友讲述。真是误闯天家

有钱人是怎样奢侈,看网友讲述。真是误闯天家

侃神评故事
2026-03-01 17:30:03
从卢布到伊朗里亚尔的贬值之路中你能明白什么?

从卢布到伊朗里亚尔的贬值之路中你能明白什么?

细雨中的呼喊
2026-03-03 16:40:50
两组照片对比,伊朗神权集团崩塌的必然

两组照片对比,伊朗神权集团崩塌的必然

涛哥锐评
2026-03-04 06:32:25
为啥外国的火腿能直接生吃,我国的火腿却建议做熟再吃?这科学吗

为啥外国的火腿能直接生吃,我国的火腿却建议做熟再吃?这科学吗

向航说
2026-03-03 00:55:03
鲁迅家是如何衰败的?鲁迅肯定不会告诉你,因为实在“太丢人”

鲁迅家是如何衰败的?鲁迅肯定不会告诉你,因为实在“太丢人”

顾史
2026-03-02 10:46:01
在伊朗大使馆的评论下面见识到啥叫全民皆兵 全民好战全民皆贾诩

在伊朗大使馆的评论下面见识到啥叫全民皆兵 全民好战全民皆贾诩

侃神评故事
2026-03-03 11:51:28
"他们逼我说台湾是中国的,不然不救我!"台湾网红一石激起千层浪

"他们逼我说台湾是中国的,不然不救我!"台湾网红一石激起千层浪

壹知眠羊
2026-03-04 07:05:55
特朗普:将切断美国和西班牙之间的贸易往来

特朗普:将切断美国和西班牙之间的贸易往来

环球网资讯
2026-03-04 01:44:09
全球唯一明朝状元卷,字迹如机器印刷,无一处笔误,看完无地自容

全球唯一明朝状元卷,字迹如机器印刷,无一处笔误,看完无地自容

收藏大视界
2026-03-03 17:33:09
伊朗:十多艘油轮无视警告,已被炮弹击中并烧毁!并发布“战果”称“击中美军驱逐舰使其熊熊燃烧”

伊朗:十多艘油轮无视警告,已被炮弹击中并烧毁!并发布“战果”称“击中美军驱逐舰使其熊熊燃烧”

扬子晚报
2026-03-04 09:42:52
上海某电影院事件:81秒视频流出,主角社交媒体曝光

上海某电影院事件:81秒视频流出,主角社交媒体曝光

温柔看世界
2026-03-02 16:33:22
伊朗打出这张“底牌”

伊朗打出这张“底牌”

极目新闻
2026-03-04 09:38:47
最多领先49分!马刺8人上双狂胜76人 文班10+8+6帽马克西21+8

最多领先49分!马刺8人上双狂胜76人 文班10+8+6帽马克西21+8

醉卧浮生
2026-03-04 11:35:50
哈梅内伊次子,要接班了?

哈梅内伊次子,要接班了?

中国新闻周刊
2026-03-04 11:08:23
人民日报寰宇平:世界不能退回“丛林时代”

人民日报寰宇平:世界不能退回“丛林时代”

零时差工作室
2026-03-04 05:03:46
67岁上海退休老干部,骂33岁河南务工者“小赤佬”,被榔头打死

67岁上海退休老干部,骂33岁河南务工者“小赤佬”,被榔头打死

谈史论天地
2026-03-03 12:27:36
大陆使馆出手,持台胞证可登记撤离,绿营叫嚣:台湾人不当中国人

大陆使馆出手,持台胞证可登记撤离,绿营叫嚣:台湾人不当中国人

独坐山巅前
2026-03-04 08:38:40
谢娜喊话薛之谦道歉,张杰发声

谢娜喊话薛之谦道歉,张杰发声

扬子晚报
2026-03-03 23:07:24
2026-03-04 13:00:49
证券时报 incentive-icons
证券时报
运营主体:深圳证券时报社有限公司
875546文章数 238839关注度
往期回顾 全部

科技要闻

新MacBook Pro首发M5 Pro/Max芯片 17999起

头条要闻

从霍尔木兹海峡到地中海 伊朗首度攻击欧盟国家

头条要闻

从霍尔木兹海峡到地中海 伊朗首度攻击欧盟国家

体育要闻

“头铁”拼图在NBA也有生存环境

娱乐要闻

迪丽热巴转机滞留迪拜 错过巴黎时装周

财经要闻

伊朗,正在打破特朗普的幻想

汽车要闻

比亚迪元PLUS遭导弹袭击 车辆未起火/乘员均生还

态度原创

游戏
本地
旅游
时尚
公开课

《生化危机9》里昂配音不愿透露支持CP 怕被粉丝干掉!

本地新闻

食味印象|一口入魂!康乐烤肉串起千年丝路香

旅游要闻

擂响“东方第一鼓”雅集翰墨绘团圆,浦东元宵游园会劲展“动”“静”中国韵

三件外套拍出17万美元天价!为什么时装精都想买她的同款?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版