网易首页 > 网易号 > 正文 申请入驻

2025金融大模型评测体系在沪发布

0
分享至

证券时报记者 陈雨康

上海人工智能实验室与上海库帕思科技有限公司联合主办的“2025金融大模型评测体系发布会”日前举办。发布会上,“2025金融大模型评测体系暨金融评测基准”正式发布。同时,上海市委金融办金融科技处等单位联合上海人工智能实验室、库帕思及上海财经大学,共同发布了《金融大模型应用评测报告(2025)》与《金融大模型评测数据集(2025)》。

库帕思COO施佳樑表示,该评测体系汇聚了4个公开数据集与22个自建数据集,约3.6万条评测数据,坚持科学与鲁棒的评测过程,采用循环选项打乱机制和多样化提示词,并研发金融裁判大模型,实现评测全流程自动化、标准化,为上海金融领域银行、券商、基金、投资等企业或者机构人员提供权威、精准的大模型能力评估,助力机构选型、优化及风险把控。

去年库帕思、上海人工智能实验室等单位发布了全国首个“以金融业务为中心”的金融大模型评测体系。所谓大模型评测体系,通常是评估大模型的性能、安全性、可靠性等方面的指标、方法、基准和流程的集合,对于大模型行业的标准化发展有至关重要的作用。近年来,国内涌现出多个金融大模型,但行业还缺少较为权威和认可的评测体系。

例如,金融大模型的实时性与动态适应性不足。施佳樑表示,金融市场行情、政策法规、突发事件(如黑天鹅事件)具有强时效性,而大模型的训练数据存在明显的 “时间滞后性”。 此外,金融领域存在大量专业规则、监管条款和市场逻辑,通用大模型的训练数据多为公开文本,对深度专业内容的理解不足。

上海市委金融办副主任、一级巡视员葛平在致辞中指出,人工智能正在深刻重塑金融行业发展格局,大模型技术在应用场景深化、关键要素强化和应用生态协同推进三方面加速赋能。葛平强调,去年由库帕思、上海人工智能实验室等机构发布的全国首个“以金融业务为中心”的金融大模型评测体系,为行业提供了科学选型与能力对标的重要“标尺”。今年评测体系的全面升级,将助力上海建设具有全球影响力的金融科技中心。

在最新的评测体系下,今年的金融大模型测试结果全面超越去年。数据显示,在测试数据更合理、难度提升的情况下,2025大模型测试结果均分从71.9提升到87.37。 同时,测试结果还发现,海内外大模型整体能力相差不大,但在中文领域,国内大模型处于领先水平。另外,国内金融大模型在语言理解、术语消歧、法规政策更新和合规对齐等领域领先,国外金融大模型则在数学计算、跨步推理、跨语言推理和超长文本处理上领先。

在主题为“新基线引领模型新发展”的圆桌论坛上,上海人工智能实验室刘东瑞主持,上海财经大学张立文教授、库帕思CTO王长冕、商汤科技王凯靖、东方财富郑烨婕等嘉宾深入探讨了金融语料治理、模型安全、评测标准国际化等前沿议题,强调需通过产学研协同,构建开放、安全、可持续的金融AI生态。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
A股:刚刚,中央一部门发布,释放两个信号,周一将迎来暴风雨?

A股:刚刚,中央一部门发布,释放两个信号,周一将迎来暴风雨?

云鹏叙事
2025-12-28 17:26:12
蒋介石在日记里坦言:重庆谈判放走毛泽东,全是因为这两点!

蒋介石在日记里坦言:重庆谈判放走毛泽东,全是因为这两点!

鹤羽说个事
2025-10-25 11:44:53
中方制裁准时开始,30道通牒发往美国,直接叫停合作,财产全冻结

中方制裁准时开始,30道通牒发往美国,直接叫停合作,财产全冻结

文雅笔墨
2025-12-28 16:40:19
饲料大王刘永好坦言:我们吃的猪肉90%是“三元猪”,所以不香了

饲料大王刘永好坦言:我们吃的猪肉90%是“三元猪”,所以不香了

丁丁鲤史纪
2025-12-23 16:14:18
5艘航母云集中国近海,中美巅峰对阵,特朗普明牌,逼着中国接招

5艘航母云集中国近海,中美巅峰对阵,特朗普明牌,逼着中国接招

现代小青青慕慕
2025-12-26 14:42:10
反转!他们瞒着所有人偷偷生了二胎?这操作太窒息!

反转!他们瞒着所有人偷偷生了二胎?这操作太窒息!

搞笑娱乐笑话
2025-12-28 13:56:41
Lisa在圣诞节二登疯马秀,由男友三公子陪同,直接打脸洗白的粉丝

Lisa在圣诞节二登疯马秀,由男友三公子陪同,直接打脸洗白的粉丝

芊手若
2025-12-26 15:32:19
2块钱的“硫磺皂”能解决这么多麻烦事,再也不敢小瞧了

2块钱的“硫磺皂”能解决这么多麻烦事,再也不敢小瞧了

家居美少女
2025-12-27 20:20:02
徐莺11年造假畅通无阻?《亚洲周刊》硬刚,撕开学术文博圈遮羞布

徐莺11年造假畅通无阻?《亚洲周刊》硬刚,撕开学术文博圈遮羞布

小虎新车推荐员
2025-12-27 17:25:54
“奶奶喜丧,能来送送最后一程吗?”哈尔滨女子因朋友少谦卑求助,众多网友冒大雪赶来

“奶奶喜丧,能来送送最后一程吗?”哈尔滨女子因朋友少谦卑求助,众多网友冒大雪赶来

潇湘晨报
2025-12-27 19:16:16
中国电信员工爆出年终奖已到账,这个数!

中国电信员工爆出年终奖已到账,这个数!

通信头条
2025-12-27 20:25:18
原来马未都妻子是她,怪不得做啥都能来财,真是娶一个贤妻旺三代

原来马未都妻子是她,怪不得做啥都能来财,真是娶一个贤妻旺三代

以茶带书
2025-12-27 15:26:05
1922年张宗昌与俄武官打牌,对方输光后,他指金发女:要她不要钱

1922年张宗昌与俄武官打牌,对方输光后,他指金发女:要她不要钱

宅家伍菇凉
2025-12-27 16:37:18
雅鲁藏布江水电站有多牛?印度网友看完集体沉默,真相太震撼

雅鲁藏布江水电站有多牛?印度网友看完集体沉默,真相太震撼

老特有话说
2025-12-27 14:41:57
欧媒:中国都上桌了,500年来头一次,瓜分世界怎能没有欧洲的份

欧媒:中国都上桌了,500年来头一次,瓜分世界怎能没有欧洲的份

阿器谈史
2025-12-25 21:09:35
辽篮连败惹众怒,再收两大坏消息,杨鸣被喷下课球迷要求请张镇麟

辽篮连败惹众怒,再收两大坏消息,杨鸣被喷下课球迷要求请张镇麟

宗介说体育
2025-12-28 16:05:49
1胜3负,申真谞出局,韩棋手创最差战绩,棋仙战4强韩仅朴廷桓出战

1胜3负,申真谞出局,韩棋手创最差战绩,棋仙战4强韩仅朴廷桓出战

L76号
2025-12-28 15:17:47
李咏妻子哈文在美国过圣诞!吃全聚德烤鸭,调侃自己过成了中国年

李咏妻子哈文在美国过圣诞!吃全聚德烤鸭,调侃自己过成了中国年

娱乐圈圈圆
2025-12-27 10:37:31
黎笋之子黎坚诚坦言:父亲选择同中国开战,是其毕生最大的失策

黎笋之子黎坚诚坦言:父亲选择同中国开战,是其毕生最大的失策

磊子讲史
2025-12-24 11:04:05
“嘎子”演员谢孟伟,被郑州市管城回族区人民法院列为失信人

“嘎子”演员谢孟伟,被郑州市管城回族区人民法院列为失信人

草莓解说体育
2025-12-28 10:46:52
2025-12-28 22:00:49
证券时报 incentive-icons
证券时报
运营主体:深圳证券时报社有限公司
847176文章数 238572关注度
往期回顾 全部

科技要闻

特斯拉将在华布局自动驾驶?记者求证→

头条要闻

新华社发文:积蓄统一大势

头条要闻

新华社发文:积蓄统一大势

体育要闻

83分钟绝杀!曼城2-1年度收官:英超6连胜狂飙

娱乐要闻

白敬亭现身冰雪大世界 拍视频还翻车了

财经要闻

英伟达的收购史

汽车要闻

理想的2026:L9不容有失,i9再战纯电?

态度原创

本地
时尚
亲子
数码
公开课

本地新闻

云游安徽|踏访池州,读懂山水间的万年史书

2026年了,最好看还是这件大衣!

亲子要闻

爸爸非常自责呢

数码要闻

LG电子2026款OLED电视获英伟达G-SYNC认证,至高165Hz

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版