网易首页 > 网易号 > 正文 申请入驻

2025金融大模型评测体系在沪发布

0
分享至

来源:市场资讯

(来源:证券时报)

证券时报记者 陈雨康

上海人工智能实验室与上海库帕思科技有限公司联合主办的“2025金融大模型评测体系发布会”日前举办。发布会上,“2025金融大模型评测体系暨金融评测基准”正式发布。同时,上海市委金融办金融科技处等单位联合上海人工智能实验室、库帕思及上海财经大学,共同发布了《金融大模型应用评测报告(2025)》与《金融大模型评测数据集(2025)》。

库帕思COO施佳樑表示,该评测体系汇聚了4个公开数据集与22个自建数据集,约3.6万条评测数据,坚持科学与鲁棒的评测过程,采用循环选项打乱机制和多样化提示词,并研发金融裁判大模型,实现评测全流程自动化、标准化,为上海金融领域银行、券商、基金、投资等企业或者机构人员提供权威、精准的大模型能力评估,助力机构选型、优化及风险把控。

去年库帕思、上海人工智能实验室等单位发布了全国首个“以金融业务为中心”的金融大模型评测体系。所谓大模型评测体系,通常是评估大模型的性能、安全性、可靠性等方面的指标、方法、基准和流程的集合,对于大模型行业的标准化发展有至关重要的作用。近年来,国内涌现出多个金融大模型,但行业还缺少较为权威和认可的评测体系。

例如,金融大模型的实时性与动态适应性不足。施佳樑表示,金融市场行情、政策法规、突发事件(如黑天鹅事件)具有强时效性,而大模型的训练数据存在明显的 “时间滞后性”。 此外,金融领域存在大量专业规则、监管条款和市场逻辑,通用大模型的训练数据多为公开文本,对深度专业内容的理解不足。

上海市委金融办副主任、一级巡视员葛平在致辞中指出,人工智能正在深刻重塑金融行业发展格局,大模型技术在应用场景深化、关键要素强化和应用生态协同推进三方面加速赋能。葛平强调,去年由库帕思、上海人工智能实验室等机构发布的全国首个“以金融业务为中心”的金融大模型评测体系,为行业提供了科学选型与能力对标的重要“标尺”。今年评测体系的全面升级,将助力上海建设具有全球影响力的金融科技中心。

在最新的评测体系下,今年的金融大模型测试结果全面超越去年。数据显示,在测试数据更合理、难度提升的情况下,2025大模型测试结果均分从71.9提升到87.37。 同时,测试结果还发现,海内外大模型整体能力相差不大,但在中文领域,国内大模型处于领先水平。另外,国内金融大模型在语言理解、术语消歧、法规政策更新和合规对齐等领域领先,国外金融大模型则在数学计算、跨步推理、跨语言推理和超长文本处理上领先。

在主题为“新基线引领模型新发展”的圆桌论坛上,上海人工智能实验室刘东瑞主持,上海财经大学张立文教授、库帕思CTO王长冕、商汤科技王凯靖、东方财富郑烨婕等嘉宾深入探讨了金融语料治理、模型安全、评测标准国际化等前沿议题,强调需通过产学研协同,构建开放、安全、可持续的金融AI生态。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美记:独行侠愿意将浓眉送到老鹰,但前提是特雷杨不能成为筹码

美记:独行侠愿意将浓眉送到老鹰,但前提是特雷杨不能成为筹码

移动挡拆
2025-12-30 04:48:56
交流结束,蒋万安闪电离沪,上飞机前通告全岛,台当局捅了马蜂窝

交流结束,蒋万安闪电离沪,上飞机前通告全岛,台当局捅了马蜂窝

爱意随风起呀
2025-12-30 12:38:17
女子跑3家银行网点没办成1张卡,多家银行工作人员回应:2020年“断卡行动”后办卡开始变严

女子跑3家银行网点没办成1张卡,多家银行工作人员回应:2020年“断卡行动”后办卡开始变严

观威海
2025-12-30 09:18:37
中国两家航司同日官宣:合计采购55架空客飞机,总金额超570亿元

中国两家航司同日官宣:合计采购55架空客飞机,总金额超570亿元

每日经济新闻
2025-12-30 00:23:17
京东001号快递员已退休,勤恳工作16年,刘强东承诺的房给了吗?

京东001号快递员已退休,勤恳工作16年,刘强东承诺的房给了吗?

阿纂看事
2025-12-10 15:38:14
“北方第二城”或将易主,北方经济格局正经历深层演变?|城市论

“北方第二城”或将易主,北方经济格局正经历深层演变?|城市论

新京报
2025-12-30 10:01:14
精准反制!美国财长目睹中国7800亿美债人民币结算,华尔街大惊!

精准反制!美国财长目睹中国7800亿美债人民币结算,华尔街大惊!

别人都叫我阿腈
2025-12-30 08:33:44
全身而退!北京一家5口完美套现24亿,临走前又坑了甘肃国资一把

全身而退!北京一家5口完美套现24亿,临走前又坑了甘肃国资一把

文史旺旺旺
2025-12-27 18:22:03
为什么曾经战无不胜的蒙古骑兵到了明清就越来越拉胯了?

为什么曾经战无不胜的蒙古骑兵到了明清就越来越拉胯了?

历史按察使司
2025-12-29 10:41:18
徐莺的曾祖父被扒出来了

徐莺的曾祖父被扒出来了

大张的自留地
2025-12-28 11:52:34
张本智和彻底翻脸!拒交四成奖金,自掏腰包组建六人“对抗军”

张本智和彻底翻脸!拒交四成奖金,自掏腰包组建六人“对抗军”

破镜难圆
2025-12-29 22:38:09
我们已经找到了解决油轮被扣的办法,老师分析太透彻了

我们已经找到了解决油轮被扣的办法,老师分析太透彻了

阿芒娱乐说
2025-12-29 12:46:03
若是赵构完全信任岳飞,没有干扰岳飞的策略,岳飞能拼到哪一步?

若是赵构完全信任岳飞,没有干扰岳飞的策略,岳飞能拼到哪一步?

铭记历史呀
2025-12-27 14:42:07
徐湖平在部队期间因“手脚不干净”,被营长岳振华踢出了军队?

徐湖平在部队期间因“手脚不干净”,被营长岳振华踢出了军队?

方圆文史
2025-12-27 16:56:27
"回来的全不是人",罗布泊老兵临终遗言,揭开骇人听闻内幕

"回来的全不是人",罗布泊老兵临终遗言,揭开骇人听闻内幕

天字号野史
2024-10-09 14:00:03
约基奇伤退掘金立马崩盘!穆雷带队能力堪忧 热火大胜热巴各种笑

约基奇伤退掘金立马崩盘!穆雷带队能力堪忧 热火大胜热巴各种笑

颜小白的篮球梦
2025-12-30 10:50:35
47岁保姆坦言:可以做有偿陪伴保姆,但必须要遵守3个约定

47岁保姆坦言:可以做有偿陪伴保姆,但必须要遵守3个约定

孢木情感
2025-12-29 21:02:36
很多东西正着不好用,一旦你将它反过来,就会打开新世界大门

很多东西正着不好用,一旦你将它反过来,就会打开新世界大门

新住家居
2025-12-21 18:09:16
苑举正:统一要快!绝对要快!

苑举正:统一要快!绝对要快!

看看新闻Knews
2025-12-29 18:41:05
台学者提醒赖清德小心导弹飞越台岛上空!台军“集体逃亡”画面曝光

台学者提醒赖清德小心导弹飞越台岛上空!台军“集体逃亡”画面曝光

海峡导报社
2025-12-29 22:56:03
2025-12-30 13:48:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
1854231文章数 5109关注度
往期回顾 全部

财经要闻

朱光耀:美关税政策正使WTO名存实亡

头条要闻

媒体:赖清德称"大陆不敢越雷池" 第二天解放军就演习

头条要闻

媒体:赖清德称"大陆不敢越雷池" 第二天解放军就演习

体育要闻

这个59岁的胖子,还在表演“蝎子摆尾”

娱乐要闻

林俊杰官宣文案争议!女方名字都不提

科技要闻

估值150亿的智元,开始批量"制造"小独角兽

汽车要闻

标配华为乾崑ADS 4 Pro 华境S明年上半年上市

态度原创

教育
本地
旅游
游戏
公开课

教育要闻

13年,12岁,儿子开始一步步布局他的2026

本地新闻

即将过去的2025年,对重庆的影响竟然如此深远

旅游要闻

博物馆里迎新年,济南文博活动再“上新”

大话手游首个数字交易大服上线!【二〇二六】开服刷新大话记录

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版