网易首页 > 网易号 > 正文 申请入驻

上海财经大学发布Fin-Eval 6.0:为金融领域大模型设立全新评估基准

0
分享至

近日,上海财经大学前沿人工智能实验室宣布,正式推出Fin-Eval 6.0评估基准。这是一个为全面评估大型语言模型(LLMs)在金融领域的专业能力与安全性而构建的开创性基准数据集。该基准基于广受认可的FinEval评估集进行升级,创新性地加入了金融严谨性和金融多模态两大维度,总题量超过16,000道,旨在满足金融行业对高标准、专业化AI评估工具日益增长的迫切需求。

Fin-Eval 6.0的核心亮点包括:

  • 全面的领域覆盖:基准测试包含六大核心模块:金融学术知识、金融行业理解、金融安全认知、金融智能体应用、金融多模态能力与金融严谨性测试。

  • 海量高质量试题:超过16,000道题目深度模拟了真实的金融工作场景与决策过程,旨在全方位检验大模型在金融领域的综合应用能力。

  • 聚焦前沿:创新性地引入“金融多模态能力”“金融严谨性测试”评估维度,直面当前金融AI发展的热点与难点。

六维评估矩阵:覆盖金融领域全场景

Fin-Eval 6.0通过六大核心领域确保了评估的广度与深度,实现了从理论到实践、从单一能力到复杂任务的立体考察:

推动中国金融AI迈向新高度

大型语言模型虽在通用领域表现卓越,但在高度专业化和风险敏感的金融行业,其安全与复杂任务处理能力仍是未知数。Fin-Eval 6.0的推出,为解决这一挑战提供了坚实的基础。

该基准不仅为金融AI的学术研究和技术发展设立了新标杆,也为希望在中国市场部署AI应用的金融机构提供了更可靠的风险评估和模型选型依据。通过对模型优势与潜在风险的严谨评估,Fin-Eval 6.0揭示了当前大模型能力的边界与短板,从而引导科研方向,促进模型在关键金融能力上的突破。

更重要的是,Fin-Eval 6.0的推广有望催生一个围绕金融AI评估与优化的研究社区及产业生态。通过公开排行榜和持续更新的数据集,将激励研究者与开发者之间的良性竞争与合作,共同提升大模型在金融领域的整体水平,最终推动更安全、可靠、公平的AI技术在金融领域落地,为金融行业的数字化转型与社会经济的高质量发展注入新动力。

上海财经大学校长、党委副书记、滴水湖高级金融学院院长刘元春表示,当前发布的金融领域大模型评测体系具有双重价值:一方面为金融监管部门制定技术治理框架提供依据,另一方面为商业机构优化模型开发指明方向。他指出,此类研究具有显著的前瞻性和跨学科价值,体现了顶尖金融院校在推动金融科技发展的重要责任。

测评团队负责人、上海财经大学统计与数据科学学院与滴水湖高级金融学院联聘教授张立文指出,随着人工智能技术日益深入地融入金融服务的核心流程,Fin-Eval 6.0的发布标志着金融AI评估领域迈出了关键一步。它旨在为构建更加安全、高效且可靠的金融AI系统提供重要的洞察和发展方向指导。一方面,新增的“金融严谨性测试”模块进一步聚焦模型在金融场景中的安全性与可靠性;而“金融多模态能力评测”的引入,则填补了当前评估体系在该领域的部分空白,并紧密贴合实际业务需求,具有重要意义。另一方面,Fin-Eval 6.0对以往版本的基准测试进行了整合与拓展,使得整个评估体系更加全面、准确,能够更好地反映金融AI系统的综合能力。

未来,上海财经大学会更加关注金融领域的安全合规、能力建设与智能体评测等维度。在安全层面,将会建设更加体系化的评测框架,抓住模型“底线”。在能力建设层面,依托上财在金融学科建设中的优势,研究团队将持续构建具有行业代表性和复杂度的金融基准测试集,动态监测和量化分析大模型在金融领域的能力与知识边界。同时,在“智能体元年”的背景下,有关金融智能体的评测标准也在筹备建设中,敬请期待!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
黎巴嫩宣布4月9日为全国哀悼日

黎巴嫩宣布4月9日为全国哀悼日

财联社
2026-04-09 06:21:05
美国派16名特工暗杀斯诺登,驻澳特战队击退CIA,荣获集体一等功

美国派16名特工暗杀斯诺登,驻澳特战队击退CIA,荣获集体一等功

富强巨靠谱
2025-02-26 09:30:43
男性一旦确诊,70%以上已是中晚期!

男性一旦确诊,70%以上已是中晚期!

番禺台
2026-03-12 10:06:52
6岁女童遇害:家属含泪爆作案动机,凶手被抓后冷静异常,太愤怒

6岁女童遇害:家属含泪爆作案动机,凶手被抓后冷静异常,太愤怒

眼光很亮
2026-04-07 11:38:00
陈丽华告别仪式举行:学生怀念其手把手教学,导演林大庆称欲表悼念心意遗憾错过

陈丽华告别仪式举行:学生怀念其手把手教学,导演林大庆称欲表悼念心意遗憾错过

红星新闻
2026-04-09 14:19:22
学费大调整!2026年教育收费全面改革,5大变化直接影响每个家庭

学费大调整!2026年教育收费全面改革,5大变化直接影响每个家庭

复转这些年
2026-04-05 18:03:58
研发5年投入13亿《王者荣耀世界》上线!盘点Q2能够玩到的MMORPG

研发5年投入13亿《王者荣耀世界》上线!盘点Q2能够玩到的MMORPG

17173游戏网
2026-04-08 11:38:55
欧冠悲喜夜!大巴黎2-0完胜利物浦,马竞复仇巴萨破20年不胜魔咒

欧冠悲喜夜!大巴黎2-0完胜利物浦,马竞复仇巴萨破20年不胜魔咒

钉钉陌上花开
2026-04-09 05:14:43
国民党由盛转衰五大关键推手,李登辉只能排第二,第一实至名归!

国民党由盛转衰五大关键推手,李登辉只能排第二,第一实至名归!

梦史
2026-03-25 04:13:02
于谦被曝成老赖,坐拥北京 60 亩马场,巨额债务真相藏不住了

于谦被曝成老赖,坐拥北京 60 亩马场,巨额债务真相藏不住了

橙星文娱
2026-04-06 13:09:46
悲催!东莞一工厂因拖欠近两年租金及违约金660万,被限十日搬离

悲催!东莞一工厂因拖欠近两年租金及违约金660万,被限十日搬离

火山詩话
2026-04-08 08:33:23
马英九首席智囊出山,郑丽文到达上海做出一个举动,信号不寻常 !

马英九首席智囊出山,郑丽文到达上海做出一个举动,信号不寻常 !

奇思妙想生活家
2026-04-08 16:56:07
美媒披露特朗普发动伊朗战争内幕:“全凭直觉”,除万斯外无人反对

美媒披露特朗普发动伊朗战争内幕:“全凭直觉”,除万斯外无人反对

澎湃新闻
2026-04-08 20:56:27
1938年老蒋制造黄河决堤,日军淹死数量惊人,真实情况你可能不信

1938年老蒋制造黄河决堤,日军淹死数量惊人,真实情况你可能不信

浩舞默画
2026-04-06 09:22:04
淄博一女子利用“拐弯让直行”碰瓷30余起,已刑拘!

淄博一女子利用“拐弯让直行”碰瓷30余起,已刑拘!

鲁中晨报
2026-04-09 11:41:56
万万没有想到,赖清德的父亲赖永都,非但不是日本鬼子他是中国人

万万没有想到,赖清德的父亲赖永都,非但不是日本鬼子他是中国人

史行途
2026-03-30 08:13:47
全国多地“老牌高速公路”收费期限届满,陆续进入“免费通行时代”

全国多地“老牌高速公路”收费期限届满,陆续进入“免费通行时代”

中国能源网
2026-04-08 11:05:04
雷军晒了张图,小米把豪车涂装玩成了"隐形联名"

雷军晒了张图,小米把豪车涂装玩成了"隐形联名"

报错免疫体
2026-04-06 16:45:14
意想不到!被中国用核武器轰炸45次的罗布泊,现在竟然变成了这样

意想不到!被中国用核武器轰炸45次的罗布泊,现在竟然变成了这样

万物知识圈
2026-04-09 10:12:05
特朗普被骗惨了! 内塔尼亚胡保证: 斩首哈梅内伊后小巴列维就能上

特朗普被骗惨了! 内塔尼亚胡保证: 斩首哈梅内伊后小巴列维就能上

小俎娱乐
2026-04-09 13:02:18
2026-04-09 15:12:49
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
242058文章数 744020关注度
往期回顾 全部

科技要闻

Meta凌晨首发闭源大模型 扎克伯格又行了?

头条要闻

陈丽华告别仪式举办 马德华:迟重瑞心里很难过

头条要闻

陈丽华告别仪式举办 马德华:迟重瑞心里很难过

体育要闻

8万人面前心脏骤停 现在他还站在球场上

娱乐要闻

金莎官宣结婚 与老公孙丞潇相差18岁

财经要闻

谈判基础已被破坏!霍尔木兹海峡关闭

汽车要闻

8155芯片+L2智驾 瑞虎5运动版上市 置换补贴价6.79万元起

态度原创

亲子
旅游
艺术
本地
公开课

亲子要闻

以人类目前的意志力还不足以抵抗这种萌物

旅游要闻

放春假·上春山——临沂大好河山,就是最好的课堂

艺术要闻

庞茂琨 2026油画写生新作

本地新闻

建水Color Walk | 古城慢调,掉进春天的调色盘里

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版