网易首页 > 网易号 > 正文 申请入驻

奇富科技发布首个信贷多模态评测基准,可全面评估信贷AI模型实战能力

0
分享至


【TechWeb】1月8日消息,近日,奇富科技联合复旦大学与华南理工大学研究人员共同发布首个面向信贷场景的多模态评测基准FCMBench-V1.0 (Financial Credit Multimodal Benchmarks)。该基准基于真实信贷业务场景,抽象科学问题,设计多模态评估任务与挑战,以期构建来源于业务、服务于业务的实用性评测体系,推动信贷AI的学术研究与应用落地。同时,奇富科技宣布开源数据集与评测工具,为行业共建AI基础设施提供关键支撑。

据介绍,FCMBench 不仅是当前金融信贷领域样本量最大、最符合真实应用场景的多模态大模型评测基准,更创新推出"感知-推理-鲁棒性"三维评测体系,全面评估信贷AI模型的实战能力。

与传统侧重单一识别或理解能力的评测不同,FCMBench所评测出的模型能力,能够直接对应小微企业授信过程中对多证件识别、信息一致性校验与风险线索发现等核心环节,为模型是否具备实际可用性提供清晰、可量化的参考依据。

该基准旨在提供一个标准的评测平台,以促进学术界和产业界之间的协作发展,推动AI更好地赋能信贷场景。一方面,金融机构不再缺乏公平比较信贷领域AI模型能力的标准;另一方面,学术界和金融科技公司的研究人员能够对信贷领域的关键难题开展深入研究。这打破了行业内数据和领域知识壁垒,推动信贷人工智能从“单点优化”迈向“产学研协同创新”。

奇富科技多模态负责人杨叶辉博士介绍:"金融信贷审核涉及几十类证件、每类证件有多种模版、审核流程涉及多个环节和任务、以及多证件的交叉推理验证,用户拍摄的场景和上传的文件也多种多样。信贷场景的这些挑战对于多模态大模型的能力也是非常好的试金石。FCMBench-V1.0 只是一个开始,我们会持续完善这个评测基准,希望打磨好一把公平、公正,面向实战需求的尺子:如果你的模型在FCMBench上取得了好成绩,理论上就可以面向实际落地,而不仅仅是满足了实验室指标。"

FCMBench-V1.0构建了与真实银行审核流程高度一致的评测框架,涵盖18类核心信贷证件,如身份证、收入证明、银行流水、房产证等,包含4043张合规图像和 8446个测试样本,问题覆盖信贷审核全链条。

其创新的"感知-推理-鲁棒性"三维评测体系,对金融信贷 AI 模型所需的实战核心能力提出了全面的考核。

通过对23个主流多模态模型(来自14家顶尖AI企业及科研机构)的全面评测,FCMBench展现出强大的鉴别能力。结果显示, Google DeepMind的Gemini 3 Pro(64.61)位列商业模型榜首,阿里巴巴Qwen3-VL-235B(57.27)成为最佳的开源基模。而奇富科技自研的信贷垂类多模态大模型Qfin-VL-Instruct以64.92的F1分数斩获综合第一,该模型基于奇富实际业务场景进行研发,彰显了垂类领域定制化训练的优势,该模型的试用接口已向公众开放。



目前,FCMBench的数据集、评测工具以及Qfin-VL-Instruct的试用接口已开放获取,相关细节已在学术论文中全面披露。奇富科技表示,将持续携手产学研伙伴,推动金融AI技术的标准化与规范化发展,助力金融机构数智化转型与小微企业融资服务能力的持续提升。

技术报告链接:https://arxiv.org/abs/2601.00150

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
马龙陪夏露吃牛排,夏露开兰博基尼送儿子上学,他们住在大别墅!

马龙陪夏露吃牛排,夏露开兰博基尼送儿子上学,他们住在大别墅!

错过美好
2026-01-11 15:15:59
2025年7大烂片出炉,没有最烂只有更烂,你贡献了几张票房?

2025年7大烂片出炉,没有最烂只有更烂,你贡献了几张票房?

八卦南风
2026-01-09 12:00:32
北青:国足训练强度大,王上源腰部不适;U23主力无驰援计划

北青:国足训练强度大,王上源腰部不适;U23主力无驰援计划

懂球帝
2026-01-11 18:48:56
满屏荷尔蒙!网飞这一脱,又爆了

满屏荷尔蒙!网飞这一脱,又爆了

来看美剧
2026-01-11 19:15:03
20万颗!下周A股核心主线来了!

20万颗!下周A股核心主线来了!

格隆汇
2026-01-11 17:44:10
队记们:杨瀚森好的地方有时强硬!但他吃不了太多上场时间!

队记们:杨瀚森好的地方有时强硬!但他吃不了太多上场时间!

氧气是个地铁
2026-01-11 18:43:43
老婆败光20亿真相大白10个月,张学友近况引人担忧,王晶真没说错

老婆败光20亿真相大白10个月,张学友近况引人担忧,王晶真没说错

揽星河的笔记
2025-12-29 17:05:48
未婚先孕,婆婆得意过头:彩礼婚礼全取消,白捡个儿媳妇,真开心

未婚先孕,婆婆得意过头:彩礼婚礼全取消,白捡个儿媳妇,真开心

清水家庭故事
2026-01-10 20:33:58
连退31群后,联合国不再手软,正式警告美国,中国前大使一针见血

连退31群后,联合国不再手软,正式警告美国,中国前大使一针见血

博览历史
2026-01-10 19:21:25
正在淘汰边缘的7种电器,销售坦言:实用不行,坑钱第一名!

正在淘汰边缘的7种电器,销售坦言:实用不行,坑钱第一名!

家电小超人
2026-01-09 11:30:03
联大终于反击,将剥夺欠费美国投票资格,让美难再与中国同台论道

联大终于反击,将剥夺欠费美国投票资格,让美难再与中国同台论道

博览历史
2026-01-10 19:34:12
平时熬的夜,周末竟能补回来!多项研究发现,周末补觉,显著降低心脏病、糖尿病、抑郁症风险

平时熬的夜,周末竟能补回来!多项研究发现,周末补觉,显著降低心脏病、糖尿病、抑郁症风险

医诺维
2026-01-10 11:21:16
王俊杰三分9中7当选本场最佳!主教练:他还没完全展现投篮天赋

王俊杰三分9中7当选本场最佳!主教练:他还没完全展现投篮天赋

罗说NBA
2026-01-11 17:10:10
商业航天龙头,全是垄断性第一

商业航天龙头,全是垄断性第一

风风顺
2026-01-11 16:28:06
章莹颖只是冰山一角:在暗网购物车里,人不是人,可能是“零件”

章莹颖只是冰山一角:在暗网购物车里,人不是人,可能是“零件”

普览
2026-01-10 20:44:27
大俄太狠!一顿袭击将基辅变成“冰窖”,市长都呼吁市民尽快离开

大俄太狠!一顿袭击将基辅变成“冰窖”,市长都呼吁市民尽快离开

战刃
2026-01-10 20:04:54
特朗普举着孩子照片,对哭泣的母亲承诺:我相信中国会执行死刑的

特朗普举着孩子照片,对哭泣的母亲承诺:我相信中国会执行死刑的

博览历史
2025-07-21 17:59:30
特朗普:“无论难易”都要得到格陵兰岛,美国需要它!丹麦:若美军动武,士兵可先开枪再请示!当地居民:给钱也不加入美国

特朗普:“无论难易”都要得到格陵兰岛,美国需要它!丹麦:若美军动武,士兵可先开枪再请示!当地居民:给钱也不加入美国

每日经济新闻
2026-01-10 11:53:07
年薪50万遭妻子嫌弃后续:丈夫身份曝光,工资全上交,挨骂是日常

年薪50万遭妻子嫌弃后续:丈夫身份曝光,工资全上交,挨骂是日常

单手搓核弹
2026-01-06 13:44:21
闫学晶事件升级!官媒批评毫不留情,赵家班多人受牵连,麻烦大了

闫学晶事件升级!官媒批评毫不留情,赵家班多人受牵连,麻烦大了

李健政观察
2026-01-10 09:25:10
2026-01-11 22:12:49
TechWeb incentive-icons
TechWeb
做有态度的互联网资讯。
15220文章数 43050关注度
往期回顾 全部

科技要闻

“我们与美国的差距也许还在拉大”

头条要闻

10人违规吃喝1人饮酒后死亡 组织者曾找商人借钱补偿

头条要闻

10人违规吃喝1人饮酒后死亡 组织者曾找商人借钱补偿

体育要闻

詹皇晒照不满打手没哨 裁判报告最后两分钟无误判

娱乐要闻

留几手为闫学晶叫屈?称网友自卑敏感

财经要闻

外卖平台"烧钱抢存量市场"迎来终局?

汽车要闻

2026款宋Pro DM-i长续航补贴后9.98万起

态度原创

游戏
家居
教育
艺术
房产

《GTA6》真能实现沙滩全是人吗?玩家怀疑“预告骗”

家居要闻

木色留白 演绎现代自由

教育要闻

孩子沉迷手机沉迷游戏怎么办?

艺术要闻

砸18亿!游戏巨头落子广州!诗悦网络总部大楼新进展

房产要闻

66万方!4755套!三亚巨量房源正疯狂砸出!

无障碍浏览 进入关怀版