网易首页 > 网易号 > 正文 申请入驻

奇富科技发布首个信贷多模态评测基准,可全面评估信贷AI模型实战能力

0
分享至


【TechWeb】1月8日消息,近日,奇富科技联合复旦大学与华南理工大学研究人员共同发布首个面向信贷场景的多模态评测基准FCMBench-V1.0 (Financial Credit Multimodal Benchmarks)。该基准基于真实信贷业务场景,抽象科学问题,设计多模态评估任务与挑战,以期构建来源于业务、服务于业务的实用性评测体系,推动信贷AI的学术研究与应用落地。同时,奇富科技宣布开源数据集与评测工具,为行业共建AI基础设施提供关键支撑。

据介绍,FCMBench 不仅是当前金融信贷领域样本量最大、最符合真实应用场景的多模态大模型评测基准,更创新推出"感知-推理-鲁棒性"三维评测体系,全面评估信贷AI模型的实战能力。

与传统侧重单一识别或理解能力的评测不同,FCMBench所评测出的模型能力,能够直接对应小微企业授信过程中对多证件识别、信息一致性校验与风险线索发现等核心环节,为模型是否具备实际可用性提供清晰、可量化的参考依据。

该基准旨在提供一个标准的评测平台,以促进学术界和产业界之间的协作发展,推动AI更好地赋能信贷场景。一方面,金融机构不再缺乏公平比较信贷领域AI模型能力的标准;另一方面,学术界和金融科技公司的研究人员能够对信贷领域的关键难题开展深入研究。这打破了行业内数据和领域知识壁垒,推动信贷人工智能从“单点优化”迈向“产学研协同创新”。

奇富科技多模态负责人杨叶辉博士介绍:"金融信贷审核涉及几十类证件、每类证件有多种模版、审核流程涉及多个环节和任务、以及多证件的交叉推理验证,用户拍摄的场景和上传的文件也多种多样。信贷场景的这些挑战对于多模态大模型的能力也是非常好的试金石。FCMBench-V1.0 只是一个开始,我们会持续完善这个评测基准,希望打磨好一把公平、公正,面向实战需求的尺子:如果你的模型在FCMBench上取得了好成绩,理论上就可以面向实际落地,而不仅仅是满足了实验室指标。"

FCMBench-V1.0构建了与真实银行审核流程高度一致的评测框架,涵盖18类核心信贷证件,如身份证、收入证明、银行流水、房产证等,包含4043张合规图像和 8446个测试样本,问题覆盖信贷审核全链条。

其创新的"感知-推理-鲁棒性"三维评测体系,对金融信贷 AI 模型所需的实战核心能力提出了全面的考核。

通过对23个主流多模态模型(来自14家顶尖AI企业及科研机构)的全面评测,FCMBench展现出强大的鉴别能力。结果显示, Google DeepMind的Gemini 3 Pro(64.61)位列商业模型榜首,阿里巴巴Qwen3-VL-235B(57.27)成为最佳的开源基模。而奇富科技自研的信贷垂类多模态大模型Qfin-VL-Instruct以64.92的F1分数斩获综合第一,该模型基于奇富实际业务场景进行研发,彰显了垂类领域定制化训练的优势,该模型的试用接口已向公众开放。



目前,FCMBench的数据集、评测工具以及Qfin-VL-Instruct的试用接口已开放获取,相关细节已在学术论文中全面披露。奇富科技表示,将持续携手产学研伙伴,推动金融AI技术的标准化与规范化发展,助力金融机构数智化转型与小微企业融资服务能力的持续提升。

技术报告链接:https://arxiv.org/abs/2601.00150

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
记者在街头采访年轻人“年薪20万属于什么水平”,得到的回答令人咋舌!

记者在街头采访年轻人“年薪20万属于什么水平”,得到的回答令人咋舌!

张晓磊
2025-10-31 09:44:39
刚刚,国家释放重大信号!《人民日报》:脑机接口加快接入现实

刚刚,国家释放重大信号!《人民日报》:脑机接口加快接入现实

徐德文科学频道
2026-01-11 21:29:14
到底什么叫洗钱?网友"完美闭环"式回答,感觉错过了一个亿

到底什么叫洗钱?网友"完美闭环"式回答,感觉错过了一个亿

另子维爱读史
2026-01-09 22:18:04
香烟热度榜!烟民贡献万亿税收,年度销冠竟是这个品牌…

香烟热度榜!烟民贡献万亿税收,年度销冠竟是这个品牌…

慧翔百科
2025-12-24 09:14:14
王俊杰三分9中7当选本场最佳!主教练:他还没完全展现投篮天赋

王俊杰三分9中7当选本场最佳!主教练:他还没完全展现投篮天赋

罗说NBA
2026-01-11 17:10:10
85%的血管淤堵,根本不用过度治疗!医生:做好3件事,比吃药管用

85%的血管淤堵,根本不用过度治疗!医生:做好3件事,比吃药管用

孟大夫之家1
2026-01-09 15:47:05
1986年陈永贵病逝,追悼会规格成难题,邓小平只说了一句话,全场安静

1986年陈永贵病逝,追悼会规格成难题,邓小平只说了一句话,全场安静

寄史言志
2026-01-04 16:34:31
深圳人挺住!最冷“三九”到来,跌破10℃的魔法攻击还要持续多久

深圳人挺住!最冷“三九”到来,跌破10℃的魔法攻击还要持续多久

芭比衣橱
2026-01-11 05:38:43
火记:杜兰特没兴趣当超级英雄,火箭若夺冠无望,他可能选择离开

火记:杜兰特没兴趣当超级英雄,火箭若夺冠无望,他可能选择离开

移动挡拆
2026-01-11 05:16:35
火遍网上的“酸黄瓜”,到底是什么梗,大冬天的要真应景

火遍网上的“酸黄瓜”,到底是什么梗,大冬天的要真应景

西楼知趣杂谈
2026-01-09 20:53:48
李春平死了

李春平死了

霹雳炮
2025-11-05 22:34:23
建国初,甚至有部分将帅手握几十万兵力,为何没一人敢拥兵自重?

建国初,甚至有部分将帅手握几十万兵力,为何没一人敢拥兵自重?

文史季季红
2026-01-10 16:30:03
我国存款最安全的3大银行,永远都不会倒闭,你知道是哪3家吗?

我国存款最安全的3大银行,永远都不会倒闭,你知道是哪3家吗?

小熊侃史
2026-01-07 11:17:59
这可是生图啊,真不敢想象刘亦菲本人到底有多美,太羡慕了!

这可是生图啊,真不敢想象刘亦菲本人到底有多美,太羡慕了!

手工制作阿歼
2026-01-11 01:00:24
刷到这图,卖房的房东都坐不住了

刷到这图,卖房的房东都坐不住了

大川东山再起
2026-01-10 21:27:16
你在闲鱼上买过什么好东西?网友:人类对咸鱼的开发不足1%

你在闲鱼上买过什么好东西?网友:人类对咸鱼的开发不足1%

另子维爱读史
2026-01-09 21:12:13
中央已明确落实:“两延一弹一自愿”,2026年退休如何选择更划算

中央已明确落实:“两延一弹一自愿”,2026年退休如何选择更划算

夜深爱杂谈
2026-01-11 19:29:48
两岸喜讯!大陆没想到,没等正式收台,台当局先送来2份“大礼”

两岸喜讯!大陆没想到,没等正式收台,台当局先送来2份“大礼”

趣生活
2026-01-10 22:29:06
14点50分!山东男篮第4外援突发状况,2米1强援重返NBA,预案出炉

14点50分!山东男篮第4外援突发状况,2米1强援重返NBA,预案出炉

王大发不懂球
2026-01-11 19:03:05
第二批次055的正式到来,美媒:2026年055超级驱逐舰将进入新阶段

第二批次055的正式到来,美媒:2026年055超级驱逐舰将进入新阶段

啸鹰评
2026-01-10 23:41:51
2026-01-11 23:20:49
TechWeb incentive-icons
TechWeb
做有态度的互联网资讯。
15220文章数 43050关注度
往期回顾 全部

科技要闻

“我们与美国的差距也许还在拉大”

头条要闻

4.5万株草莓苗停止生长 果农急求助1小时后获专家回应

头条要闻

4.5万株草莓苗停止生长 果农急求助1小时后获专家回应

体育要闻

U23国足形势:末轮不负泰国即确保晋级

娱乐要闻

留几手为闫学晶叫屈?称网友自卑敏感

财经要闻

外卖平台"烧钱抢存量市场"迎来终局?

汽车要闻

2026款宋Pro DM-i长续航补贴后9.98万起

态度原创

亲子
教育
房产
艺术
数码

亲子要闻

晨时评 | 新生儿疑被助产士剪断手指,别用孩子乱动推卸责任

教育要闻

现在最鸡娃的群体就是体制内的成员!

房产要闻

66万方!4755套!三亚巨量房源正疯狂砸出!

艺术要闻

砸18亿!游戏巨头落子广州!诗悦网络总部大楼新进展

数码要闻

科技有AI,连接全球:海信家电参展CES 2026,定义智慧生活新图景

无障碍浏览 进入关怀版