(来源:经济日报)
转自:经济日报
近日,奇富科技发布首个面向信贷场景的多模态评测基准FCMBench-V1.0。
复旦大学陈涛教授表示,从数据规模、任务覆盖度到评测设计的系统性来看,FCMBench已经是目前国内金融领域金融AI研究中规模最大、同时也是少有的统一评测基准。它并非为某一家机构服务,而是以行业共识为目标,定义了真正有价值的问题边界。
“评测先行本质上是在做一把尺子。”奇富科技多模态负责人杨叶辉指出,当前金融机构在选择模型和方案时,常常陷入“不同模型分别声称得到了95分和98分,到底哪个好”的困惑。没有统一、公平、公开的评测体系,决策就容易失焦。FCMBench的价值,正在于把模型拉到同一条起跑线上,让能力在真实业务条件下接受检验。(经济日报记者 彭江)
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.