网易首页 > 网易号 > 正文 申请入驻

智能投顾的大模型应用,为什么选择了“大小模型协同”?

0
分享至

采访嘉宾|尹辰轩,北银金科高级算法专家

编辑|罗燕珊

大模型时代,金融行业依然站在技术革新的前沿。而在智能投顾这一高度合规、专业性极强的场景中,大模型的落地不仅是技术挑战,更是业务安全的严峻考验。面对挑战,北银金科采用了“大小模型协同”的架构思路,尝试在性能、准确性与合规之间找到更优平衡。

“大模型投顾落地的最大技术挑战,在于如何在高合规门槛的业务中避免幻觉和误答。”北银金科高级算法专家尹辰轩表示金融业务不像通用问答那样容错率高,一旦输出带有承诺收益或判断错误的内容,不仅影响用户决策,更可能带来法律风险。

在这种背景下,大小模型协同成为一条更为稳妥的路径。一方面,它限制了大模型的职责范围,主要负责任务扩写与流程编排,核心内容交由小模型完成;另一方面,也提升了整体的性价比——在更低算力消耗下,实现更稳定、深入的回答效果。

展望未来,尹辰轩认为,AI 应用架构会逐渐趋于“语言理解 + 工具调用”的组合形态,大小模型协同也只是更大趋势的一部分。

关于“大小模型协同”的相关思路及其在金融领域的应用情况,尹辰轩近日在接受 InfoQ 采访时做了简要阐述。更多实践细节他将在6 月 27~28 日于北京举行的AICon 人工智能开发与应用大会中进行系统性分享,敬请期待:

https://aicon.infoq.cn/2025/beijing/presentation/651
5

InfoQ:在您看来,大模型落地投顾领域最大的技术挑战是什么?为什么“大小模型协同”是一个更现实的解决路径?

尹辰轩:我认为大模型投顾落地的最大技术挑战在于如何在高合规门槛的投顾业务中避免幻觉和误答。

投顾业务的合规门槛高,专业性强,直接应用 L0 级的大模型存在较大的合规风险。很多大模型服务商本身在此类问题上也为了规避法律风险而泛泛而谈。大小模型协同在这个问题上有两个优势:

1)限制了大模型回答的范围

大模型的主要工作不再是产生完整的答案,而是对用户的问题进行扩写、搭建回答框架、分配投顾任务、实现答案融合,深度的投顾内容输出交给专精小模型来实现,有效降低了幻觉和误答的概率。

2)提高的大模型在回答深度 / 算力消耗的比率

小模型专精于某个特定用途,具有反应快、回答稳定的特定,无需大模型再梳理逻辑链进行更深度的思考,只需要大模型根据任务调用对应小模型即可,大大提高回答深度 / 算力消耗的比率。

InfoQ:您提到“大模型与基础模型解耦”是这套架构的亮点,能否简单透露下谈谈它是如何实现的?这在行业级应用中有怎样的意义?

尹辰轩:这套架构不是指大模型与基础模型解耦,基础模型本身就是大模型,我的意思是,根据 Agent 流程编排,每个环节需要的大小模型各自都是解耦的,可快速替换的。

比如在资产配置场景下,对用户的问题扩写,不必使用诸如 DS671B 这种通用的大参数模型,可以结合各类投顾报告或策略研报专训一个 3B 或者 7B 的模型,即可以很快速的根据资产配置类问题扩写出一套回答框架。在这之后,该框架下即可拆分出不同的投顾任务,每个投顾任务要匹配哪个小模型,此时也可以专门训练一个参数量较小的模型进行意图识别,从而精准的调用到对应的小模型。

在整个流程中,每个环节的小参数 LLM 或传统小模型都是模块化可替换的,同时,随着基础模型本身的进步,这些基于基础模型专训出来的小模型也会进步,从而形成加速成长的效果。

由于 LLM 的更新换代非常快,将应用全部依赖于基础模型会导致行业级应用在成长过程中过度依赖基础模型,且一旦切换基础模型会导致这些应用不稳定。将基础模型与应用层进行更明细的解耦,对于应用稳定性、成长性和私密性都至关重要。

InfoQ:关于大模型在金融场景中容易产生幻觉、跑偏回答的顾虑,咱们团队是怎么解决这一问题的?是否有实测效果可以分享?

尹辰轩:主要有三个手段:

  1. 在 Agent 流程搭建中,投顾任务分配环节采用大小模型的映射方式,不仅基于一套专精的检索模型去寻找对应的投顾量化模型寻求答案,还要基于词向量匹配的传统手段进行保底;

  2. 在产品设计中,考虑场景分类,比如将选股、配置、财富体检、持仓分析等场景区分开,节省掉大模型分辨不同场景的环节,直接明确调对应的 Agent 要解决什么问题,提高命中率;

  3. 通过在知识库中约束回答范围、内容和黑名单词汇,避免不合规的表述,如承诺收益、确定性表达等。

InfoQ:您提到小模型引擎的“可扩展性”是另一大优势。从您的实践看,这种架构是否能支持投顾以外的金融细分领域,如保险、财富管理等?

尹辰轩:当然可以,我们认为,小模型不仅仅是投顾小模型,在智能投研领域,复杂的小模型千千万万,我们在 AI 之前的时代积累下来的算法模型仍然具有极大的价值。每个小模型都是独立解耦的,在特定问题上实现高效、精准的计算。不过在扩展过程中,需要对这个小模型建立特征向量,以便大模型在任务分配环节能够更为精准的识别调用——可扩展性的前提是,维护一套小模型引擎索引。

InfoQ:目前这套方案是否已经在实际业务中尝试落地?有没有让您印象深刻的使用场景或反馈?

尹辰轩:已经在公司内部落地,且部分功能已经在母行落地。有两个场景让我印象比较深刻,一个是算法层面,一个是产品层面。

算法层面,我们对比了大小模型协同方案的投顾回答、DeepSeek 671B 的回答以及 Qwen72B 的回答,无论是回答深度还是合规性上,大小模型协同的方案实现了全量由于 DS 和 Qwen 的回答内容。不仅如此,随着切换基础模型,大小模型协同的方案也实现了无缝衔接,能够基础模型较差时回答的专业性保底,切换到更强大的基础模型后回答的专业性上限极高。

产品层面,我们认为交互模式,我们认为,文字、图片和表格并不是当前 AI 在 Chat 体验下的最优实践。纯粹的聊天形式,虽然体现了互动性,但也一定提高了用户的记忆成本。我们将一些传统页面进行了改造适配,实现了在聊天过程中用可操作页面的形式,将更多的信息集中在一个回答中,可以对回答的页面内容进行二次操作和互动,这个体验得到了非常良好的反馈。

InfoQ:面对快速演进的大模型生态,您认为未来金融行业的 AI 应用架构会走向怎样的形态?这场演讲最希望为听众带来哪些启发?

尹辰轩:我认为现在已经体现了一种趋势,即LLM+API 将实现大模型进入所有的互联网生态,Agent 在整个 AI 架构的商业实现上会越来越重要。

大小模型协同,其实在实际落地中,仍然是 LLM+API。如果仅限于问答,LLM+API 基本上就足够了,如果再加上操作,那么还需要 LLM+API+RPA。

从历史的经验上看,人类发展出的新的技术绝大多数情况下并非直接颠覆旧的技术,而是在旧技术的齿轮上加上另一个新技术的齿轮。多模态的图片生成会让 PS 消失吗?我不这么看,PS 已经积累了足够多的功能,那么与其训练一套和 PS 功能一样强大的多模态模型,不如通过 LLM+API+RPA 调用 PS,这也许是性价比更高的方案。

我认为,未来 AI 的架构,更多的会是基于大模型本身的语言理解能力将不同的模型或工具通过 API 串起来,作为我们人类的另一个身外大脑,为我们服务。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
再涨20元,2026年-2030年养老金调整方向定了,超1.8亿人受益

再涨20元,2026年-2030年养老金调整方向定了,超1.8亿人受益

财话连篇
2026-03-09 23:17:37
从法国走路到中国

从法国走路到中国

新民周刊
2026-03-10 16:44:38
最先看到世界的波斯女足反水,摘掉了头巾!

最先看到世界的波斯女足反水,摘掉了头巾!

家传编辑部
2026-03-10 16:22:24
难以置信!网传一女子征婚,称网贷欠200多万,谁帮还债就嫁给谁

难以置信!网传一女子征婚,称网贷欠200多万,谁帮还债就嫁给谁

火山詩话
2026-03-10 13:46:15
杨澜参加车展,全程被冷落无人在意,丈夫吴征大腹便便不正眼看她

杨澜参加车展,全程被冷落无人在意,丈夫吴征大腹便便不正眼看她

法老不说教
2026-03-10 18:08:15
日媒:女足亚洲杯中朝之战主裁判很离谱 中国队虽然获胜仍不满意?

日媒:女足亚洲杯中朝之战主裁判很离谱 中国队虽然获胜仍不满意?

顺静自然
2026-03-10 08:44:27
北大医学专家胡大一:睡觉,一个让你延长生命的革命性新秘方

北大医学专家胡大一:睡觉,一个让你延长生命的革命性新秘方

新浪财经
2026-03-10 00:31:51
伊朗德黑兰突降“黑雨”!有民众呼吸困难 喉咙刺痛

伊朗德黑兰突降“黑雨”!有民众呼吸困难 喉咙刺痛

闪电新闻
2026-03-10 19:30:10
腾讯QClaw来了,微信“小龙虾” 3步搞定

腾讯QClaw来了,微信“小龙虾” 3步搞定

AI先锋官
2026-03-10 15:46:47
揪心!曝伊朗女足球员被强行拖上车:泪流满面去机场 大巴车内求救

揪心!曝伊朗女足球员被强行拖上车:泪流满面去机场 大巴车内求救

风过乡
2026-03-10 21:00:08
国际油价暴跌!三桶油:吓死宝宝了,幸亏我们涨得快!

国际油价暴跌!三桶油:吓死宝宝了,幸亏我们涨得快!

社会日日鲜
2026-03-10 14:19:40
广东佛山草莓音乐节突然公告:取消举办,全额退款

广东佛山草莓音乐节突然公告:取消举办,全额退款

极目新闻
2026-03-10 17:02:48
全国高速统一限速!这4种超速不再罚款,车主:终于不用踩急刹了

全国高速统一限速!这4种超速不再罚款,车主:终于不用踩急刹了

刘哥谈体育
2026-03-10 19:15:54
两会还没结束,央媒对霍启刚称呼变了,四字之差释放两大强烈信号

两会还没结束,央媒对霍启刚称呼变了,四字之差释放两大强烈信号

格斗社
2026-03-10 06:28:25
新款奥迪A6L预售价公布:32.3万元起

新款奥迪A6L预售价公布:32.3万元起

界面新闻
2026-03-10 15:38:51
陈岸明任广东省人大常委会一级巡视员

陈岸明任广东省人大常委会一级巡视员

汲古知新
2026-03-09 20:14:48
别盯着比亚迪了,干掉蔚来换电的大概率是宁德时代

别盯着比亚迪了,干掉蔚来换电的大概率是宁德时代

钛媒体APP
2026-03-10 17:22:25
记者:澳政府将在机场为伊朗女足全队提供申请庇护的最后机会

记者:澳政府将在机场为伊朗女足全队提供申请庇护的最后机会

懂球帝
2026-03-10 13:06:17
毫不避讳,
王毅外长正式回应特朗普访华!

毫不避讳, 王毅外长正式回应特朗普访华!

南权先生
2026-03-10 15:26:57
国家互联网应急中心发布OpenClaw安全应用风险提示

国家互联网应急中心发布OpenClaw安全应用风险提示

界面新闻
2026-03-10 19:29:53
2026-03-11 01:40:49
InfoQ incentive-icons
InfoQ
有内容的技术社区媒体
12132文章数 51800关注度
往期回顾 全部

科技要闻

全民"养虾"背后:大厂集体下场疯狂卖Token

头条要闻

伊朗新最高领袖在袭击中受伤未公开发表讲话 官方回应

头条要闻

伊朗新最高领袖在袭击中受伤未公开发表讲话 官方回应

体育要闻

加兰没那么差,但鲈鱼会用吗?

娱乐要闻

《逐玉》注水风波升级!315评论区沦陷

财经要闻

“龙虾补贴”密集出炉 最高1000万!

汽车要闻

MG4有SUV衍生 上汽乘用车多款新车规划曝光

态度原创

艺术
数码
旅游
手机
公开课

艺术要闻

震撼!美国油画家约书亚·拉洛克的作品让人惊叹不已!

数码要闻

3月31日!RTX 50系玩家可体验英伟达DLSS 4.5新特性

旅游要闻

奇花艺境展推出多次打卡票种,沪上春日花事持续焕新

手机要闻

M5 Max 版 16 英寸 MacBook Pro 体验:算力巅峰与专业视界

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版