网易首页 > 网易号 > 正文 申请入驻

2024服贸会|对话枫清科技创始人兼CEO高雪峰:治理企业本地多模态数据是解决大模型幻觉的第一步

0
分享至

担任阿里云大数据&AI产品及解决方案总经理时,创业的念头就"长"在高雪峰心里了,这次参加2024年中国国际服务贸易交易会(以下简称"2024服贸会"),他的身份已从大厂高管变成创业公司枫清科技(Fabarta)的创始人。

在大数据和人工智能领域待了20年,他清楚企业数智化转型的需求,也知道怎样解决当下大模型落地的痛点。"要提升大模型推理能力""增强基于数据关系的推理能力""通过智能体平台提供推理的思考路径",服贸会上,在与北京商报记者交流的一个多小时中,他反复强调。

枫清科技致力于通过融合图、向量和AI的多模态智能引擎以及数据编织与智能体等技术的融合与探索,推动AI技术在企业级客户中的应用与落地,高雪峰给公司做了一个技术范的定位。简单来说,就是通过各种技术、产品、平台尽可能降低大模型"胡说八道"的几率。不久前,枫清科技和中化信息达成合作,利用智能体服务具体的业务场景。同时,公司的Pre-A+轮融资正在顺利推进中。

大模型的本质还是基于"概率"的预测

"大模型有强大的能力,但落地时暴露出一系列问题,"大模型狂奔两年,高雪峰说出了同行们的心声,"比如‘幻觉’现象、推理能力不足、解释性差。这些问题导致很多企业面临大模型‘好玩不好用’的困境。"

问题明确,原因何在?他认为与大模型的复杂性、多样性以及企业应用场景的精准性要求有关。

"大模型主要依赖于概率统计方法,通过大量的数据来学习语言模式和统计规律,进而预测下一个词或序列。模型往往通过生成最可能的词语序列来组成回答的内容,而不是真正地思考或分析问题的内在逻辑关系",高雪峰解释。

正因为如此,大模型在回答复杂逻辑问题时,可能会基于常见的语料模式生成看似合理但并非正确的答案,这就是大模型的幻觉。

"现实世界中的许多复杂决策需要多步骤分解与推理,大模型缺乏有效的记忆机制来跟踪和协调每一个推理步骤,或者是针对特定的复杂问题去拆解推理的步骤",高雪峰向北京商报记者解释,每一步推理的结果可能影响下一步的输入,而大模型在内容生成过程中的概率预测能力,在多复杂条件下未必准确。

同样是因为大模型过于复杂,让可解释性变得更加困难,技术出身的高雪峰坦言,"专业研究人员也很难理解模型是如何得出某个结论的,普通用户更难以理解模型为什么输出这样的内容"。

"OpenAI刚刚推出了推理能力很强的o1模型,基本上也是在推理框架上面做了更深度的改进,比如思维链机制的改进。在o1之前就有很多研究使用ToT(思维树)、GoT(思维图)等方式来改进大模型的推理能力。这与我们在企业场景当中落地的方向是一致的,只不过我们更多的推理是基于企业本地沉淀的精准知识与逻辑,相比通用的推理能力或者范式,可能更加贴近行业的积累。"高雪峰表示。

数据还是数据

关于数据,高雪峰谈得更多。

"如果训练数据主要来自特定领域或文化背景,模型就可能在该领域内的推理任务上表现较好,但在其他领域或文化背景下表现不佳,泛化能力将明显不足。当遇到不常见或没有足够数据支持的推理任务时,可能会出现错误,"高雪峰向北京商报记者举例,"缺乏对特定行业知识的深入理解,可能导致模型缺乏领域知识,生成不切实际的输出。"

数据时效性和安全可控是另一个问题。他说,预训练当中使用的数据就是模型做内容生成时的所有依据,但是在决策智能领域,大部分需求都对数据的时效性有很大要求。不同的数据全部拿来做大模型的预训练,很难在推理的过程当中去控制什么样的角色不能利用预训练阶段当中的哪部分数据,从而实现数据的安全可控。

回到解决方案,又要追溯到机器学习领域的架构之争:以模型为中心与以数据为中心。"争论的焦点在于,为了提升模型的性能和效果,究竟是应该锁定训练数据并不断迭代算法,还是应该锁定算法并不断迭代用于训练的数据,对其进行清洗和噪音剔除等操作。"

具体到企业场景中,"为了实现更好的效果,应该持续利用客户本地数据来优化模型参数和质量,还是应该让不同的模型能力服务于企业本地经过组织的数据",提到这一点时,高雪峰回顾了人工智能的三大流派:符号主义、联结主义和行为主义。"当前AIGC(人工智能生成内容)技术是联结主义的巅峰,而大模型幻觉、可解释性差、推理能力弱等问题,恰恰是符号主义流派的逻辑推理技术能解决的。"

让模型服务于企业本地数据

结合技术发展的客观规律,高雪峰提出的解决方案是,让不同的模型能力服务于企业本地经过组织的数据和知识。

为了解释清楚这些抽象的概念,他用了一个词:编织,即通过图与向量和文本数据的融合存储与计算来聚合企业本地数据,利用数据编织平台的能力将企业数据转化为知识,并通过知识运营与智能体平台结合大模型中的泛化知识,来支持丰富的企业智能化场景。

简单来说,就是通过各种技术手段,将企业本地数据和大模型的泛化知识作为大模型判断的基础。

"这种组织架构非常灵活,能够根据场景的不同需求,选择依赖大模型中的泛化知识或结合企业组织好的本地知识",基于这一点,高雪峰认为,平台建设是核心基础。

这个平台需要具备哪些核心能力,才能支撑不同的智能化场景?

在和合作的头部企业交流、实践后,他指出:最底层是基础设施,其上是对多种大模型甚至传统小模型的管理,同时需要整理行业所需的数据集。但是真正实现企业智能化场景的落地,还需提供知识运维与管理等能力,以及将企业多模态的数据转化为知识的能力,最后通过智能体平台及向上的原生知识库能力,赋能企业级场景。

枫清科技的产品就对应着上述能力,枫清·天枢多模态智能引擎为企业AI智能应用提供便捷的私有化记忆存储服务及强大且可解释的推理能力;枫清·锦书数据编织中台将企业的多模态数据转化为知识;枫清·瑶光企业知识中台将锦书当中的知识与不同大模型当中的泛化知识进行融合,并以智能体的方式赋能上层的丰富应用。

在和北京商报记者的交流中,高雪峰以枫清科技与中化信息的深度合作为例介绍,中化信息通过引入枫清科技的"枫清·瑶光企业知识中台",针对企业结构化数据和非结构化数据,验证和打造共创方案,将数据转换为知识,利用平台快速构建智能应用,发挥数据的价值,构建企业智能化升级之路。基于双方联合打造的灵活自主可控核心服务矩阵,包括知识引擎和智能体引擎两大关键组件,可通过文档问答、智能问数以及智能体方式串联大模型应用与业务系统,助力应用的智能化,提升用户与业务系统的交互效率以及工作和生产效率。

北京商报记者魏蔚

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
年初至今大涨870%!688146,停牌核查!

年初至今大涨870%!688146,停牌核查!

证券时报e公司
2026-06-23 00:20:17
郑恺追了整整一个大学,连陈赫都公开起哄的女人,到底什么来头

郑恺追了整整一个大学,连陈赫都公开起哄的女人,到底什么来头

西楼知趣杂谈
2026-06-08 16:52:27
哈兰德已收藏有价值65万英镑的爱马仕名包,最贵的一只33万

哈兰德已收藏有价值65万英镑的爱马仕名包,最贵的一只33万

乡野小珥
2026-06-21 10:08:19
A股收评:历史第二成交天量!创业板指、科创50指数续创历史新高,小金属、培育钻石、大金融板块爆发

A股收评:历史第二成交天量!创业板指、科创50指数续创历史新高,小金属、培育钻石、大金融板块爆发

格隆汇
2026-06-22 15:09:26
混子!巴萨两大水货世界杯现形,西班牙 4-0 大胜也洗不动

混子!巴萨两大水货世界杯现形,西班牙 4-0 大胜也洗不动

澜归序
2026-06-22 04:08:21
巴萨脸都不要了!嫌 2600 万拉什福德贵,转头挖曼联 7400 万神锋

巴萨脸都不要了!嫌 2600 万拉什福德贵,转头挖曼联 7400 万神锋

奶盖熊本熊
2026-06-22 04:31:19
一场比赛还没打,就提前锁定下赛季总冠军?湖人马刺恐成“陪跑”

一场比赛还没打,就提前锁定下赛季总冠军?湖人马刺恐成“陪跑”

大卫的篮球故事
2026-06-22 17:22:08
9岁男孩吃了夜市提拉米苏,全麻开腹手术进了ICU:你的那口随便的甜,可能要了孩子的命!

9岁男孩吃了夜市提拉米苏,全麻开腹手术进了ICU:你的那口随便的甜,可能要了孩子的命!

消化石医生
2026-06-09 20:08:20
上海550万退休老人养老金即将迎来调整,看看过去三年变化多大?

上海550万退休老人养老金即将迎来调整,看看过去三年变化多大?

虎哥闲聊
2026-06-22 17:45:26
已不配主力?葡媒及球迷票选首发阵容:C罗均落选 13战42射门0球

已不配主力?葡媒及球迷票选首发阵容:C罗均落选 13战42射门0球

风过乡
2026-06-22 19:54:35
世界冠军吴鹏近况:39岁发福明显,迎娶美女主持,创业成功不缺钱

世界冠军吴鹏近况:39岁发福明显,迎娶美女主持,创业成功不缺钱

大西体育
2026-06-22 07:01:47
AI革命下资本原形何以毕露?

AI革命下资本原形何以毕露?

烽火瞭望者
2026-06-22 06:30:51
遗憾!德国足协官宣多特铁卫世界杯报销 今夏加盟皇马估计要黄了

遗憾!德国足协官宣多特铁卫世界杯报销 今夏加盟皇马估计要黄了

雪狼侃体育
2026-06-22 22:49:39
世卫组织推荐的肌肉不流失四大黄金法则,照着做,准没错

世卫组织推荐的肌肉不流失四大黄金法则,照着做,准没错

观星赏月
2026-06-18 15:29:58
女孩查分721,当晚选择坠楼自杀,警方检查手机短信,发现实情

女孩查分721,当晚选择坠楼自杀,警方检查手机短信,发现实情

罪案洞察者
2025-07-16 10:48:38
切尔西盯上17球中场接班恩佐,挖角利物浦头牌弗洛里安·维尔茨

切尔西盯上17球中场接班恩佐,挖角利物浦头牌弗洛里安·维尔茨

甜份超标的我
2026-06-23 00:04:22
郑钦文回应排名下滑:最大的苦恼是报名参赛的限制,需要从低级别赛事开始打,接受落差,保持谦逊

郑钦文回应排名下滑:最大的苦恼是报名参赛的限制,需要从低级别赛事开始打,接受落差,保持谦逊

极目新闻
2026-06-22 14:39:15
1500万年薪成拦路虎 凯西距尤文只差一次会面

1500万年薪成拦路虎 凯西距尤文只差一次会面

快乐加载中21
2026-06-23 00:11:27
印度网友说中国也有种姓制度,仔细一看,真的让人笑掉大牙!

印度网友说中国也有种姓制度,仔细一看,真的让人笑掉大牙!

全城探秘
2026-06-18 18:06:57
“真后悔学了电气专业”,女生吐露实情,早知不如学葡萄酒了!

“真后悔学了电气专业”,女生吐露实情,早知不如学葡萄酒了!

熙熙说教
2026-06-22 19:32:53
2026-06-23 01:07:00
北京商报 incentive-icons
北京商报
北京商报社隶属于中共北京市委宣传部,由北京日报报业集团主管主办
286099文章数 300118关注度
往期回顾 全部

财经要闻

前美联储主席格林斯潘去世 享年100岁

头条要闻

媒体:中国"两箭齐发"反制美国 不卖了也不买了

头条要闻

媒体:中国"两箭齐发"反制美国 不卖了也不买了

体育要闻

法国球星祝中国队下届世界杯取得好成绩

娱乐要闻

陪睡陪玩是皮毛,向佐揭内娱暗规则

科技要闻

马云与阿里巴巴众高管下田插秧

汽车要闻

华为智驾ADS限时优惠月底结束 7月1日前下订立省3000元

态度原创

艺术
亲子
游戏
公开课
军事航空

艺术要闻

光设计就刷屏!南京“绿洲大厦”,层层像梯田!

亲子要闻

大牌纸尿裤查出致癌物!记者穿一整夜,血液浓度直接猛涨近一倍

老司机落泪!爆料称《GTA6》没有"特殊工作者"

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

东风-17发射状态首次公开 多车齐射场面硬核

无障碍浏览 进入关怀版