网易首页 > 网易号 > 正文 申请入驻

2024服贸会|对话枫清科技创始人兼CEO高雪峰:治理企业本地多模态数据是解决大模型幻觉的第一步

0
分享至

担任阿里云大数据&AI产品及解决方案总经理时,创业的念头就"长"在高雪峰心里了,这次参加2024年中国国际服务贸易交易会(以下简称"2024服贸会"),他的身份已从大厂高管变成创业公司枫清科技(Fabarta)的创始人。

在大数据和人工智能领域待了20年,他清楚企业数智化转型的需求,也知道怎样解决当下大模型落地的痛点。"要提升大模型推理能力""增强基于数据关系的推理能力""通过智能体平台提供推理的思考路径",服贸会上,在与北京商报记者交流的一个多小时中,他反复强调。

枫清科技致力于通过融合图、向量和AI的多模态智能引擎以及数据编织与智能体等技术的融合与探索,推动AI技术在企业级客户中的应用与落地,高雪峰给公司做了一个技术范的定位。简单来说,就是通过各种技术、产品、平台尽可能降低大模型"胡说八道"的几率。不久前,枫清科技和中化信息达成合作,利用智能体服务具体的业务场景。同时,公司的Pre-A+轮融资正在顺利推进中。

大模型的本质还是基于"概率"的预测

"大模型有强大的能力,但落地时暴露出一系列问题,"大模型狂奔两年,高雪峰说出了同行们的心声,"比如‘幻觉’现象、推理能力不足、解释性差。这些问题导致很多企业面临大模型‘好玩不好用’的困境。"

问题明确,原因何在?他认为与大模型的复杂性、多样性以及企业应用场景的精准性要求有关。

"大模型主要依赖于概率统计方法,通过大量的数据来学习语言模式和统计规律,进而预测下一个词或序列。模型往往通过生成最可能的词语序列来组成回答的内容,而不是真正地思考或分析问题的内在逻辑关系",高雪峰解释。

正因为如此,大模型在回答复杂逻辑问题时,可能会基于常见的语料模式生成看似合理但并非正确的答案,这就是大模型的幻觉。

"现实世界中的许多复杂决策需要多步骤分解与推理,大模型缺乏有效的记忆机制来跟踪和协调每一个推理步骤,或者是针对特定的复杂问题去拆解推理的步骤",高雪峰向北京商报记者解释,每一步推理的结果可能影响下一步的输入,而大模型在内容生成过程中的概率预测能力,在多复杂条件下未必准确。

同样是因为大模型过于复杂,让可解释性变得更加困难,技术出身的高雪峰坦言,"专业研究人员也很难理解模型是如何得出某个结论的,普通用户更难以理解模型为什么输出这样的内容"。

"OpenAI刚刚推出了推理能力很强的o1模型,基本上也是在推理框架上面做了更深度的改进,比如思维链机制的改进。在o1之前就有很多研究使用ToT(思维树)、GoT(思维图)等方式来改进大模型的推理能力。这与我们在企业场景当中落地的方向是一致的,只不过我们更多的推理是基于企业本地沉淀的精准知识与逻辑,相比通用的推理能力或者范式,可能更加贴近行业的积累。"高雪峰表示。

数据还是数据

关于数据,高雪峰谈得更多。

"如果训练数据主要来自特定领域或文化背景,模型就可能在该领域内的推理任务上表现较好,但在其他领域或文化背景下表现不佳,泛化能力将明显不足。当遇到不常见或没有足够数据支持的推理任务时,可能会出现错误,"高雪峰向北京商报记者举例,"缺乏对特定行业知识的深入理解,可能导致模型缺乏领域知识,生成不切实际的输出。"

数据时效性和安全可控是另一个问题。他说,预训练当中使用的数据就是模型做内容生成时的所有依据,但是在决策智能领域,大部分需求都对数据的时效性有很大要求。不同的数据全部拿来做大模型的预训练,很难在推理的过程当中去控制什么样的角色不能利用预训练阶段当中的哪部分数据,从而实现数据的安全可控。

回到解决方案,又要追溯到机器学习领域的架构之争:以模型为中心与以数据为中心。"争论的焦点在于,为了提升模型的性能和效果,究竟是应该锁定训练数据并不断迭代算法,还是应该锁定算法并不断迭代用于训练的数据,对其进行清洗和噪音剔除等操作。"

具体到企业场景中,"为了实现更好的效果,应该持续利用客户本地数据来优化模型参数和质量,还是应该让不同的模型能力服务于企业本地经过组织的数据",提到这一点时,高雪峰回顾了人工智能的三大流派:符号主义、联结主义和行为主义。"当前AIGC(人工智能生成内容)技术是联结主义的巅峰,而大模型幻觉、可解释性差、推理能力弱等问题,恰恰是符号主义流派的逻辑推理技术能解决的。"

让模型服务于企业本地数据

结合技术发展的客观规律,高雪峰提出的解决方案是,让不同的模型能力服务于企业本地经过组织的数据和知识。

为了解释清楚这些抽象的概念,他用了一个词:编织,即通过图与向量和文本数据的融合存储与计算来聚合企业本地数据,利用数据编织平台的能力将企业数据转化为知识,并通过知识运营与智能体平台结合大模型中的泛化知识,来支持丰富的企业智能化场景。

简单来说,就是通过各种技术手段,将企业本地数据和大模型的泛化知识作为大模型判断的基础。

"这种组织架构非常灵活,能够根据场景的不同需求,选择依赖大模型中的泛化知识或结合企业组织好的本地知识",基于这一点,高雪峰认为,平台建设是核心基础。

这个平台需要具备哪些核心能力,才能支撑不同的智能化场景?

在和合作的头部企业交流、实践后,他指出:最底层是基础设施,其上是对多种大模型甚至传统小模型的管理,同时需要整理行业所需的数据集。但是真正实现企业智能化场景的落地,还需提供知识运维与管理等能力,以及将企业多模态的数据转化为知识的能力,最后通过智能体平台及向上的原生知识库能力,赋能企业级场景。

枫清科技的产品就对应着上述能力,枫清·天枢多模态智能引擎为企业AI智能应用提供便捷的私有化记忆存储服务及强大且可解释的推理能力;枫清·锦书数据编织中台将企业的多模态数据转化为知识;枫清·瑶光企业知识中台将锦书当中的知识与不同大模型当中的泛化知识进行融合,并以智能体的方式赋能上层的丰富应用。

在和北京商报记者的交流中,高雪峰以枫清科技与中化信息的深度合作为例介绍,中化信息通过引入枫清科技的"枫清·瑶光企业知识中台",针对企业结构化数据和非结构化数据,验证和打造共创方案,将数据转换为知识,利用平台快速构建智能应用,发挥数据的价值,构建企业智能化升级之路。基于双方联合打造的灵活自主可控核心服务矩阵,包括知识引擎和智能体引擎两大关键组件,可通过文档问答、智能问数以及智能体方式串联大模型应用与业务系统,助力应用的智能化,提升用户与业务系统的交互效率以及工作和生产效率。

北京商报记者魏蔚

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
有100万存款的家庭,日子过得咋样?网友分享让人大跌眼镜!

有100万存款的家庭,日子过得咋样?网友分享让人大跌眼镜!

夜深爱杂谈
2026-03-02 22:37:17
中俄联手都镇不住高市早苗,知名学者判断:中日一个月内或有空战

中俄联手都镇不住高市早苗,知名学者判断:中日一个月内或有空战

安安说
2026-03-02 13:42:53
伯恩茅斯vs曼联:阿莱士-希门尼斯、阿德利首发,布鲁诺-费尔南德斯、马奎尔出战

伯恩茅斯vs曼联:阿莱士-希门尼斯、阿德利首发,布鲁诺-费尔南德斯、马奎尔出战

懂球帝
2026-03-21 03:10:11
快讯!蔡正元:“送行”!

快讯!蔡正元:“送行”!

达文西看世界
2026-03-20 09:37:59
“上坟带三样,子孙后代旺”,3样分别是啥?清明节祭祖别忘了带

“上坟带三样,子孙后代旺”,3样分别是啥?清明节祭祖别忘了带

千秋文化
2026-03-16 20:59:43
广东92-93惜败江苏 球员评价:萨林杰良好,3人及格,8人低迷

广东92-93惜败江苏 球员评价:萨林杰良好,3人及格,8人低迷

篮球资讯达人
2026-03-20 21:37:00
我军顶级的军事天才只有一人,他打的仗,即使别人复盘也打不出来

我军顶级的军事天才只有一人,他打的仗,即使别人复盘也打不出来

楚风说历史
2026-03-16 10:40:03
毛泽东作文得40分,杨昌济知道后,把语文老师袁仲谦骂个狗血淋头

毛泽东作文得40分,杨昌济知道后,把语文老师袁仲谦骂个狗血淋头

顾史
2026-03-16 18:00:09
“短剧一哥”王凯沐:爆红全靠资本砸钱包装!真相太扎心了!

“短剧一哥”王凯沐:爆红全靠资本砸钱包装!真相太扎心了!

手工制作阿歼
2026-03-21 03:14:28
每年30亿吨,已持续上百万年,马里亚纳海沟吞掉的海水到哪去了?

每年30亿吨,已持续上百万年,马里亚纳海沟吞掉的海水到哪去了?

心中的麦田
2026-02-27 19:34:54
年夜饭婆婆逼我滚回娘家,我笑着连夜买票,初一她家直接断水断电

年夜饭婆婆逼我滚回娘家,我笑着连夜买票,初一她家直接断水断电

収起了底线
2026-03-19 16:10:31
蒋介石侍卫长郝柏村晚年称:蒋介石最大错误,就是接受雅尔塔协定

蒋介石侍卫长郝柏村晚年称:蒋介石最大错误,就是接受雅尔塔协定

史之铭
2026-03-20 18:09:13
顺风车订单挂了几小时没人接,乘客低下了高贵的头颅:求你了,能不能过来接我

顺风车订单挂了几小时没人接,乘客低下了高贵的头颅:求你了,能不能过来接我

网约车观察室
2025-11-30 10:38:12
南海突然警报大作,解放军这次 “乱打” 一通,信号很不简单

南海突然警报大作,解放军这次 “乱打” 一通,信号很不简单

闫树军论评
2026-03-18 09:34:54
庆余年 3 炸锅!二皇子被换、太子一人分两角,核心阵容却稳了?

庆余年 3 炸锅!二皇子被换、太子一人分两角,核心阵容却稳了?

情感大头说说
2026-03-18 16:00:00
60岁以后富养自己的10大黄金法则,全占,妥妥的高智商老人

60岁以后富养自己的10大黄金法则,全占,妥妥的高智商老人

暖风吹过竹林
2026-02-16 16:47:43
我是寡妇已绝经,当保姆同居半年后才懂,男人的良心装的都是算计

我是寡妇已绝经,当保姆同居半年后才懂,男人的良心装的都是算计

i书与房
2026-03-05 13:48:24
武汉协和医院重要发布!

武汉协和医院重要发布!

越乔
2026-03-20 22:50:54
新周期阵容正式确认!国乒或敲定洛杉矶奥运人选,温瑞博出战混团

新周期阵容正式确认!国乒或敲定洛杉矶奥运人选,温瑞博出战混团

越岭寻踪
2026-03-20 02:51:36
心凉了!奥恰洛夫亲口确认:樊振东无缘世乒赛,国乒悬了

心凉了!奥恰洛夫亲口确认:樊振东无缘世乒赛,国乒悬了

老玮是个手艺人
2026-03-21 02:51:36
2026-03-21 03:55:00
北京商报 incentive-icons
北京商报
北京商报社隶属于中共北京市委宣传部,由北京日报报业集团主管主办
277385文章数 299998关注度
往期回顾 全部

财经要闻

金融法草案向社会公开征求意见

头条要闻

向特朗普提问日记者遭疯狂网暴 被骂帮中国让高市难堪

头条要闻

向特朗普提问日记者遭疯狂网暴 被骂帮中国让高市难堪

体育要闻

6年前的一场悲剧,造就了“法国瓦尔迪”

娱乐要闻

总台首届电影盛典,“沈马”CP再合体

科技要闻

宇树招股书拆解,人形机器人出货量第一!

汽车要闻

何小鹏坦白局:每月3亿的“慌”与通向L4的坚定

态度原创

数码
旅游
时尚
游戏
教育

数码要闻

唯卓仕折叠闪光灯首发仅148元,你冲不冲?

旅游要闻

35万余株杜鹃竞相绽放!黑龙潭公园漫山繁花迎客来

推广中奖名单-更新至2026年3月4日推广

Xbox新AI游戏助手翻车 玩家媒体纷纷表示:令人失望

教育要闻

爸爸身上的钱是妈妈的两倍,还少八元,请问爸爸身上有多少钱

无障碍浏览 进入关怀版