网易首页 > 网易号 > 正文 申请入驻

2024服贸会|对话枫清科技创始人兼CEO高雪峰:治理企业本地多模态数据是解决大模型幻觉的第一步

0
分享至

担任阿里云大数据&AI产品及解决方案总经理时,创业的念头就"长"在高雪峰心里了,这次参加2024年中国国际服务贸易交易会(以下简称"2024服贸会"),他的身份已从大厂高管变成创业公司枫清科技(Fabarta)的创始人。

在大数据和人工智能领域待了20年,他清楚企业数智化转型的需求,也知道怎样解决当下大模型落地的痛点。"要提升大模型推理能力""增强基于数据关系的推理能力""通过智能体平台提供推理的思考路径",服贸会上,在与北京商报记者交流的一个多小时中,他反复强调。

枫清科技致力于通过融合图、向量和AI的多模态智能引擎以及数据编织与智能体等技术的融合与探索,推动AI技术在企业级客户中的应用与落地,高雪峰给公司做了一个技术范的定位。简单来说,就是通过各种技术、产品、平台尽可能降低大模型"胡说八道"的几率。不久前,枫清科技和中化信息达成合作,利用智能体服务具体的业务场景。同时,公司的Pre-A+轮融资正在顺利推进中。

大模型的本质还是基于"概率"的预测

"大模型有强大的能力,但落地时暴露出一系列问题,"大模型狂奔两年,高雪峰说出了同行们的心声,"比如‘幻觉’现象、推理能力不足、解释性差。这些问题导致很多企业面临大模型‘好玩不好用’的困境。"

问题明确,原因何在?他认为与大模型的复杂性、多样性以及企业应用场景的精准性要求有关。

"大模型主要依赖于概率统计方法,通过大量的数据来学习语言模式和统计规律,进而预测下一个词或序列。模型往往通过生成最可能的词语序列来组成回答的内容,而不是真正地思考或分析问题的内在逻辑关系",高雪峰解释。

正因为如此,大模型在回答复杂逻辑问题时,可能会基于常见的语料模式生成看似合理但并非正确的答案,这就是大模型的幻觉。

"现实世界中的许多复杂决策需要多步骤分解与推理,大模型缺乏有效的记忆机制来跟踪和协调每一个推理步骤,或者是针对特定的复杂问题去拆解推理的步骤",高雪峰向北京商报记者解释,每一步推理的结果可能影响下一步的输入,而大模型在内容生成过程中的概率预测能力,在多复杂条件下未必准确。

同样是因为大模型过于复杂,让可解释性变得更加困难,技术出身的高雪峰坦言,"专业研究人员也很难理解模型是如何得出某个结论的,普通用户更难以理解模型为什么输出这样的内容"。

"OpenAI刚刚推出了推理能力很强的o1模型,基本上也是在推理框架上面做了更深度的改进,比如思维链机制的改进。在o1之前就有很多研究使用ToT(思维树)、GoT(思维图)等方式来改进大模型的推理能力。这与我们在企业场景当中落地的方向是一致的,只不过我们更多的推理是基于企业本地沉淀的精准知识与逻辑,相比通用的推理能力或者范式,可能更加贴近行业的积累。"高雪峰表示。

数据还是数据

关于数据,高雪峰谈得更多。

"如果训练数据主要来自特定领域或文化背景,模型就可能在该领域内的推理任务上表现较好,但在其他领域或文化背景下表现不佳,泛化能力将明显不足。当遇到不常见或没有足够数据支持的推理任务时,可能会出现错误,"高雪峰向北京商报记者举例,"缺乏对特定行业知识的深入理解,可能导致模型缺乏领域知识,生成不切实际的输出。"

数据时效性和安全可控是另一个问题。他说,预训练当中使用的数据就是模型做内容生成时的所有依据,但是在决策智能领域,大部分需求都对数据的时效性有很大要求。不同的数据全部拿来做大模型的预训练,很难在推理的过程当中去控制什么样的角色不能利用预训练阶段当中的哪部分数据,从而实现数据的安全可控。

回到解决方案,又要追溯到机器学习领域的架构之争:以模型为中心与以数据为中心。"争论的焦点在于,为了提升模型的性能和效果,究竟是应该锁定训练数据并不断迭代算法,还是应该锁定算法并不断迭代用于训练的数据,对其进行清洗和噪音剔除等操作。"

具体到企业场景中,"为了实现更好的效果,应该持续利用客户本地数据来优化模型参数和质量,还是应该让不同的模型能力服务于企业本地经过组织的数据",提到这一点时,高雪峰回顾了人工智能的三大流派:符号主义、联结主义和行为主义。"当前AIGC(人工智能生成内容)技术是联结主义的巅峰,而大模型幻觉、可解释性差、推理能力弱等问题,恰恰是符号主义流派的逻辑推理技术能解决的。"

让模型服务于企业本地数据

结合技术发展的客观规律,高雪峰提出的解决方案是,让不同的模型能力服务于企业本地经过组织的数据和知识。

为了解释清楚这些抽象的概念,他用了一个词:编织,即通过图与向量和文本数据的融合存储与计算来聚合企业本地数据,利用数据编织平台的能力将企业数据转化为知识,并通过知识运营与智能体平台结合大模型中的泛化知识,来支持丰富的企业智能化场景。

简单来说,就是通过各种技术手段,将企业本地数据和大模型的泛化知识作为大模型判断的基础。

"这种组织架构非常灵活,能够根据场景的不同需求,选择依赖大模型中的泛化知识或结合企业组织好的本地知识",基于这一点,高雪峰认为,平台建设是核心基础。

这个平台需要具备哪些核心能力,才能支撑不同的智能化场景?

在和合作的头部企业交流、实践后,他指出:最底层是基础设施,其上是对多种大模型甚至传统小模型的管理,同时需要整理行业所需的数据集。但是真正实现企业智能化场景的落地,还需提供知识运维与管理等能力,以及将企业多模态的数据转化为知识的能力,最后通过智能体平台及向上的原生知识库能力,赋能企业级场景。

枫清科技的产品就对应着上述能力,枫清·天枢多模态智能引擎为企业AI智能应用提供便捷的私有化记忆存储服务及强大且可解释的推理能力;枫清·锦书数据编织中台将企业的多模态数据转化为知识;枫清·瑶光企业知识中台将锦书当中的知识与不同大模型当中的泛化知识进行融合,并以智能体的方式赋能上层的丰富应用。

在和北京商报记者的交流中,高雪峰以枫清科技与中化信息的深度合作为例介绍,中化信息通过引入枫清科技的"枫清·瑶光企业知识中台",针对企业结构化数据和非结构化数据,验证和打造共创方案,将数据转换为知识,利用平台快速构建智能应用,发挥数据的价值,构建企业智能化升级之路。基于双方联合打造的灵活自主可控核心服务矩阵,包括知识引擎和智能体引擎两大关键组件,可通过文档问答、智能问数以及智能体方式串联大模型应用与业务系统,助力应用的智能化,提升用户与业务系统的交互效率以及工作和生产效率。

北京商报记者魏蔚

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
闫学晶事件升级!中戏否认12年招收新疆班,网传其儿子读的是11级

闫学晶事件升级!中戏否认12年招收新疆班,网传其儿子读的是11级

火山诗话
2026-01-12 06:12:18
男子气炸!742元买“上海迪士尼”套餐,却被拦在乐园大门外,现场再付1205元!这锅谁背

男子气炸!742元买“上海迪士尼”套餐,却被拦在乐园大门外,现场再付1205元!这锅谁背

南国今报
2026-01-12 19:32:21
道歉了!金帝巧克力被指“擦边营销”,是AI生成的么?

道歉了!金帝巧克力被指“擦边营销”,是AI生成的么?

LOGO研究所
2026-01-12 18:26:48
工信部部长透底:装光刻胶的玻璃瓶已在试用中,这回垄断真给破了

工信部部长透底:装光刻胶的玻璃瓶已在试用中,这回垄断真给破了

小8说科技
2026-01-13 12:01:24
宣布独立,成立一个新的:高都丽共和国!

宣布独立,成立一个新的:高都丽共和国!

百态人间
2026-01-13 16:35:22
龙翔被诉:贪污数额特别巨大、受贿数额特别巨大

龙翔被诉:贪污数额特别巨大、受贿数额特别巨大

极目新闻
2026-01-13 10:23:49
很多人低估了一万块的威力

很多人低估了一万块的威力

洞见
2026-01-12 20:34:37
美国得逞了?蒙古煤炭停供中国,转投日韩?结果蒙古果断反悔了

美国得逞了?蒙古煤炭停供中国,转投日韩?结果蒙古果断反悔了

南宗历史
2026-01-13 11:13:01
中国表达了对伊朗政权的支持

中国表达了对伊朗政权的支持

桂系007
2026-01-12 23:41:10
是否建议中国公民前往伊朗旅游?外交部回应

是否建议中国公民前往伊朗旅游?外交部回应

北青网-北京青年报
2026-01-13 15:35:16
71岁女星拒绝出席女儿婚礼,称不想见第二任前夫,关之琳送了婚纱

71岁女星拒绝出席女儿婚礼,称不想见第二任前夫,关之琳送了婚纱

娱说瑜悦
2026-01-13 12:57:57
邵佳一:14亿人有14亿个教练;苏超、村超球员能在三级联赛站稳再说国足

邵佳一:14亿人有14亿个教练;苏超、村超球员能在三级联赛站稳再说国足

懂球帝
2026-01-12 22:32:13
今明两天!中央八套、东方卫视齐上阵,2部王炸剧开播必火!

今明两天!中央八套、东方卫视齐上阵,2部王炸剧开播必火!

智凌纵横
2026-01-13 13:38:46
北京国安出手!报价俄罗斯28岁天才边锋,经纪人确认:正在谈判

北京国安出手!报价俄罗斯28岁天才边锋,经纪人确认:正在谈判

国足风云
2026-01-13 14:24:44
成龙家产实锤:房祖名拿生活费,吴卓林得信托基金,偏心却也周全

成龙家产实锤:房祖名拿生活费,吴卓林得信托基金,偏心却也周全

小老头奇闻
2026-01-13 16:20:24
苏联式解体将重演?俄罗斯专家大胆预测:美国或将分裂成3个国家

苏联式解体将重演?俄罗斯专家大胆预测:美国或将分裂成3个国家

小陈讲史
2026-01-13 11:19:27
李泽楷被她迷得疯狂,林丹为她不顾孕妻,她究竟有什么魅力?

李泽楷被她迷得疯狂,林丹为她不顾孕妻,她究竟有什么魅力?

丰谭笔录
2026-01-11 07:25:08
多哈球星赛今日开赛!国乒21人阵容强大,对手包括张本智和

多哈球星赛今日开赛!国乒21人阵容强大,对手包括张本智和

小犙拍客在北漂
2026-01-13 10:49:54
1990年杨得志迎娶小24岁的石莉,4年后病逝,6个孩子对后妈如何?

1990年杨得志迎娶小24岁的石莉,4年后病逝,6个孩子对后妈如何?

海佑讲史
2026-01-13 14:45:03
高龄补贴涨钱了,2025年,满70岁的退休人员符合要求吗?

高龄补贴涨钱了,2025年,满70岁的退休人员符合要求吗?

猫叔东山再起
2026-01-13 10:05:03
2026-01-13 17:23:00
北京商报 incentive-icons
北京商报
北京商报社隶属于中共北京市委宣传部,由北京日报报业集团主管主办
271006文章数 299933关注度
往期回顾 全部

财经要闻

"天量存款"将到期 资金会否搬入股市?

头条要闻

白宫称正考虑针对伊朗的军事选项 外交部回应

头条要闻

白宫称正考虑针对伊朗的军事选项 外交部回应

体育要闻

CBA还能众筹换帅?

娱乐要闻

周杰伦以球员身份参加澳网,C位海报公开

科技要闻

每年10亿美元!谷歌大模型注入Siri

汽车要闻

限时9.99万元起 2026款启辰大V DD-i虎鲸上市

态度原创

房产
数码
游戏
公开课
军事航空

房产要闻

重磅调规!417亩商改住+教育地块!海口西海岸又要爆发!

数码要闻

华硕发布Zenbook Duo UX8407双屏笔记本,性能升级亮点多

女友买游戏送男友让人酸爆!恋爱酸臭味引外网热议

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普拿中俄当幌子被北欧官员拆穿:完全不属实

无障碍浏览 进入关怀版