网易首页 > 网易号 > 正文 申请入驻

2024服贸会|对话枫清科技创始人兼CEO高雪峰:治理企业本地多模态数据是解决大模型幻觉的第一步

0
分享至

担任阿里云大数据&AI产品及解决方案总经理时,创业的念头就"长"在高雪峰心里了,这次参加2024年中国国际服务贸易交易会(以下简称"2024服贸会"),他的身份已从大厂高管变成创业公司枫清科技(Fabarta)的创始人。

在大数据和人工智能领域待了20年,他清楚企业数智化转型的需求,也知道怎样解决当下大模型落地的痛点。"要提升大模型推理能力""增强基于数据关系的推理能力""通过智能体平台提供推理的思考路径",服贸会上,在与北京商报记者交流的一个多小时中,他反复强调。

枫清科技致力于通过融合图、向量和AI的多模态智能引擎以及数据编织与智能体等技术的融合与探索,推动AI技术在企业级客户中的应用与落地,高雪峰给公司做了一个技术范的定位。简单来说,就是通过各种技术、产品、平台尽可能降低大模型"胡说八道"的几率。不久前,枫清科技和中化信息达成合作,利用智能体服务具体的业务场景。同时,公司的Pre-A+轮融资正在顺利推进中。

大模型的本质还是基于"概率"的预测

"大模型有强大的能力,但落地时暴露出一系列问题,"大模型狂奔两年,高雪峰说出了同行们的心声,"比如‘幻觉’现象、推理能力不足、解释性差。这些问题导致很多企业面临大模型‘好玩不好用’的困境。"

问题明确,原因何在?他认为与大模型的复杂性、多样性以及企业应用场景的精准性要求有关。

"大模型主要依赖于概率统计方法,通过大量的数据来学习语言模式和统计规律,进而预测下一个词或序列。模型往往通过生成最可能的词语序列来组成回答的内容,而不是真正地思考或分析问题的内在逻辑关系",高雪峰解释。

正因为如此,大模型在回答复杂逻辑问题时,可能会基于常见的语料模式生成看似合理但并非正确的答案,这就是大模型的幻觉。

"现实世界中的许多复杂决策需要多步骤分解与推理,大模型缺乏有效的记忆机制来跟踪和协调每一个推理步骤,或者是针对特定的复杂问题去拆解推理的步骤",高雪峰向北京商报记者解释,每一步推理的结果可能影响下一步的输入,而大模型在内容生成过程中的概率预测能力,在多复杂条件下未必准确。

同样是因为大模型过于复杂,让可解释性变得更加困难,技术出身的高雪峰坦言,"专业研究人员也很难理解模型是如何得出某个结论的,普通用户更难以理解模型为什么输出这样的内容"。

"OpenAI刚刚推出了推理能力很强的o1模型,基本上也是在推理框架上面做了更深度的改进,比如思维链机制的改进。在o1之前就有很多研究使用ToT(思维树)、GoT(思维图)等方式来改进大模型的推理能力。这与我们在企业场景当中落地的方向是一致的,只不过我们更多的推理是基于企业本地沉淀的精准知识与逻辑,相比通用的推理能力或者范式,可能更加贴近行业的积累。"高雪峰表示。

数据还是数据

关于数据,高雪峰谈得更多。

"如果训练数据主要来自特定领域或文化背景,模型就可能在该领域内的推理任务上表现较好,但在其他领域或文化背景下表现不佳,泛化能力将明显不足。当遇到不常见或没有足够数据支持的推理任务时,可能会出现错误,"高雪峰向北京商报记者举例,"缺乏对特定行业知识的深入理解,可能导致模型缺乏领域知识,生成不切实际的输出。"

数据时效性和安全可控是另一个问题。他说,预训练当中使用的数据就是模型做内容生成时的所有依据,但是在决策智能领域,大部分需求都对数据的时效性有很大要求。不同的数据全部拿来做大模型的预训练,很难在推理的过程当中去控制什么样的角色不能利用预训练阶段当中的哪部分数据,从而实现数据的安全可控。

回到解决方案,又要追溯到机器学习领域的架构之争:以模型为中心与以数据为中心。"争论的焦点在于,为了提升模型的性能和效果,究竟是应该锁定训练数据并不断迭代算法,还是应该锁定算法并不断迭代用于训练的数据,对其进行清洗和噪音剔除等操作。"

具体到企业场景中,"为了实现更好的效果,应该持续利用客户本地数据来优化模型参数和质量,还是应该让不同的模型能力服务于企业本地经过组织的数据",提到这一点时,高雪峰回顾了人工智能的三大流派:符号主义、联结主义和行为主义。"当前AIGC(人工智能生成内容)技术是联结主义的巅峰,而大模型幻觉、可解释性差、推理能力弱等问题,恰恰是符号主义流派的逻辑推理技术能解决的。"

让模型服务于企业本地数据

结合技术发展的客观规律,高雪峰提出的解决方案是,让不同的模型能力服务于企业本地经过组织的数据和知识。

为了解释清楚这些抽象的概念,他用了一个词:编织,即通过图与向量和文本数据的融合存储与计算来聚合企业本地数据,利用数据编织平台的能力将企业数据转化为知识,并通过知识运营与智能体平台结合大模型中的泛化知识,来支持丰富的企业智能化场景。

简单来说,就是通过各种技术手段,将企业本地数据和大模型的泛化知识作为大模型判断的基础。

"这种组织架构非常灵活,能够根据场景的不同需求,选择依赖大模型中的泛化知识或结合企业组织好的本地知识",基于这一点,高雪峰认为,平台建设是核心基础。

这个平台需要具备哪些核心能力,才能支撑不同的智能化场景?

在和合作的头部企业交流、实践后,他指出:最底层是基础设施,其上是对多种大模型甚至传统小模型的管理,同时需要整理行业所需的数据集。但是真正实现企业智能化场景的落地,还需提供知识运维与管理等能力,以及将企业多模态的数据转化为知识的能力,最后通过智能体平台及向上的原生知识库能力,赋能企业级场景。

枫清科技的产品就对应着上述能力,枫清·天枢多模态智能引擎为企业AI智能应用提供便捷的私有化记忆存储服务及强大且可解释的推理能力;枫清·锦书数据编织中台将企业的多模态数据转化为知识;枫清·瑶光企业知识中台将锦书当中的知识与不同大模型当中的泛化知识进行融合,并以智能体的方式赋能上层的丰富应用。

在和北京商报记者的交流中,高雪峰以枫清科技与中化信息的深度合作为例介绍,中化信息通过引入枫清科技的"枫清·瑶光企业知识中台",针对企业结构化数据和非结构化数据,验证和打造共创方案,将数据转换为知识,利用平台快速构建智能应用,发挥数据的价值,构建企业智能化升级之路。基于双方联合打造的灵活自主可控核心服务矩阵,包括知识引擎和智能体引擎两大关键组件,可通过文档问答、智能问数以及智能体方式串联大模型应用与业务系统,助力应用的智能化,提升用户与业务系统的交互效率以及工作和生产效率。

北京商报记者魏蔚

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刘銮雄长子移居英国晒近照,两鬓花白身姿健硕,在当地陪子女生活

刘銮雄长子移居英国晒近照,两鬓花白身姿健硕,在当地陪子女生活

揽星河的笔记
2025-11-11 19:10:19
16级大风+大暴雨!具有灾难性破坏力!今年最大的台风要来了

16级大风+大暴雨!具有灾难性破坏力!今年最大的台风要来了

深圳晚报
2025-11-11 07:59:35
印度网球选手前往中国参赛遭拒签,社媒求助中国驻印度大使馆

印度网球选手前往中国参赛遭拒签,社媒求助中国驻印度大使馆

懂球帝
2025-11-11 18:52:03
美福特号航母进入加勒比海

美福特号航母进入加勒比海

界面新闻
2025-11-11 22:44:34
曾某远没原配漂亮!对比照曝光,祖某也并不爱她,坐姿说明一切

曾某远没原配漂亮!对比照曝光,祖某也并不爱她,坐姿说明一切

子芫伴你成长
2025-11-09 22:05:23
一年狂飙21万公里,电池仅衰减5%,小米SU7车主刷新了科学

一年狂飙21万公里,电池仅衰减5%,小米SU7车主刷新了科学

木蹊说
2025-11-11 16:06:19
阿坝州双江口红旗桥引桥为何垮塌?官方:已成立专项工作组,原因尚需进一步核查

阿坝州双江口红旗桥引桥为何垮塌?官方:已成立专项工作组,原因尚需进一步核查

澎湃新闻
2025-11-11 19:34:26
演都不演了?李连杰、洪金宝变化突出,疑“血液净化”,牵连成龙

演都不演了?李连杰、洪金宝变化突出,疑“血液净化”,牵连成龙

阿笎评论哥
2025-11-11 11:57:29
多通报多暗访!中央安全生产考核巡查组带着隐患线索进驻地方

多通报多暗访!中央安全生产考核巡查组带着隐患线索进驻地方

南方都市报
2025-11-11 16:18:06
4.99万!刘强东不给雷军留活路!

4.99万!刘强东不给雷军留活路!

广告创意
2025-11-10 17:24:49
商务部新闻发言人就美方暂停实施出口管制穿透性规则答记者问

商务部新闻发言人就美方暂停实施出口管制穿透性规则答记者问

界面新闻
2025-11-11 22:04:28
祖某某与曾某都在一起7年了?网友曝更多细节,祖某曾酒后吐真言

祖某某与曾某都在一起7年了?网友曝更多细节,祖某曾酒后吐真言

十九妹
2025-11-11 15:38:20
皮蛋再次成为关注对象!多名院士发现:常吃皮蛋的人,有5变化!

皮蛋再次成为关注对象!多名院士发现:常吃皮蛋的人,有5变化!

徐云流浪中国
2025-11-11 16:29:53
央视直播,国足VS越南,冲3-0开门红,邵佳一督战,首发11人浮现

央视直播,国足VS越南,冲3-0开门红,邵佳一督战,首发11人浮现

球场没跑道
2025-11-11 21:34:38
笑不活了!曾医生成了带货狂人,“战袍”卖爆了

笑不活了!曾医生成了带货狂人,“战袍”卖爆了

大道微言
2025-11-11 16:18:04
两条新闻,全翻车了...

两条新闻,全翻车了...

胖胖说他不胖
2025-11-11 16:28:47
仅10分钟13中13轰28分!2.26米张子宇连续三战100% 女版鲨鱼太强

仅10分钟13中13轰28分!2.26米张子宇连续三战100% 女版鲨鱼太强

颜小白的篮球梦
2025-11-11 18:16:24
最愚蠢的活法:舍不得吃穿用,省到最后只剩廉价人生

最愚蠢的活法:舍不得吃穿用,省到最后只剩廉价人生

清风拂心
2025-11-06 13:15:03
江苏小米SU7突然起火,烧了二三十分钟,火势很大,原因疑曝光

江苏小米SU7突然起火,烧了二三十分钟,火势很大,原因疑曝光

180视角
2025-11-11 16:44:09
“家里已经供不起我上班了!”父母无奈哭诉,成2025年最大的笑话

“家里已经供不起我上班了!”父母无奈哭诉,成2025年最大的笑话

妍妍教育日记
2025-11-09 10:44:07
2025-11-12 00:12:49
北京商报 incentive-icons
北京商报
北京商报社隶属于中共北京市委宣传部,由北京日报报业集团主管主办
265201文章数 299845关注度
往期回顾 全部

财经要闻

南昌三瑞智能IPO:委外代工模式存疑

头条要闻

上海阿姨存了近30年的钱提不出傻眼 银行:找不到底根

头条要闻

上海阿姨存了近30年的钱提不出傻眼 银行:找不到底根

体育要闻

一个14岁的小男孩,决定了谁能晋级世界杯

娱乐要闻

古二曝秦雯多次炫耀袭警经历

科技要闻

苹果新品惨败,产线拆光、二代搁浅!

汽车要闻

盈利"大考",汽车智能化企业的中场战事

态度原创

本地
亲子
教育
时尚
家居

本地新闻

云游安徽 | 凌滩玉魄淬千年,诗意钢城马鞍山

亲子要闻

帮宝适明星产品矩阵亮相,直观解锁”眼见为实的安全感”

教育要闻

早晚自习两开花,成绩依旧不回家

舒淇,东亚女孩的恨海情天

家居要闻

国美学子 打造筑梦空间

无障碍浏览 进入关怀版