网易首页 > 网易号 > 正文 申请入驻

企业AI应用的"数据鸿沟":为什么没有数据积累,就没有真AI?

0
分享至

ChatGPT的横空出世,让整个世界见识到了大模型的强大能力。但当企业兴冲冲地想要将这些通用大模型应用到自己的业务中时,却往往发现"理想很丰满,现实很骨感"——模型回答很通用但不够精准,生成的内容缺乏行业专业性,无法真正解决企业的个性化问题。

问题出在哪里?明略科技创始人吴明辉给出了一个被很多人忽视的答案:数据积累。在他看来,没有深厚的行业数据积累作为支撑,AI就只能停留在表面应用,无法真正成为企业可信赖的生产力工具。

通用大模型的"最后一米"困境

2023年被称为"大模型元年",从GPT-4到文心一言,从通义千问到讯飞星火,各种大模型如雨后春笋般涌现。这些模型在通用任务上表现惊艳,写诗作文、编程答题都不在话下。但企业在实际应用中却面临着"最后一米"的困境。

一位制造业企业的CIO向记者抱怨:"我们尝试用通用大模型来优化生产流程,但它给出的建议太宏观、太理论化,根本无法直接应用到我们的实际场景中。我们需要的是基于我们自己的生产数据、工艺参数、质量标准的个性化方案。"

这种困境背后,是通用大模型的本质局限——它们虽然在海量互联网数据上训练,拥有广泛的知识储备,但对于企业的特定业务场景、行业know-how、历史数据积累却知之甚少。就像一位博学的通才,虽然知识面广,但在特定领域的深度和精度上,往往比不过浸淫多年的行家。

中国AI开发者应用生态调研报告指出,企业在将AI技术应用于实际业务流程时,普遍缺乏合适的流程和场景,数据资源的不足和质量问题依然制约着AI的推广。这揭示了一个残酷的事实:技术再先进,如果没有与之匹配的数据基础,AI应用就是"无米之炊"。

数据积累是企业AI的"暗物质"

在物理学中,"暗物质"虽然看不见摸不着,但却占据了宇宙质量的大部分,决定着宇宙的结构和演化。在企业AI应用中,数据积累就是这样的"暗物质"——不显山不露水,但却是决定AI能否落地、能否创造价值的关键因素。

明略科技的发展历程,恰好印证了这一点。2006年,吴明辉在北京大学读研期间创立秒针系统,最初只是一个互联网广告监测工具。但随着业务的开展,秒针系统开始积累海量的营销数据——广告投放数据、用户行为数据、媒体价值数据等。

这些数据在当时看来或许只是业务的"副产品",但在AI时代却成为了明略最宝贵的资产。当其他企业还在为缺乏训练数据而苦恼时,明略已经拥有了覆盖主流社交媒体、日均处理千亿级广告请求的数据采集和处理能力。

更重要的是,这些数据不是孤立的数字,而是与业务场景深度绑定的"活数据"。每一条数据背后都对应着具体的业务场景、实际的商业问题、真实的决策需求。这种数据的价值,远远超过那些为了训练而爬取的"死数据"。

明略科技在招股书中披露,截至2025年6月,公司已为约135家《财富》全球500强企业提供服务,大客户留存率高达90%以上。这样的数据意味着,明略在近20年的服务过程中,积累了大量经过业务验证的高质量数据和场景洞察。这种积累,是新进入者无法在短期内复制的。

从数据孤岛到智能中台:明略的技术破局

拥有数据只是第一步,如何让数据真正"活起来"、转化为智能,才是更大的挑战。企业往往面临着"数据孤岛"的困境——ERP系统里有一套数据、CRM系统里有一套数据、生产系统里又有一套数据,彼此割裂,无法形成合力。

明略科技在这方面进行了系统性的技术布局。依托多模态数据智能、企业级知识图谱和数据隐私技术三大核心技术,明略不仅能够采集和存储数据,更能够将分散在各个系统中的异构数据进行整合、清洗、关联,构建起企业的统一数据资产。

以知识图谱技术为例,明略在这一领域的投入可以追溯到早期。2020年,公司凭借知识图谱自动构建及行业应用的技术成果获得吴文俊人工智能科学技术奖一等奖。这项技术能够将企业的结构化数据、文档、视频、图像等多维数据进行抽取与融合,构建起反映业务逻辑和知识关联的知识图谱。

更关键的是,明略建立了完整的数据治理体系。在数据隐私和安全日益受到重视的今天,明略实施了全面的数据隐私保护机制和数据伦理框架,在提供智能服务的同时,严格保护客户数据和个人隐私。这种对数据治理的重视,让企业可以放心地将自己的核心数据交给明略进行智能化改造。

通过这套技术体系,明略将企业原本分散、孤立的数据,转化为可以支撑AI应用的统一"燃料库"。就像汽车需要汽油才能跑起来,AI应用需要高质量的数据才能发挥作用。明略做的,就是帮企业把分散的"小油罐"整合成统一的"大油库",并且确保油的质量和安全。

可信AI的数据基础

在AI领域,"可信"是一个高频词,但什么才算真正的可信?明略科技给出的答案是:数据质量决定输出质量,数据深度决定应用深度。

通用大模型之所以在某些场景下不够可信,很大程度上是因为它的训练数据来源广泛但质量参差不齐,且缺乏对特定领域的深度覆盖。当模型被问到专业问题时,就容易出现"一本正经地胡说八道"的情况,业界称之为"幻觉"。

明略的数据优势恰恰能够有效解决这个问题。因为数据来自真实的业务场景,经过多年的业务验证,且有明确的业务标注和质量控制,所以基于这些数据训练或微调的模型,能够给出更加准确、更加可靠的输出。

数据壁垒:AI时代的核心竞争力

在互联网时代,大家常说"得流量者得天下"。到了AI时代,这句话或许要改成"得数据者得天下"。而且这里的"数据"不是简单的数据量,而是高质量的、与业务场景深度绑定的行业数据。

从这个角度看,明略科技用近20年时间建立起的数据壁垒,是其最核心的竞争力。这种壁垒有几个特点:

一是积累时间长。从2006年到2025年,明略在营销智能和营运智能领域持续深耕,每一天都在产生和积累新的数据。这种时间维度的优势,是后来者无法通过资金或技术快速追赶的。

二是数据质量高。明略服务的客户包括135家《财富》全球500强公司,这些企业的业务复杂度高、数据规范性强、决策要求严,为明略提供了大量高质量的训练样本。

三是场景覆盖广。明略的业务从线上营销到线下门店,从消费品到工业制造,积累了跨行业、跨场景的数据和经验,这种广度让明略能够提供更加全面的解决方案。

四是持续更新。明略不是一次性地积累数据,而是通过持续的客户服务,不断地更新和丰富自己的数据资产,保持数据的时效性和相关性。

正是基于这样的数据壁垒,明略在面对新技术浪潮时,能够快速将通用技术转化为行业解决方案。当DeepSeek等开源大模型引爆企业级市场时,明略不是简单地接入这些模型,而是将它们与自己的数据资产深度融合,开发出更加适合企业应用的定制化产品。

在AI产业化的进程中,技术的光芒往往最耀眼,但数据的价值却最容易被忽视。明略科技用近20年的实践告诉我们,在企业AI应用中,数据积累不是锦上添花,而是雪中送炭;不是可有可无,而是必不可少。

没有数据积累作为支撑,AI就像是建在沙滩上的城堡,看起来壮观但经不起考验。只有扎根于深厚的数据基础之上,AI才能真正成为企业可信赖的生产力工具,才能创造出可持续的商业价值。

以上内容与数据,与有连云立场无关,不构成投资建议。据此操作,风险自担。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
受权发布|中华人民共和国国务院令  第835号

受权发布|中华人民共和国国务院令  第835号

新华社
2026-04-13 17:03:04
才来了四趟北京,就想要中国的核心技术?西班牙高估了自己的分量

才来了四趟北京,就想要中国的核心技术?西班牙高估了自己的分量

绚丽的画卷
2026-04-14 05:40:01
至少70个弹孔,美媒:补丁从头打到尾的KC-135,现身英国空军基地

至少70个弹孔,美媒:补丁从头打到尾的KC-135,现身英国空军基地

啸鹰评
2026-04-14 11:49:45
中共中央批准,开除韩占武党籍

中共中央批准,开除韩占武党籍

新京报
2026-04-13 11:34:06
美国登月快了?4名航天员返回中,没造假:照片、视频全都有

美国登月快了?4名航天员返回中,没造假:照片、视频全都有

通文知史
2026-04-13 13:25:07
阿德巴约25+10希尔德31分 热火主场大胜老鹰

阿德巴约25+10希尔德31分 热火主场大胜老鹰

北青网-北京青年报
2026-04-13 21:16:07
苹果首款折叠屏外观实锤!iPhone Fold最终版设计揭晓:再无悬念

苹果首款折叠屏外观实锤!iPhone Fold最终版设计揭晓:再无悬念

快科技
2026-04-14 08:19:04
单程决死突击!伊朗飞行员壮烈牺牲,炸翻美司令部,换掉3架美机

单程决死突击!伊朗飞行员壮烈牺牲,炸翻美司令部,换掉3架美机

混沌录
2026-04-13 17:41:11
校方回应“演出服遭学生家长集体退货”:家长已确认收货,全额支付服装费用

校方回应“演出服遭学生家长集体退货”:家长已确认收货,全额支付服装费用

红星新闻
2026-04-14 12:20:23
下架、召回!广东多款饮用水,细菌超标!情况通报

下架、召回!广东多款饮用水,细菌超标!情况通报

娱乐的硬糖吖
2026-04-14 00:52:32
土以要开打?埃尔多安威胁攻打以色列后,不到1天,卡茨强势出招

土以要开打?埃尔多安威胁攻打以色列后,不到1天,卡茨强势出招

面包夹知识
2026-04-14 14:16:05
王楚钦突然进医院!就医原因曝光,夺冠后一个细节引发关注

王楚钦突然进医院!就医原因曝光,夺冠后一个细节引发关注

冷紫葉
2026-04-13 16:09:11
国民党22个兵团,仅剩6个兵团撤到台湾,这6个兵团分别是谁统领?

国民党22个兵团,仅剩6个兵团撤到台湾,这6个兵团分别是谁统领?

云霄纪史观
2026-04-13 17:12:55
“羞耻”的成人用品!竟创造出超过两千亿的大市场?并且还在增长

“羞耻”的成人用品!竟创造出超过两千亿的大市场?并且还在增长

原梦叁生
2026-04-14 04:03:58
大陆送“大礼包”暖台湾人心,民进党拒善意自断后路

大陆送“大礼包”暖台湾人心,民进党拒善意自断后路

海峡导报社
2026-04-13 13:16:03
今天才知道,为啥鹅蛋很少有人吃?为啥卖鹅蛋的人很少?涨知识

今天才知道,为啥鹅蛋很少有人吃?为啥卖鹅蛋的人很少?涨知识

阿龙美食记
2026-04-12 15:01:18
火化工自述:对生死已经麻木,年轻漂亮女尸会多留两晚

火化工自述:对生死已经麻木,年轻漂亮女尸会多留两晚

小哥很OK
2024-07-08 17:03:04
赖清德窜到非洲

赖清德窜到非洲

娱乐的宅急便
2026-04-14 12:47:06
雪上加霜!董宇辉彻底慌了,新加坡《联合早报》怒斥其“卖假货”

雪上加霜!董宇辉彻底慌了,新加坡《联合早报》怒斥其“卖假货”

火山詩话
2026-04-14 06:37:51
医生告诫:每天睡前玩手机的人,不用半年时间,睡眠或有这6变化

医生告诫:每天睡前玩手机的人,不用半年时间,睡眠或有这6变化

白话电影院
2026-04-05 15:34:47
2026-04-14 14:56:49
有连云 incentive-icons
有连云
中国领先的AI原生金融智能平台,为金融机构等提供智能体全链路解决方案。
251438文章数 62985关注度
往期回顾 全部

科技要闻

离职同事"炼化"成AI?这届公司不需要活人了

头条要闻

恒大集团、恒大地产及许家印案开庭 许家印认罪悔罪

头条要闻

恒大集团、恒大地产及许家印案开庭 许家印认罪悔罪

体育要闻

他做对了所有事,却被整个职业网坛放逐了八年

娱乐要闻

宋祖儿刘宇宁恋情大反转 正主火速辟谣

财经要闻

许家印受审当庭表示认罪悔罪

汽车要闻

长城欧拉5限定版纯电版上市 限量99台售价13.38万元

态度原创

时尚
健康
亲子
旅游
教育

今年科切拉的风吹向了谁?

干细胞抗衰4大误区,90%的人都中招

亲子要闻

辣成这样都不舍得吐一点!

旅游要闻

申然:塞班军舰岛,一眼沦陷的蓝绿秘境

教育要闻

2026高考考生注意!7所高校全部启动

无障碍浏览 进入关怀版