网易首页 > 网易号 > 正文 申请入驻

企业AI应用的"数据鸿沟":为什么没有数据积累,就没有真AI?

0
分享至

ChatGPT的横空出世,让整个世界见识到了大模型的强大能力。但当企业兴冲冲地想要将这些通用大模型应用到自己的业务中时,却往往发现"理想很丰满,现实很骨感"——模型回答很通用但不够精准,生成的内容缺乏行业专业性,无法真正解决企业的个性化问题。

问题出在哪里?明略科技创始人吴明辉给出了一个被很多人忽视的答案:数据积累。在他看来,没有深厚的行业数据积累作为支撑,AI就只能停留在表面应用,无法真正成为企业可信赖的生产力工具。

通用大模型的"最后一米"困境

2023年被称为"大模型元年",从GPT-4到文心一言,从通义千问到讯飞星火,各种大模型如雨后春笋般涌现。这些模型在通用任务上表现惊艳,写诗作文、编程答题都不在话下。但企业在实际应用中却面临着"最后一米"的困境。

一位制造业企业的CIO向记者抱怨:"我们尝试用通用大模型来优化生产流程,但它给出的建议太宏观、太理论化,根本无法直接应用到我们的实际场景中。我们需要的是基于我们自己的生产数据、工艺参数、质量标准的个性化方案。"

这种困境背后,是通用大模型的本质局限——它们虽然在海量互联网数据上训练,拥有广泛的知识储备,但对于企业的特定业务场景、行业know-how、历史数据积累却知之甚少。就像一位博学的通才,虽然知识面广,但在特定领域的深度和精度上,往往比不过浸淫多年的行家。

中国AI开发者应用生态调研报告指出,企业在将AI技术应用于实际业务流程时,普遍缺乏合适的流程和场景,数据资源的不足和质量问题依然制约着AI的推广。这揭示了一个残酷的事实:技术再先进,如果没有与之匹配的数据基础,AI应用就是"无米之炊"。

数据积累是企业AI的"暗物质"

在物理学中,"暗物质"虽然看不见摸不着,但却占据了宇宙质量的大部分,决定着宇宙的结构和演化。在企业AI应用中,数据积累就是这样的"暗物质"——不显山不露水,但却是决定AI能否落地、能否创造价值的关键因素。

明略科技的发展历程,恰好印证了这一点。2006年,吴明辉在北京大学读研期间创立秒针系统,最初只是一个互联网广告监测工具。但随着业务的开展,秒针系统开始积累海量的营销数据——广告投放数据、用户行为数据、媒体价值数据等。

这些数据在当时看来或许只是业务的"副产品",但在AI时代却成为了明略最宝贵的资产。当其他企业还在为缺乏训练数据而苦恼时,明略已经拥有了覆盖主流社交媒体、日均处理千亿级广告请求的数据采集和处理能力。

更重要的是,这些数据不是孤立的数字,而是与业务场景深度绑定的"活数据"。每一条数据背后都对应着具体的业务场景、实际的商业问题、真实的决策需求。这种数据的价值,远远超过那些为了训练而爬取的"死数据"。

明略科技在招股书中披露,截至2025年6月,公司已为约135家《财富》全球500强企业提供服务,大客户留存率高达90%以上。这样的数据意味着,明略在近20年的服务过程中,积累了大量经过业务验证的高质量数据和场景洞察。这种积累,是新进入者无法在短期内复制的。

从数据孤岛到智能中台:明略的技术破局

拥有数据只是第一步,如何让数据真正"活起来"、转化为智能,才是更大的挑战。企业往往面临着"数据孤岛"的困境——ERP系统里有一套数据、CRM系统里有一套数据、生产系统里又有一套数据,彼此割裂,无法形成合力。

明略科技在这方面进行了系统性的技术布局。依托多模态数据智能、企业级知识图谱和数据隐私技术三大核心技术,明略不仅能够采集和存储数据,更能够将分散在各个系统中的异构数据进行整合、清洗、关联,构建起企业的统一数据资产。

以知识图谱技术为例,明略在这一领域的投入可以追溯到早期。2020年,公司凭借知识图谱自动构建及行业应用的技术成果获得吴文俊人工智能科学技术奖一等奖。这项技术能够将企业的结构化数据、文档、视频、图像等多维数据进行抽取与融合,构建起反映业务逻辑和知识关联的知识图谱。

更关键的是,明略建立了完整的数据治理体系。在数据隐私和安全日益受到重视的今天,明略实施了全面的数据隐私保护机制和数据伦理框架,在提供智能服务的同时,严格保护客户数据和个人隐私。这种对数据治理的重视,让企业可以放心地将自己的核心数据交给明略进行智能化改造。

通过这套技术体系,明略将企业原本分散、孤立的数据,转化为可以支撑AI应用的统一"燃料库"。就像汽车需要汽油才能跑起来,AI应用需要高质量的数据才能发挥作用。明略做的,就是帮企业把分散的"小油罐"整合成统一的"大油库",并且确保油的质量和安全。

可信AI的数据基础

在AI领域,"可信"是一个高频词,但什么才算真正的可信?明略科技给出的答案是:数据质量决定输出质量,数据深度决定应用深度。

通用大模型之所以在某些场景下不够可信,很大程度上是因为它的训练数据来源广泛但质量参差不齐,且缺乏对特定领域的深度覆盖。当模型被问到专业问题时,就容易出现"一本正经地胡说八道"的情况,业界称之为"幻觉"。

明略的数据优势恰恰能够有效解决这个问题。因为数据来自真实的业务场景,经过多年的业务验证,且有明确的业务标注和质量控制,所以基于这些数据训练或微调的模型,能够给出更加准确、更加可靠的输出。

数据壁垒:AI时代的核心竞争力

在互联网时代,大家常说"得流量者得天下"。到了AI时代,这句话或许要改成"得数据者得天下"。而且这里的"数据"不是简单的数据量,而是高质量的、与业务场景深度绑定的行业数据。

从这个角度看,明略科技用近20年时间建立起的数据壁垒,是其最核心的竞争力。这种壁垒有几个特点:

一是积累时间长。从2006年到2025年,明略在营销智能和营运智能领域持续深耕,每一天都在产生和积累新的数据。这种时间维度的优势,是后来者无法通过资金或技术快速追赶的。

二是数据质量高。明略服务的客户包括135家《财富》全球500强公司,这些企业的业务复杂度高、数据规范性强、决策要求严,为明略提供了大量高质量的训练样本。

三是场景覆盖广。明略的业务从线上营销到线下门店,从消费品到工业制造,积累了跨行业、跨场景的数据和经验,这种广度让明略能够提供更加全面的解决方案。

四是持续更新。明略不是一次性地积累数据,而是通过持续的客户服务,不断地更新和丰富自己的数据资产,保持数据的时效性和相关性。

正是基于这样的数据壁垒,明略在面对新技术浪潮时,能够快速将通用技术转化为行业解决方案。当DeepSeek等开源大模型引爆企业级市场时,明略不是简单地接入这些模型,而是将它们与自己的数据资产深度融合,开发出更加适合企业应用的定制化产品。

在AI产业化的进程中,技术的光芒往往最耀眼,但数据的价值却最容易被忽视。明略科技用近20年的实践告诉我们,在企业AI应用中,数据积累不是锦上添花,而是雪中送炭;不是可有可无,而是必不可少。

没有数据积累作为支撑,AI就像是建在沙滩上的城堡,看起来壮观但经不起考验。只有扎根于深厚的数据基础之上,AI才能真正成为企业可信赖的生产力工具,才能创造出可持续的商业价值。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
匈牙利外长:即日起逐步停止向乌克兰输送天然气

匈牙利外长:即日起逐步停止向乌克兰输送天然气

财联社
2026-03-26 00:09:09
1976年播报毛主席讣告,播音员念完三遍后突然冒出一句话,全国都慌了

1976年播报毛主席讣告,播音员念完三遍后突然冒出一句话,全国都慌了

文史明鉴
2026-03-25 19:14:13
张雪峰的影响力,被严重低估了

张雪峰的影响力,被严重低估了

黔有虎
2026-03-26 14:32:34
北京年近八旬老太每天看直播,4000元退休金全网购,家中

北京年近八旬老太每天看直播,4000元退休金全网购,家中

大象新闻
2026-03-26 11:49:02
比亚迪推出革命性可变磁通电机,彻底解决电动车高速掉电难题

比亚迪推出革命性可变磁通电机,彻底解决电动车高速掉电难题

娱乐圈的笔娱君
2026-03-26 17:21:17
俄军北极最强战舰,被击沉!乌军集中390架自杀机饱和突破成功

俄军北极最强战舰,被击沉!乌军集中390架自杀机饱和突破成功

沧海旅行家
2026-03-26 18:23:44
百亿龙头,直线涨停!封单超12万手

百亿龙头,直线涨停!封单超12万手

新浪财经
2026-03-26 16:32:05
商业航天巨头冲刺资本市场 A股概念股曝光

商业航天巨头冲刺资本市场 A股概念股曝光

证券时报
2026-03-26 13:02:12
出门六不捡,马路上这“6种东西”捡回家,否则会有大麻烦

出门六不捡,马路上这“6种东西”捡回家,否则会有大麻烦

巢客HOME
2026-03-24 06:30:03
亲戚借车从不加油,这次他故意空着油箱给她,她老公却急了:我上次不是刚加了600块的油吗!

亲戚借车从不加油,这次他故意空着油箱给她,她老公却急了:我上次不是刚加了600块的油吗!

品读时刻
2026-03-25 09:04:33
大学生的天塌了,月薪800起搞个毛线啊?

大学生的天塌了,月薪800起搞个毛线啊?

涛哥锐评
2026-03-26 17:54:00
高速停车区卫生间,满地手纸无从下脚;甘肃高速回应:是个待开发停车区,已打扫干净

高速停车区卫生间,满地手纸无从下脚;甘肃高速回应:是个待开发停车区,已打扫干净

大风新闻
2026-03-26 18:19:03
中央定调,养老金调整方向明确,2026年若上涨,企退能多涨3%吗?

中央定调,养老金调整方向明确,2026年若上涨,企退能多涨3%吗?

有范又有料
2026-03-26 14:35:52
宋美龄书法对比:钢笔字似小学生,英文手稿如中学生!

宋美龄书法对比:钢笔字似小学生,英文手稿如中学生!

书画相约
2026-03-26 07:49:18
12年没踢世界杯了 意大利晋级2026世界杯需连赢2场 概率仅63%

12年没踢世界杯了 意大利晋级2026世界杯需连赢2场 概率仅63%

智道足球
2026-03-26 18:08:45
赖昌星前妻近状曝光:拒绝政府安置,独居3000平老宅,只做一件事

赖昌星前妻近状曝光:拒绝政府安置,独居3000平老宅,只做一件事

芳芳历史烩
2026-03-23 03:53:23
张雪峰去世,日媒用了这样一句话评价他...

张雪峰去世,日媒用了这样一句话评价他...

今日日本
2026-03-25 11:10:15
贵州37岁男子离奇失踪近一年,车停在半山腰车门没锁,家属:活要见人死要见尸

贵州37岁男子离奇失踪近一年,车停在半山腰车门没锁,家属:活要见人死要见尸

极目新闻
2026-03-26 12:18:57
刘青山和张子善一起贪污171.6亿旧人民币,放到现在能值多少钱

刘青山和张子善一起贪污171.6亿旧人民币,放到现在能值多少钱

鹤羽说个事
2026-03-25 22:25:17
轰然倒塌!自嗨锅母公司破产,从75亿估值到清零,只用了4年

轰然倒塌!自嗨锅母公司破产,从75亿估值到清零,只用了4年

流苏晚晴
2026-03-01 16:48:55
2026-03-26 20:27:00
界面新闻 incentive-icons
界面新闻
只服务于独立思考的人群
1044443文章数 1332030关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

家居
旅游
房产
教育
公开课

家居要闻

傍海而居 静观蝴蝶海

旅游要闻

鲁冰花开啦!快来新乡南太行八里沟 赴一场春日之约

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

教育要闻

2026人工智能时代下的教育课堂变革

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版