AI+互联网媒体行业丨研究报告
前言:
研究意义
在AI技术加速重构传播生态的进程中,AI赋能已成为驱动互联网媒体产业升级的核心引擎。随着用户需求多元化与媒介形态迭代加速,内容生产者不仅需要应对创作效率、分发精准度等传统挑战,还需在生成式AI驱动的智能时代重塑内容生态。多模态大模型、深度推理算法等技术的突破,正深刻变革互联网媒体的内容生产范式、传播路径和商业模式。
在此背景下,本次研究聚焦生成式AI技术对互联网媒体全链路的深度赋能,以及标杆平台在智能化转型中的创新实践,旨在为内容创作者优化生产流程、为媒体平台提升运营效率提供有力支持,同时为行业决策者与投资者提供前瞻性观点。
研究内容
本报告深度解析中国互联网媒体行业的现状、AI赋能下的技术突破与转型路径,系统阐述生成式AI技术如何重构互联网媒体内容生态全链路,并提炼技术赋能下的实践成果与行业价值。
发展概况:当前中国互联网媒体行业正迈向AI赋能的智能生态融合阶段。当前用户增长趋缓,竞争转向存量市场。生成式AI加速多模态融合应用,重构内容生态与用户体验,驱动行业向质量效率转型。
深度赋能:AI技术深度赋能互联网媒体行业,推动全链条智能化转型。在生产、审核、分发、消费侧重构媒体生态,驱动行业从信息中介转向智能服务枢纽,实现内容质效升级与商业模式创新,加速产业价值跃迁。
标杆案例:中国主流媒体及社交媒体平台积极应用AI技术推动全媒体转型:人民日报、澎湃新闻、微博、抖音等聚焦AI技术在内容创作、审核分发、用户体验等环节的创新应用,加速媒体与AI的融合进程。
研究展望
AI时代互联网媒体行业面临多重挑战:生成式AI技术引发内容真实性争议、视频生成效果不佳引发商业化瓶颈、技术成本居高不下问题短期难以解决、隐私泄露风险等问题。
AI时代互联网媒体行业发展迎来机遇:媒体平台需通过自研技术、数据治理、智能推荐及生态审核构建竞争力;内容生产侧需融合人机协同,专业创作者聚焦文化深度与情感共鸣建立壁垒,平台通过可信认证、版权保护及精准圈层匹配实现内容生态升级,平衡商业价值与社会效益。
![]()
互联网媒体行业发展历程
互联网媒体历经五阶段跃迁,技术驱动内容生态从门户时代迈向AI赋能的智能生态融合新周期
互联网媒体行业三十年来经历了从基础信息聚合到智能生态融合的范式跃迁。早期门户网站主导奠定了内容集中化生产的基础;随着UGC崛起,社交平台重构了内容交互模式;移动互联网与4G普及催生短视频爆发,算法推荐技术重塑流量分发逻辑;当前生成式AI技术的突破,正驱动内容创作、分发及商业化全链路的智能化升级。技术迭代始终是行业变革的核心驱动力,推动媒介形态从单向传播向沉浸式、个性化、智能化的生态融合演进。
![]()
互联网用户规模增长红利见顶
中国互联网普及率逼近80%,网民网络数字生活渗透趋近饱和,互联网竞争迈入存量精耕新阶段
根据中国互联网络信息中心(CNNIC)《第56次中国互联网络发展状况统计报告》,2014-2025H1年中国网民规模从6.49亿增至11.2亿,普及率上升至79.7%,中国移动互联网设备规模逼近增长极限,截至2025年H1已达14.4亿台;截至2025年6月,中国网民的人均每周上网时长为30.6个小时; 网民的数字生活渗透趋近饱和。可见中国互联网用户交互行为已进入存量稳态化阶段。互联网普及率逼近80%后整体增速放缓,用户规模增长红利见顶后,互联网竞争迈入存量精耕的新阶段。
![]()
![]()
人工智能技术发展历程回顾
经过七十余年螺旋上升式的积累沉淀与质变跃迁后,人工智能迈入生成式AI技术驱动的应用落地爆发时代
人工智能技术演进呈现从符号逻辑到数据驱动、从专用模型到通用智能的螺旋式上升轨迹。早期符号主义通过规则推理构建专家系统,但受限于知识获取瓶颈;统计学习时代通过SVM等算法实现模式识别突破,但模型通用性不足;深度学习革命以CNN/RNN架构解决高维数据难题,却面临可解释性与能耗挑战;大模型范式以Transformer为核心,通过预训练+微调实现跨领域迁移,推动生成式AI爆发与应用落地。现阶段人工智能技术与垂直场景深度耦合进入应用爆发期。
![]()
LLM支持的文本生成技术成熟度高
文本生成技术因算法成熟度高已率先进入应用爆发阶段,并向趋近人类思维的逻辑推理范式快速升级
大语言模型(LLM)技术发展至今已达到相对成熟的阶段,其Transformer架构和“预训练-微调”范式已经成为行业标准,该架构的核心是自注意力机制,它将文本“词元化”并进行并行处理,使模型能够动态衡量序列中任意词语之间的关系,从而构建出对语言的深度全局理解。LLM的成熟度不仅体现在其稳固的基础架构,更体现在一系列前沿技术能力的快速涌现与融合:混合专家(MoE)架构解决了规模化效率问题;原生多模态能力打破了文本的单一限制;检索增强生成(RAG)提供了事实锚点;思维链(CoT)和思维树(ToT)等推理框架赋予了其解决复杂问题的能力;而不断扩展的上下文窗口则解锁了处理海量数据的潜力。这些能力使得新一代LLM在效率、可靠性和性能上实现了质的飞跃,共同将LLM从一个简单的文本生成工具推动成为越来越趋近人类思维的智能决策者角色。
![]()
多模态大模型处于多技术融合的进程中
生成向DiT架构和理解向MLLM架构同时发展但未达到底层融合,整合不同模态的生成和理解是关键方向
从概念上看,多模态大模型可以视为能够识别和处理多种类型数据(文本、图像及音视频等)的输入输出、实现跨模态理解和生成任务的人工智能模型。艾瑞将其分为“以DiT架构为代表的生成向”和“以MLLM架构为代表的理解向”两类:生成向模型基于DiT架构,专注于视觉内容的生成,但在跨模态信息处理上存在局限;理解向模型基于MLLM架构,擅长多模态分析与交互,但缺乏复杂视频生成能力。由于受限于数据异构性、模态对齐难度及算法复杂性,两类模型尚未实现底层能力的有效融合。如何更好地整合不同模态的生成和理解,将是多模态模型发展的关键方向。
![]()
生成式AI应用在多领域爆发式落地
各模态技术虽在发展成熟度上存在差异,但生成式AI以创造为核心的特征,促使应用落地快速进入爆发期
生成式AI技术突破了传统判别式AI局限于识别的框架,转向创造为核心的应用模式。各模态的发展成熟度虽有参差,但应用落地已呈现出百花齐放的繁荣景象。文本生成技术已进入商业化成熟期,广泛应用于办公、学习、文案、代码等领域;图像生成技术在艺术创作、产品设计和电商视觉等领域中实现规模化应用;虽然个性化语音合成仍受限于情感表达与口音适配,但音频生成技术已逐步在有声读物、音乐生成等垂直场景中应用;视频生成因Sora等模型突破进入爆发前夜,引发市场高度关注,商业化应用落地加快步伐。在产业端,整合生成式AI技术的智能解决方案,已在智能家居、自动驾驶、智慧医疗、工业设计等复杂的垂直场景中验证价值。
![]()
2025年大语言模型企业案例
从追求规模扩张转向构建专业矩阵、发展智能体以及实现全模态化,大语言模型产业价值向场景化应用层转移
2025年,大语言模型产业的核心主题是从单一的越大越好模式转向更加精细化的技术格局,呈现出三大核心特征:架构趋同、能力分化与全模态演进。混合专家(MoE)架构成为前沿模型的主流选择,以高效平衡模型规模与计算成本。市场从追求单一通用模型转向构建专业化模型矩阵,通用推理、视频生成和企业级智能体等专用模型并行发展,智能体能力成为新的竞争焦点。全模态成为旗舰模型的标配,模型开始普遍具备处理文本、图像、音视频的综合能力。在此背景下,以中国企业为代表的开源力量,通过开放高性能模型,正加速前沿技术的普及与商业化。大模型核心经济价值将不再仅仅集中于拥有最强大的基础模型,而是在基础模型之上构建的、针对特定行业的精调应用和解决方案。
![]()
![]()
技术影响下信息媒体的发展跃迁
技术推动媒体从文字时代跃迁至多模态时代,响应用户实时检索、深度思考、情感共鸣、全民创作的多元化需求
技术升级是人类信息媒体发展的核心驱动力,同时推动互联网媒体内容从单一走向多元。文字时代,TCP/IP与HTML支撑纯文本单向传播,内容生产主要依赖PGC;图文时代,CSS与图像压缩技术催生图文形式,博客与图片社交开启大众UGC生产阶段,回应用户情感与社交需求。4G/5G、WebRTC与算法催生长短视频+直播的多模态时代,以精准分发和强互动适配实时参与需求。当前大模型技术实现信息多模态理解与转化,降低创作门槛,推动互联网媒体进入全民创作与人机共创的新阶段,全方位满足个性化沉浸式消费需求。
![]()
AI对互联网媒体的赋能-内容生产
AI技术重构互联网媒体创作生态,以技术普惠推动内容生产的质效双升,实现产业价值跃迁
生成式AI正重塑互联网内容生产格局。技术突破使AI辅助生产突破专业壁垒,通过语义理解与多模态生成技术,将用户简单的文字指令转化为图文、视频等多元形态。社交平台海量用户基数为UGC提供天然土壤,我国11亿网民均可能参与多模态内容创作,凸显了全民内容创作趋势。用户基数与参与度形成多层次创作生态,社交平台成为核心载体。专业领域PGC则在AI驱动下优化工作流,提升优质内容产能。技术普惠下,内容生产正从精英化走向全民化,形成专业深度与创意广度并存的新型创作生态。
![]()
AI对互联网媒体的赋能-内容审核
生成式AI技术可从自动审核、精准判定、人机互补、动态策略四大方面,对内容审核体系进行革新赋能
当前互联网内容审核面临效率与精准度的双重挑战,生成式AI技术通过优化审核流程推动行业变革。AI技术通过多模态模型实现自动化初筛,大幅降低基础工作量。语义分析与情感识别技术则进一步提升了复杂违规内容的判定准确性。人机协同机制中,AI负责低风险内容过滤及风险分级,人工聚焦高敏感、高价值内容的深度复核,形成互补闭环。同时基于深度推理模型的动态策略优化,可实时适配新型违规模式,缩短规则迭代周期。AI为内容生态治理提供了兼具效率与灵活性的解决方案。
![]()
AI对互联网媒体的赋能-内容分发与平台运营
AI技术为媒体平台的内容分发提质增效,深度满足用户信息消费需求,提升用户体验与粘性,拓展商业新可能
生成式AI技术从多个维度为互联网媒体平台的运营工作注入动能:在内容分发环节,AI贯穿用户行为、设备、场景等多维度数据,深度解析内容并实现跨模态再生,优化推荐路径,以精准实时推荐、多模态场景适配激活用户需求,扩大内容传播辐射范围,提升分发效率;在用户运营环节,通过优质内容的精准匹配、部署快速响应的智能客服、多样化AI应用,深度契合用户信息消费需求,延长用户停留时长,强化参与粘性。另外在平台内容管理与商业拓展层面,AI不仅可以帮助平台优化人力资源配置,降低基础运营成本,还可以优化广告个性化生成与精准投放,更以内容定制、创意广告服务等新商业形态为平台开拓商业价值增量的想象空间。
![]()
AI对互联网媒体的赋能-内容消费
单向传播转为双向交互,浅层浏览与深度探索相融合,消费者进化为产消者,形成创作-消费-再创作的产消循环
生成式AI技术对互联网媒体内容消费端的革新呈现多维渗透:首先打破信息触达壁垒,通过多语言翻译、文本语音互转等技术实现无障碍内容获取,把信息消费门槛降到最低;其次重构交互范式,以智能摘要、对话式咨询等AI原生服务深化用户理解,实现浅层浏览交叉深度探索的信息加工模式升级;同时革新体验维度,基于动态用户画像的精准推荐系统结合碎片化服务适配,形成千人千面的伴随式体验,并借助跨领域兴趣图谱推送潜在内容,持续拓展用户认知边界;通过AI辅助创作工具降低UGC门槛,构建用户参与的内容共创网络,使消费者向产消者转型,形成创作-消费-再创作的产消价值循环。
![]()
![]()
AI+互联网媒体产业图谱
![]()
中央媒体的AI探索-以人民日报为例
生成式AI技术提效视频内容创作,数字主持人亮相两会,创作大脑 AI+助力记者实现全媒体采编流程
根据2025年5月发布的《人民日报社社会责任报告(2024年度)》,人民日报客户端累计下载量突破2.9亿次,微博粉丝数超1.55亿,微信公众号用户订阅量达5737万,抖音账号关注数达1.74亿。在人工智能技术驱动下,人民日报运用生成式AI技术提升视频内容创作效率,推出《生成式AI技术创意混剪!第一视角感受开往春天的列车》等作品。此外,该报还推出“两会AI学习”专栏,采用多民族数字主持人播报新闻,并依托“创作大脑”AI+全息采录眼镜等设备,助力记者实现“一镜到底”的全媒体采编流程。
![]()
地方媒体的AI探索-以澎湃新闻为例
澎湃新闻拥抱AI技术浪潮,三大AI工作室优化内容生产,智能审核等五大核心功能构建风控新生态
作为全球中文互联网重要的全媒体内容供应商,澎湃新闻专注于时政、财经、文化、思想等领域,提供实时新闻资讯、深度报道和视频直播。通过系统性整合AI创作工具,形成派生万物AI办公、视觉与视频三大工作室,有效提升内容生产效率。同时,清穹内容风控智能平台全面嵌入生成式AI技术工作流,推出“智能审核”“智能校对”“智能巡检”“舆情监测”“增值服务”五大功能,依托先进的内容分析和审校能力,生成内容审核报告、巡检报告等,为内容安全提供了强有力的保障。
![]()
短视频媒体的AI应用探索-以抖音为例
以豆包大模型为核心技术底座,战略性地将AIGC技术深度嵌入到短视频媒体的每一个生命周期环节中
字节跳动正围绕其核心短视频媒体平台抖音,以豆包大模型为核心技术底座,将AIGC技术嵌入到短视频媒体平台“内容生产-处理剪辑-发布呈现-营销传播”的每个环节,形成一个由先进推荐算法驱动,集内容创作、社交互动与商业变现于一体的生态系统。2025年6月11日豆包大模型1.6版本正式发布,包括视频生成模型、语音播客模型、实时语音模型等多样化模型技术矩阵,均支持深度思考、多模态理解、256k长上下文、图形界面操作等能力,并在10月16日发布系列持续更新,支持抖音平台形成“视频创作工具-内容平台-商业化服务”的全链路产品矩阵。
![]()
大众社交媒体的AI应用探索-以微博为例
微博以自研多模态知微大模型为技术底座,构建AI+产品矩阵,实现内容生态全链路智能化升级
微博是当前中国互联网用户在线创作、发现和分享内容的重要社交媒体平台,每天都有数以亿计的网友基于微博进行内容浏览、分享和互动。知微大模型是微博面向社交媒体垂直领域自研的多模态大模型,该模型深度融合微博平台特有的博文、表情包、热搜数据及用户互动行为,并通过多模态理解、垂直领域优化与深度推理能力,支撑起评论罗伯特、智搜、博主AI助手等微博AI产品矩阵,形成覆盖内容生产-分发-消费全链路的AI服务体系。
![]()
基于知微大模型、DeepSeek-R1以及多模态RAG技术,推动微博向一站式智能搜索转型,帮助用户秒懂热点
智搜是微博于2024年下半年开始重点打造的AI搜索产品,定位为“总结式信息消费平台”,旨在通过大语言模型技术重构搜索体验。结合微博自研知微大模型、DeepSeek-R1以及多模态RAG技术,自动整理新闻事件的4W1H要素,在娱乐/财经/民生等多种专业领域延伸深度分析,帮助用户“秒懂热点”,降低信息筛选成本,推动微博搜索从传统关键词匹配向一站式智能搜索转型。截至2025年6月,智搜月活跃用户已突破5000万。
![]()
![]()
AI时代互联网媒体行业挑战-信息真实性
AI技术提升内容生产效率的同时,信息真实性风险加剧,需强化审核监管与用户引导双轨并行
AI技术为内容创作赋予了高效与便捷,但背后潜藏的风险同样不容忽视,如基于生成式AI技术炮制的虚假新闻、伪造影像等信息武器可直接冲击社会信任体系。与此同时,算法生成内容的可靠性存在显著差异,低质量输出易形成认知偏差,进而扭曲公众的价值判断与行为选择。当受众习惯性接受算法投喂的碎片化信息,缺乏批判性思考与深度解读时,不仅会导致群体性认知能力退化,更让监管体系面临技术迭代与风险防控的双重压力。面对技术双刃剑,行业形成多维度防御体系:互联网媒体平台通过自研大模型实现跨模态审核效率倍增,建立内容溯源追踪与可信度评级机制,对AI生成内容实施显式标识制度,从技术治理与规则约束双重路径守护信息真实性。
![]()
AI时代互联网媒体行业挑战-视觉效果
AI视频生成技术在物理逻辑一致性、角色身份连贯性等方面存在局限,构成当前商业化应用的核心瓶颈
文生视频技术以其颠覆性的潜力预示着视觉内容生产的革命,然而从惊艳的短暂演示到专业化实用之间仍存在显著鸿沟,其在物理逻辑一致性、角色身份连贯性及艺术细节精细化控制上的局限,构成了当前商业化应用的核心瓶颈。这种技术现状使得AI视频更多停留在创意辅助和短内容测试阶段,无法满足影视级作品的严苛标准,制约了生产力的实质性解放。为跨越此鸿沟,行业正采取务实的演进策略:技术研发端聚焦于提升模型的可控性与多模态交互能力,应用端则普遍采纳人机协同的混合工作流,将AI用于快速生成草稿或特定元素,由人类专家完成最终的艺术打磨与质量把控,以研发突破与应用场景创新的双轮驱动模式,稳步推动技术成熟。
![]()
AI时代互联网媒体行业挑战-技术成本
技术成本构筑了极高的准入门槛,自有垂直领域模型形成有效竞争壁垒
人工智能模型强大的背后是算力、数据和人才等要素的巨额投入,高昂的技术成本构筑了极高的准入门槛,使得AI竞赛日益呈现巨头游戏的态势,压缩中小企业的生存与创新空间。这种成本结构不仅阻碍了技术的普惠化进程,也让众多媒体平台在智能化转型中面临用不起、不敢用的困境,数字鸿沟有进一步扩大的风险。为应对此挑战,行业正探索多层次的成本优化路径:一方面,积极拥抱开源生态,利用高质量的开源模型和MaaS服务API来降低应用门槛;另一方面,有实力的媒体平台开始投资构建自有垂直领域模型,以确保数据安全并构筑差异化竞争壁垒,形成外部开源利用与内部能力构建的并行发展格局。
![]()
AI时代互联网媒体行业挑战-安全隐私
生成式AI需平衡创新与安全,通过动态数据管理、跨模态检测及法规协同加强隐私保护
以海量用户数据为燃料的个性化推荐与内容生成,是AI提升媒体服务体验的核心机制,但也因此引发了严峻的用户安全与隐私保护挑战。数据滥用、算法偏见、信息茧房以及个人隐私泄露等风险,正持续侵蚀着用户对平台的信任。当用户在享受便捷与让渡隐私之间艰难权衡时,平台则承受着遵守全球日趋严格的数据法规与维护用户信任的双重压力。为此,行业正积极构建以信任为核心的治理框架:在产品设计中贯彻隐私始于设计的原则,应用联邦学习等隐私增强技术;在运营上赋予用户透明的数据控制权与选择权,并设立AI伦理委员会进行监督,通过技术层面的隐私增强与治理层面的透明可控相结合的路径,寻求创新发展与用户权益的平衡。
![]()
欢迎关注艾瑞数智获取更多内容
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.