
本刊官方网站:
http://cjjc.ruc.edu.cn/
摘要
本研究通过实证路径探究大语言模型在全球范围内的接入情况,以此考察其基础设施化程度及其迈向通用人工智能的困境。从传播与媒介研究的连接观入手,借基础设施核心概念“网关”,研究使用计算机网络实验法,引入丢包率、时延与抖动等指标,考察大语言模型的全球接入状况(可达、速度与稳定)及其基础设施化与数字不平等的问题。基于全球62城网络节点对中外6款大语言模型所进行的近20万次网络发包,研究发现相较全球北方城市节点,全球南方城市节点在接入层面有较为普遍的劣势,在访问欧美产大模型时尤其明显。在可达性与速度层面,部分大模型已基本完成对搜索引擎、数据库等前代信息基础设施的超越,且全球南方城市节点接入大模型的速度已显著快于数据库;但在稳定性层面,大模型尚未展示出超越前代信息基础设施的显著优越性。尽管大语言模型的问世在隐喻意义上可被视作全球信息交往与人机互联的“初级阶段”,但亟需面对和解决连接中的地缘矛盾。在接入、使用、稳定、普及与价值等多层面发力,或是大语言模型激发其潜质、通往“全球网关”的可能路径。
作者简介
黄阳坤,清华大学新闻与传播学院博士研究生。
朱泓宇(通讯作者),清华大学新闻与传播学院博士研究生。
陈昌凤,清华大学新闻与传播学院教授、博士生导师。
基金项目
本研究系教育部人文社科青年基金项目“海外个性化新闻推荐算法对涉华信息传播规则的影响研究”(项目编号:22C10559023)、中央高校基本科研业务费专项资金资助“对外传播视角下海外平台算法的信息中介机制及对策研究”(项目编号:23JNQN45)阶段性成果。

拥有亿万用户的生成式人工智能应用ChatGPT于2023年底遭遇了一次持续近2小时的“重大崩溃”(major outrage),引发大规模用户不满(OpenAI,2023)。这类时有发生的中断事故将人们从通用人工智能的愿景中拉回,反思大语言模型(Large Language Model, LLM)是否已发展为具有现实影响力的信息基础设施。这反映出人们日益以基础设施的要求对待大模型,希望其可以如电网或公路那般稳定地服务生产生活。
从基础设施视角理解大模型的开发、使用及其社会功能具有重要启发意义。基础设施被界定为支持社会运转的物质、社会与经济系统,具备推动全球目标的潜力(UNOPS,n.d.)。国家发展改革委亦将人工智能列为新型信息基础设施的重要组成部分( 瞭望东方周刊,2020)。作为人工智能深度融入社会的标志性成果,ChatGPT因其智能化水平和用户规模,被视为具备类比搜索引擎的媒介基础设施属性,正朝着“人类交往语言后台”的方向演进(胡翼青,胡欣阅,2023)。
尽管传播学界早已有基础设施研究传统,但显著的“基础设施转向”普遍被认为始于21世纪的数字技术浪潮(陈昌凤,袁雨晴,2024)。学者日益关注媒介作为社会技术系统的物质性,强调信息的物理传输过程如何重塑媒体的生产、流通、接入、消费及其政策治理(Parks & Starosielski,2015:94)。基础设施的视角促使传播研究延展至对底层技术系统、制度安排与空间配置的剖析,进而成为理解新兴技术权力分配、数字不平等与全球传播秩序重构的重要维度(Plantin & Punathambekar,2019;Star & Ruhleder,1996)。
传播基础设施往往在嵌入日常生活与媒介实践后,方能真正展现其“基础性”作用(Bowker & Star,2000:59)。作为该领域的重要概念,“网关”(gateway)强调:当平台或媒介技术系统从研发阶段走向公共应用、融入多元社会场景时,其接入机制对人与异构系统之间稳定、顺畅连接的保障(Plantin et al.,2018)。对尚处社会化早期的大语言模型而言,从“网关”视角切入其基础设施化进程,契合理论逻辑,也符合现实情况。若从连接性与网关性出发评估其传播基础设施属性,需具体回应以下问题:在个体层面,如何可操作化地考察个人节点与不同大模型之间的连接(Van Dijck,2013:46);在整体层面,随着人机深度互联,大模型是否正演化为全球性基础设施?又会否将社会反困于失衡的连接格局中(Plantin & Punathambekar, 2019)?
基于一组计算机网络实验(computer network experiment),本研究比较了不同大语言模型在全球不同地区的接入状况,解析当前其全球化水平,分析生成式人工智能技术基础设施化过程中的接入等问题;再综合比对前代信息基础设施(如电子数据库、搜索引擎等)的连接情况,评估当下大语言模型基础设施化的程度。基于上述两重思路,本研究在连接意义上为传播基础设施研究补充多个可实证的操作化概念及一个可行的操作性框架,有助于更清晰、准确地描摹出智能数码物在可能的技术路线博弈中通往全球性基础设施的路径走向。
一
文献综述与问题提出
(一)接入:考察传播基础设施的一个基本视角
随着人类社会走向由 “互连节点”(interconnected nodes)构成的网络社会(Castells,2010:501),传播系统也随之演化为更为散布式的网络结构。在这样的结构中,连接与接入作为关键前提,受到传播研究的重点关注(彭兰,2013)。新闻传播学长期关注网络社会中人与人之间的连接(匡文波,姜泽玮,2024)。当具备人性化交流与互动能力的智能体嵌入在线传播网络,接入的研究也应延伸至人机关系,思考人如何接入大模型,与智能体的在线连接面临怎样的现况与制约?这种连接与互动又将如何重塑人和机器的关系?
接入程度与社会、经济、文化和政策等诸多因素相关,强调个体能否利用资源或服务并从中获益(Ribot & Peluso,2003)。传播学对接入问题最具代表性的探索发生在“数字鸿沟”领域。作为第一道数字鸿沟,“数字接入沟”(digital access divide)彰显了接入在数字技术使用中的基础地位(Hilbert,2016)。有观点认为,宽带普及使接入问题不再突出,应转向第二道(使用沟)和第三道(结果沟);但也有研究指出,宽带鸿沟只是接入沟的表征之一,硬件、软件等物质/材料层面的获取差距虽易被忽视,却依然广泛存在,值得研究者重新定位、投入关注(Van Deursen & Van Dijk,2019)。
从现实来看,大模型可为数亿用户提供数字资源与服务,其短暂的断连便可引发不满与不安,这恰说明广泛接入正赋予其基础设施的地位(Star & Ruhleder,1996)。从理论脉络看,“接入”与“可接入性”(accessibility)已深植于基础设施理论的构建过程中,被视为平台媒介与其他更广义上的信息基础设施的基本特征。平台的基础设施属性被认为体现于共享且广泛可接入的系统和服务(Plantin et al.,2018),正如电脑、电话等技术系统的可接入性、可靠性与效率也被认为决定了其作为信息和通信技术基础设施(ICTs infrastructure)的地位(Chen & Dahlman,2005)。围绕接入与可接入性的探讨,既是对传播学关注新兴技术使用问题的延续,也与基础设施研究的传统接轨。可接入性可作为判断大模型是否具备全球影响力、能否成为全球性数字基础设施的关键指标。能否接入、接入是否稳定等,是将大模型视作数字基础设施时必须首先回应的问题,但目前相关的理论与实证研究仍较有限。
(二)通向“网关”:大模型迈向基础设施的一条基本路径
在接入的理论语境中,“网关”是一个面向数字平台与基础设施的核心概念:其本身源于网络通信中的技术装置,即连接异构系统的协议转换器,承担信息流的中介功能。被引入社会技术研究后,网关的社会性被提至与其物理性、技术性同等重要的位置(Van der Vlist et al.,2022),指在异质系统向网络发展进程中,发挥衔接作用的社会技术装置(devices/apparatuses),或便于通达的标准化协议/规则(Plantin et al.,2018)。故可认为,“网关”至少指向两个层面:一是物质性和技术性的装置与基础设施,二是实现互联的组织逻辑与制度化程序。若要建成一座互联性的传播基础设施,构建高效的网关体系往往是必由之路(Plantin et al.,2018)。网关性能直接影响接入顺畅与否,关系到不同主体能否顺利使用技术并从中获益,因此,网关性也是判断一项技术基础设施化程度的关键属性。
由此,当下亟需思考的一个关键问题是:基于海量数据训练的大模型,依靠哪些技术装置增进网关性,进而推动其基础设施化?目前已向公众开放的大模型至少呈现出两种共性的网关设置路径。其一,开放应用程序接口(API)服务。API作为网关使用户可通过编程调用与自定义模型,保障其可编程性(Mackenzie,2019)。其二,开放网页服务(web service)。网页界面不要求用户具备编程能力,降低使用门槛,有助于实现更广泛的连接。以ChatGPT为例,除API外,还开放了多个聊天式网页界面,供普通用户在线与其互动。类似的双重网关机制在文心一言、通义千问、Claude等平台也有所体现。考虑到网页服务门槛更低、常为免费开放,而API通常需付费,且要求使用者具备一定代码读写能力,这种区别突出了网页的普惠性,因此网页服务作为考察大模型“基础设施”属性的入口更为适切。
既然建成“网关”是技术基础设施化的重要进路,便可据此设计可观测、可推广的实证研究路径。若要实证化论证大模型作为“网关”的合理性与合法性,将数据库、搜索引擎等“前代”信息基础设施作为参考系进行比对、分析是一条可行路径(陈昌凤,黄阳坤,2023)。大模型整合了数据库、搜索引擎中的资源,且可通过基于人类反馈的强化学习(RLHF)等机制不断优化其知识体系。这些优势似乎使大模型在能力层面已实现对前代基础设施的超越。但在做出基础设施化判断前,研究仍需验证在“网关”维度上,大模型是否同样也已优于数据库、搜索引擎等既有系统。若其连接尚不稳定或可达性有限,即便智能性再高,也难以确立其作为基础设施的地位。尽管“连接”与“接入”已被传播学提炼为核心观念(喻发胜,张振宇,黄海燕,2017),但现有研究多在操作上聚焦于人们如何借助媒介进行互(断)连(杜莉华,吴世文,2023),而有助于穿透人与传播基础设施/技术物之间连接机制的方法仍较稀缺。若从“网页服务”等网关设施入手,传播学可考虑借道网络与通信工程等外部学科,引入相应方法,拓展对人与传播基础设施之间连接关系的观察路径。
(三)通向全球化?接入大模型的愿景与现实
网关在异质性基础设施之间建立连接,保障其统一性、连续性与可访问性,进而可将全球的网络节点接入基础设施之网。但当全球南北差异被纳入视野,信息传递、网关连接等被置于全球权力结构进行考察时,基础设施“失衡”的运行逻辑便开始浮现(任孟山,李呈野,2023)。就正走向国际化、全球化的大语言模型而言,其在全球范围内发挥“异质基础设施构型/配置”(heterogeneous infrastructure configurations)的功用,正赋予它作为新一代“全球网关”(global gateway)的潜质;其如何协调、重塑全球人际/人机连接的问题已愈发重要(Lawhon et al.,2018)。
诸如大模型这类软性的、无形的基础设施何以被赋予“全球性”的可能?这涉及数字技术的多重特征,如可嵌入、可再编程等(Benbya et al.,2020)。这些特征也造就了其“液态装置”(fluid assemblage)的形态(Wiltse,2017:20),与传统物理基础设施如电网、公路形成区分。这类数字基础设施因其流动性、异构性与扩展性,被理想化为共享、无界且不断进化的“大型社会技术系统”(Hanseth & Lyytinen,2010;Tilson,Lyytinen & Sørensen,2010)。然而,当研究者在“全球网关”的理想中回望现实,会发现地缘要素仍与数智基础设施的发展紧紧缠绕,影响其全球性的实现。大模型等人工智能产品作为“网关”,可能推动跨国科技巨头转化为新型政治行为体,形成具有地缘政治影响力的数智单元,对传统国家权力构成挑战,进而影响全球数智领导权(姬德强,闫伯维,2023),其可能衍生的非均质发展与结构性不平等问题亟需传播理论予以回应。“全球网关”的实现还受到已有的地缘政治关系、不同行政区技术标准差异等因素制约(恩斯特,高山,黄家圣,2023),当下国家间的竞合也正转向数智技术产业上的博弈(雷少华,2019)。可见,跨国平台企业、民族国家、地区标准,都在全球意义上深度介入、塑造生成式人工智能时代的基础设施秩序。
因此,论及ChatGPT等大语言模型的“全球网关”属性时,研究需并重全球化愿景与区域国别现实,警惕其在全球传播过程中所隐含的结构性偏向(王维佳,张涵抒,2022),回应关于传播基础设施的概念与取向之辩(史安斌,朱泓宇,2022),考虑如何进一步揭示大模型的技术政治性与传播公正性,同时基于数字基础设施、数据中心的技术实践展开考察,使传播基础设施的问题域逐步清晰、不断“可见”(束开荣,2021)。
同样地,接入与可接入性仍可作为分析大模型全球愿景和区域国别现实之间落差的概念抓手。经典的、围绕互联网接入的研究一般通过问卷来收集主观汇报的定量数据,包括但不限于互联网的普及率、用户访问频率及访问内容等,以揭示区域间的不平等(Dobransky & Hargittai,2006;Van Deursen & Van Dijk,2015)。但这种由用户入手的方式一定程度上遮蔽了物质(即设备与技术)的视角,由物质决定的谁能接入、谁被排除无法在用户调查的思路下得到充分考察。如前所述,网络与通信工程领域的测量理念与工具可在这一层面上提供良好补充,且可以充分适配全球化的研究视野。
在网络与通信工程领域,丢包率(package loss rate,PLR)是评估可接入性的基本指标。当自身网络正常但丢包率持续偏高,常意味着目标主机响应异常或不可达。其作为信息基础设施可达性的判断标准,可帮助推演接入中的结构性不平等问题。当接入顺利发生,接入的时效与稳定性自然成为接下来要关注的问题,时延(latency)与抖动(jitter)即两项关键测量指标。时延指数据包往返所耗时间,越小代表连接越快;抖动衡量的是时延的波动,越小则越稳定。实证研究表明,不同地区的接入速度与稳定性差异,是产生数字鸿沟的重要诱因(Riddlesden & Singleton,2014)。丢包率、时延和抖动等指标常用于测量ICT系统的“连通性”(袁连海,陆利刚,2018:3),这本身即与传播基础设施研究中的“连接性”概念高度契合;三项指标分别对应可达性、接入速度与稳定性,构成评估大模型接入能力的递进式、层次化分析框架。重要的是,它们在ICT和网络工程领域已成为国际性的标准实践(唐海娜,李俊,2004;Matthews & Cottrell,2002),为本研究提供了国际通用的跨学科操作范式。
综上,大语言模型作为全球数智传播基础设施的潜力已初现端倪。传播研究应积极回应“连接”逻辑的演进,识别其可能带来的结构性问题与区域差异。通过引入丢包率、时延与抖动等指标,研究者可以操作化测量人机之间的接入问题,从而系统考察大模型作为“网关”的基础设施属性。在此基础上,全球视角的引入将揭示一个关键矛盾:大模型旨在实现的广泛连接,在现实中是否存在地域受限与不平等。这种“落差”构成本研究欲回应的核心议题:
问题一:全球不同地区在接入大语言模型上表现出何种水平的连接、断连情况?
问题二:若连接成立,全球不同地区在接入大语言模型上的用时长短、用时波动上表现出何种程度的地区差异?
问题三:以电子数据库、搜索引擎等前代信息基础设施为基准,大模型作为“网关”的属性与潜力如何?
二
研究设计
(一)研究对象
从时下“百模大战”等媒体话语中可见,中外大模型发展迅猛,正由基础大模型向领域大模型延伸,能力也从文本拓展至视听等多模态。然而,行业细分型(如BloombergGPT)或突出非文本模态能力(如Stable Diffusion、Midjourney)的大模型,尚难满足普罗大众多层次、宽领域的知识需求,难称之为公众意义上的信息基础设施,故本研究暂不考虑这两类大模型。基于Huang et al.(2023)、Guo et al.(2023)及OpenCompass、C-Eval等测评项目,研究者初步筛选出10余款具公共化、产品化特征的大模型,重点考察普通用户是否可无需编程或高性能设备便能访问与使用,以此判断其是否符合“开放性”(openness)这一基础设施特质(Hanseth & Monteiro,1998)。故类似LLaMA、Alpaca等虽开源免费,但因缺乏用户友好的访问界面、部署门槛高,不予纳入研究范畴。
经过对初筛的10余款大模型进行试用,本研究进一步排除了需邀请码或处理注册申请缓慢的大模型(因为这同样有悖于“开放性”理念),最终确定ChatGPT、Bard、Claude、文心一言、通义千问、百川大模型六款作为正式研究对象。这些模型已具显著用户基础与社会化水平。国外三款模型月均访问量均达千万级,其中ChatGPT已超十亿级(Sarkar,2023);国内文心一言与通义千问API日调用量超亿次(证券时报网,2024;新浪科技,2024);百川系列虽未公布访问量,开源下载量已突破700万(百川大模型,2024)。这些数据反映所选模型具备基础设施研究所需的广泛使用基础与现实意义。
(二)研究方法与研究工具
研究采用网络通信领域常用的基于Ping命令的计算机网络实验法,检验大语言模型在全球范围内的可达性、连接速度与稳定性。该方法广泛用于计算机领域网络连通性检验与网络诊断的工作(袁连海,陆利刚,2018:3),从用户设备向目标主机发送指定数量数据包(package),通过回传情况进行判断。其中,数据包是否成功往返,反映目标主机可达性;往返时长反映连接速度;多次发送的时长变化反映连接稳定性。
通过预测试与随机抽样相结合的方式,研究进一步选定拨测节点。首先,对全球250个主要城市节点进行可用性和稳定性的预测试。这些城市基本均系各国首都、第一大城市或区域重点城市,通常有较完善的网络基础设施,其拨测情况基本可反映当地最优的网络状况。预测试过程中,研究在每节点对联合国官网(https://www.un.org/)实施每小时1轮、每轮20个包、连续24小时的拨测,剔除4个丢包率超过3%的节点,最终保留246个节点用于正式抽样。
为避免资源浪费并对目标服务器造成过大负担,研究从246个节点中随机抽取约25%节点(62个城市)用于正式实验,详见表1。随后,研究者调动62城的探测节点,以6小时为间隔(一天4轮) ,每轮向6个大模型的网页服务主机发送20个20字节的数据包,连续拨测一周,共发送194540个有效数据包。此设置既保障数据量充足、数据有效性与实验可控性,亦可避免因过大负载造成网络拥塞、系统瘫痪等潜在风险。
![]()
![]()
(三)数据声明
网络实验中,难以把控的网络环境问题造成部分城市网络节点Ping拨测失败,导致了一定程度的数据缺失。具体而言,219次拨测的发包出现请求超时,15次拨测的发包找不到主机,二者约占总拨测次数的2.24%,由此导致的数据缺失未被考虑在相关的统计检验中。
三
研究发现
(一)接入:连接之可达、高速、稳定
1.基于丢包率的可达性评价
将丢包率作为可达性指标进行评价时,本研究采纳了此前研究设定的四个阈值,即:0%≤PLR≤3%(优秀)、3%<PLR≤15%(良好)、15%<PLR≤25%(中等)、PLR>25%(较差)(Budiman & Wicaksono,2016)。数据显示,六款大模型的平均丢包率约为4.68%;就单个模型而言,丢包率从低到高依次为文心一言(0.57%)、Claude(0.62%)、ChatGPT(5.66%)、通义千问(5.89%)、百川大模型(7.34%)、Bard(7.99%);综合具体城市的情形而言,文心一言和Claude未在任何一个城市出现过丢包率超25%的情况,展现出面向全球的可达状态;其余四个大模型则均在部分城市节点上暴露出可达性较差的问题,出现过较频繁的丢包现象。具体而言:
(1)ChatGPT和Bard出现了局地不可达的情况。这种区别对待主要指向中国大陆城市节点。ChatGPT对深圳、上海、北京、重庆等4个城市节点的访问请求,Bard对重庆、兰州、北京、深 圳、上海等5个城市节点的访问请求长期处于不响应的状态。这与不同国家的网络与数据政策、国家安全条例,以及大模型的商业政策等有关。
(2)百川、通义千问相对其他大模型,连接状况整体较差。仅三成左右城市的丢包率在3%及以下,绝大多数城市仅达“良好”水准。其中,雅典、台北等城市节点对通义千问的访问,以及莫斯科、雅典等城市节点对百川大模型的访问出现了比较严重的丢包情况。百川、通义千问等大模型起步相对晚,它们的接入表现欠佳或与此有关。
概而言之,六个大模型中,四个存在不同程度的不可达,其中一些对部分国家和地区还出现了全盘的访问拒绝现象。在可达性尚难以全面实现的背景下,将大模型视为“全球性基础设施”仍是一种理想化的愿景。
2.基于网络时延的连接速度与稳定性评价
将时延大小作为连接速度指标进行评价时,本研究根据过去研究确定了如下标准(单位:毫秒):0≤latency≤150(优秀)、150<latency≤400(中等)、latency>400(差);同时,将抖动(Range,最大时延与最小时间的差值)作为连接稳定性指标之一进行评价时,本研究参照此前研究,将抖动水平划分为:0≤Rjitter≤20(优秀)、20<Rjitter≤50(中等)、Rjitter>50(差)(Budiman & Wicaksono,2016)。此外,本研究另补充了时延的变异系数(数据标准差与均值之比)作为网络抖动的指标,规定:如抖动值不超过50且变异系数小于1,则可认为抖动较轻。
![]()
图1展示了六款大语言模型全球连接的时延和抖动情况。时延越大,图中气泡面积越大;抖动越大,图中气泡颜色越深。结合数据来看,ChatGPT、Bard、Claude等三款大模型的相关数据较为可观,平均时延达到优秀水平,从低到高依次为ChatGPT、Bard、Claude。就具体城市而言,时延方面,绝大多数城市接入ChatGPT、Bard、Claude的平均时延达优秀水平,没有城市的接入时延在400毫秒以上;抖动方面,ChatGPT、Bard展现出了最大范围的连接稳定性,37城的节点对这两款大模型的网络抖动处于较轻微的水平。
至于三款国产大模型,文心一言、通义千问、百川大模型的全球平均接入时延处于中等水平,从低到高依次为文心一言、通义千问、百川大模型。就具体城市而言,时延方面,大多数城市接入文心一言、通义千问、百川大模型的平均时延处于中等水平。抖动方面,国内三款大模型整体上相较国外大模型有一定差距,除文心一言外,通义千问、百川大模型明显仅能在小范围内实现稳定连接,分别仅有10城、13城节点表现出程度较轻的访问抖动。
除接入速度的快慢、波动之外,本研究试图确定各大模型在接入速度上是否存在全球南北差异,以回应研究问题二。首先,研究根据南南合作金融中心提供的南方国家、地区名单(Finance Center for South-South Cooperation,2015),确定研究所涉的62个城市中有32个城市位于全球南方国家,包括内罗毕(肯尼亚首都)、巴西利亚(巴西首都)、达卡(孟加拉国首都)、德黑兰(伊朗首都)、马尼拉(菲律宾首都)等。其次,本研究特别考虑了另一个影响接入速度的重要网络基础设施,即宽带的速率,将其分类为:慢速宽带(2M以下)、普通宽带(2~20M)、高速宽带(20M以上),并纳入后续统计分析中。
双因素方差分析的结果表明,城市类型、宽带速率以及二者的交互项对所有大模型接入速度的效应基本均至少在0.001水平上显著,意味着六个大模型的接入速度在全球南方城市与北方城市之间、不同速率的宽带条件之下均存在显著差异。根据表2,控制宽带速率后进行的统计分析表明,不论在何种水平的宽带速率下,全球南方城市节点在接入除文心一言之外的大模型时,基本都花费了显著更长的时间。
![]()
就三款国外大模型而言,一般仅在宽带水平达到高速(20M以上),全球南方与北方城市连接大模型的用时差异才会相对变小,表现为城市属性对时延的影响至少回落至中等效应水平。这一结果表明,全球南方城市如不加紧宽带基础设施建设,提升网速水平,在接入ChatGPT等欧美产大模型上的不便局面可能愈演愈烈(当然,提升网络基础设施建设水平同样无法保证可快速接入大模型,高速宽带条件下南北时延差异仍然很大),全球北方城市在接入速度上则将保持并扩大自身优势。
就三款国内大模型而言,首先,文心一言逆转了全球南方城市节点的劣势局面,即在非高速宽带水平下,南方城市接入文心一言的时延要显著短于北方城市。即便在高速宽带水平下,二者之间的差异虽显著但效应量甚微;其次,通义千问和百川大模型虽未特别赋予南方城市节点更高的连接效率,但相对较好地控制住了南方城市与北方城市在连接用时上的差异,表现在城市属性对时延的效应量多属小效应,偏Eta方基本处在低于0.06的水平。
就大模型接入用时来看,欧美产的大模型有可能会扩大既有的数字接入不平等:统计表明,同等宽带水平下,全球南方国家接入大模型(尤其接入欧美产大模型时)的时延、抖动往往更大,南方国家用户不比北方国家用户那样快速且稳定地接入大模型。大模型接入上存在的南北差异背后是技术社会既有现实的多重映射,包括网络基础设施建设(如南北国家的宽带建设水平)、智能技术开发与应用(如南北科技团体对大模型的开发/商业化程度)、准入门槛与技术规制等层面的不对齐。不应忽视:如各类欧美产的大语言模型正式确立其全球性地位,其作为网关所拥有的衔接性特质,会令地区间(或言地缘集团、政治集团间)的数字不平等在智能语境下被重新演绎、放大;在大模型时代,本身在科技领域已处优势地位的个体和集团会因连接更便捷而获得更显著的优势,而劣势一方则受困于智能技术的马太效应。
(二)超越:新旧信息基础设施对比
本研究同时在实验期内选定了中外的两个代表性搜索引擎(谷歌和百度)以及两个代表性数据库(Scopus和CNKI)进行模拟拨测,将其丢包率、时延、抖动等视为可达性、连接速度、稳定性的基线,与大模型进行比较。
1.丢包率比较
在可达性(丢包率)上,结果显示,搜索引擎方面,谷歌和百度的总丢包率分别为8.08%、1.05%。依城市来看,谷歌的可达性达优秀、良好、中等、较差水平的城市节点分别有56、1、0、5个,百度的可达性达优秀、良好、中等、较差水平的城市节点分别有56、6、0、0个;数据库方面,Scopus和CNKI的总丢包率分别为0.63%、3.84%。依城市来看,Scopus的可达性达优秀、良好、中等、较差水平的城市节点分别有57、5、0、0个,CNKI的可达性达优秀、良好、中等、较差水平的城市节点分别有44、16、1、1个。可见,文心一言、Claude、ChatGPT、Bard的可达性已优于或至少与搜索引擎和数据库持平,通义千问、百川大模型的可达性则与前代信息基础设施之间差距尚存。
2.连接速度、稳定性比较
在连接速度(时延)上,搜索引擎方面,62城节点访问谷歌和百度的平均时延分别为23.87ms、185.84ms。依城市来看,访问谷歌的时延水平达优秀、中等、较差水平的城市节点分别有56、1、5个,访问百度的时延水平达优秀、中等、较差水平的城市节点分别有23、38、1个;数据库方面,62城节点访问Scopus和CNKI的平均时延分别为25.89ms、242.56ms。依城市来看,访问Scopus的时延水平达优秀、中等、较差水平的城市节点分别有58、4、0个,访问CNKI的时延水平达优秀、中等、较差水平的城市节点分别有11、44、7个。
在连接稳定性(抖动)上,搜索引擎方面,62城节点访问谷歌和百度的抖动分别为771ms、1080ms。依城市来看,访问谷歌的抖动值不超过50且变异系数小于1的城市共计有40个,访问百度的抖动值不超过50且变异系数小于1的城市共计有6个。数据库方面,62城节点访问Scopus和CNKI的抖动分别为409ms、958ms。依城市来看,访问Scopus的抖动值不超过50且变异系数小于1的城市共计有37个,访问CNKI的抖动值不超过50且变异系数小于1的城市共计有12个。
综合前文分析可知,就连接速度而言,部分大模型,尤其是ChatGPT,已经表现出了超越前代信息基础设施的潜力,可实现更快速的访问;三款国产大模型在访问速度上稍显逊色,仍落后于百度、略超过CNKI,优势不明显。就连接稳定性而言,所有大模型均未能在这一层面超过谷歌与Scopus,前代信息基础设施仍保持着一定优势。
另外,研究还分别检验了全球南方城市与北方城市连接不同类型的信息基础设施(数据库、搜索引擎、大模型)上的速度差异,宽带速率作为一个控制变量纳入其中。方差分析的结果表明,在北方城市内部,宽带速率、基础设施类型以及二者的交互项对接入速度的效应均至少在0.001水平上显著;在南方城市内部,宽带速率对接入速度的主效应处于边缘显著,基础设施类型及它与宽带速度的交互项对接入速度至少在0.001水平上显著。
控制宽带速率之后的比较分析提供了更详细的解释:在全球北方城市,不论宽带速率处于何种水平,大模型较搜索引擎、数据库在接入速度上没有明显优势。宽带速率在高速水平时(即20M以上),大模型的速度甚至处于显著劣势;但在南方城市,不论宽带速率处于何种水平,大模型的接入速度虽仍显著慢于搜索引擎,但均已显著快于数据库。这些结果意味着,就接入便利性来说,大模型在全球南方城市作为一种信息基础设施的前景日趋明朗,它已展示出超越数据库的接入便利;而在全球北方国家,大模型在接入便利性上还难以撼动前代基础设施,这种接入上的相对不便或让北方国家城市节点在基础设施使用上保持一定惯性,基础设施的更新换代在南方国家或因此相对更快,表现出潜在的后发展优势。
四
结论与讨论
研究发现,除文心一言和Claude外,其余四个大模型均在部分节点上暴露出可达性较差的问题。三款欧美产大模型平均访问时延更小、抖动更轻微。不论宽带速率居何种水平,全球南方城市节点在连接大模型(除文心一言外)上有较为普遍且显著的劣势,这种劣势在连接欧美产品时更明显。与前代信息基础设施相比,超过一半的大模型在可达性上已优于或至少与搜索引擎和数据库持平;ChatGPT等大模型在平均连接时延上已开始优于前代信息基础设施,且在南方国家城市节点,大模型的接入速度已显著快于数据库,接入沟表现出可能的缩小态势。谷歌与Scopus仍维持住了稳定性优势,所有大模型均未能在这一层面超过这两款信息基础设施。当前大模型在可达性层面仍存在短板,与“全球网关”的愿景之间仍有差距。但部分模型(如ChatGPT)在连接速度等指标上已优于传统搜索引擎和数据库,显示出其作为“全球网关”的潜在能力。大模型的基础设施化路径延续了前生成式人工智能时代的全球不平等格局(Robinson et al.,2020),但以文心一言等国产大模型为例,也展现出在一定条件下缩小乃至逆转南北连接差异的可能。据此,本研究从隐喻、实践与规划三方面,对大模型通向“全球网关”的路径展开讨论。
(一)隐喻:天地交万物通的“初级阶段”
天地交而万物通。深度媒介化背景下,传播实践正迈向更强调物质情境、超越媒介中心主义,且聚焦人机交流的场域(卞冬磊,2021)。从连接和“交通”的视角审视大语言模型的“全球网关”进程,有助于揭示其作为新型媒介物在全球传播“初级阶段”由想象走向现实中的隐喻功能。本研究在此框架下,检验不同大模型在时间快慢、空间广延、稳定程度及其对前代媒介“超越”方面的表现。
这种超越可能由更底层的技术架构提供支持。研究者补充了一组基于nslookup请求的IP地址反查,尝试揭开与大模型相适应的底层网络基础设施。结果显示,不同DNS服务器对文心一言、Bard、ChatGPT进行反查时得到的IP地址出现明显的弹性变动,这可能因其与负载均衡技术相结合,根据用户地理位置等要素对全球流量进行高效配置。域名解析还显示,多个大模型使用了CDN服务,其中文心一言、通义千问的域名解析分别经过了其母平台(百度与阿里)的CDN服务,ChatGPT、百川大模型的域名解析则经过了第三方的CDN服务商,分别是Cloudflare与阿里云。CDN服务通过分布式部署的思路优化网络传输,理论上提升了大模型的全球可接入性。凭借日益丰富的知识储备和快速提升的智能水平,大语言模型在接入的意义上正在改写信息基础设施领域的现存局面,基于大语言模型的“天地交万物通”图景亦在形成,这可能给全球数智传播领域带来深远变革。
(二)实践:全球网关“连接”中的地缘性
大模型再次印证了显著的南北接入差异。此前研究已揭示,个体的网络访问深深植根于各种制度性的因素之中,助益部分人的同时也可能对其他人的使用形成牵制(Racherla & Mandviwalla,2013)。以数字基础和智能技术为突出特征的“智缘政治”逻辑时下正得到强化(夏立平,田博,2020):新兴技术在其社会化、全球化的进程中改写传统的时空距离与物理实在边界,反过来技术也不断被政治与资本较量所挟持(姬德强,闫伯维,2023)。作为一种软件、硬件的“混合技术形态”,大模型引发的地缘博弈在内在逻辑、外化理路上可能出现了一些新的分化(涂良川,乔良,2023)。
内在逻辑上,技术地缘政治常被归为一个“发展”问题,接入的南北差异似乎可被当地宽带等既有基础设施的建设水平差异所“合理化”。然而,当前研究结果表明,就三款国外大模型而言,即便全球南方与北方城市节点所处的网络环境较好、宽带水平均达到高速,但用时的南北差异依然显著。这意味着宽带水平的差异等发展性的问题并不能完全解释大模型接入上的南北鸿沟,因为提升宽带水平很可能也消弭不了大模型接入层面的南北差异,此前基于非洲网络连接、传输的研究就发现,尽管当地宽带基础设施近年来不断完善,但由于在非占主导地位的欧美CDN服务提供商未共享其缓存容量,使用的DNS配置不佳,非洲仍存在跨域网络延迟严重、优化传输受困的问题(Fanou et al.,2016)。因此,大模型背后的数智地缘政治不应被简单归结为既有发展水平的差距,其结构性不平等与权力关系常常被隐蔽,需多加观照。
外化理路上,随着博弈在更隐蔽的层次上得到深化,人工智能等愈发成为其中的关键变量,其地缘性以一种更“高明”的方式展开叙事(Payne,2024)。在前人工智能时代,主张结构现实主义的国际政治学者所推崇的权力论往往通过国际体系与秩序层次的建规立制(Waltz,2000),让争端外显、来到“台面”之上。在“智缘政治”中,冲突常被去显性化处理。且身处同一互联网上的个体,由于彼此分散为原子化的节点或社群,难以感知他人连接状况与体验,也因此往往难以察觉结构性不公的存在。本研究所揭示的图景,正是试图使这些隐藏于“台面”之下的权力逻辑与不公现实浮出水面。
然而,以文心一言为代表的中国大模型正呈现出不同于“技术军备竞赛”范式的新思路,其不仅未在接入速度上加剧南北差异,甚至在部分情境中实现了逆转,在“地缘友好”而非“地缘对抗”的逻辑中缓解了连接不平等。这一现象与中国通信基础设施在南方国家的空间溢出效应密切相关,互联互通正在促进全球南方间的共赢协作(曹冲,2021),国产大模型对南方城市节点更高的可达性印证了这一现实。此外,大模型的可达性还受到多重复杂因素影响,包括地理距离、自然环境(如天气)、网络设备与协议配置、互联网服务提供商(如CDN)、国家政策(如防火墙)等,这些因素尚未在本研究中得到系统考察,未来研究可进一步拓展并纳入多维视角。
(三)规划:大语言模型何以“网关”全球
随着大语言模型的大规模普及,其有望成为连接和融合全球智慧、促进共同发展的桥梁,实现从技术研发到传播结构层面的接入弥合。“网关”全球,关键还在于建成数字基础设施之后,如何将全球范围内的知识流通、共建、共享嵌于其中。如此才能真正激发出大语言模型作为全球传播网关的本质价值,成为全球公共产品与全球公共知识的产制节点与中枢神经。
基础设施越被视为“理所当然”的存在,就越需要对其潜在的负面效应和风险等进行预估和应对。其实践会创造出某些不平等的秩序和不确定的未来,人类认知的有限性、工具效能的不稳定性及发展建设过程中的矛盾性都可能构成基础设施工具理性的缺陷。在路径规划上,需在“造物”和“用物”过程中,从理念和治理技艺等方面共同推动基础设施价值理性的回归(王浩宇,王永杰,2023)。研究者可从更为辩证、多层次的思路切入,面向大语言模型的“全球网关”属性设计更具整全性的分析结构。接入性上,考察大语言模型的接入与排斥问题;使用性上,对特定区域国别和社群的大语言模型使用状况进行剖析,在跨文化和“比较学”的意义上判断其处于何种领先或滞后位置;稳定性上,可沿用丢包率、抖动等指标测试其稳定或断续情况;普及性上,可以全球或地方为研判尺度展开考察,同时评估一款大模型在非母国、非原产地的流行程度等;价值上,可充分探讨某款大语言模型的公共或垄断属性,其生成内容承载的功能和价值观等。只有在这几项维度达到一定的质变水平,我们方可认为大语言模型的全球网关设想真正落地,成为全球传播中一道重要的枢纽。
本研究存在一些局限。首先,自然、技术、国家等因素均可能对连接形成干扰,尚未得到足够观照。其次,本研究主要关注连接问题,是出于研究者认同连接是传播的一个先决条件。连接之后,人与大模型、大模型与其他传播基础设施之间产生的联系同样值得关注。再者,除本研究所用的Ping拨测外,网络与通信工程学科还提供了多种方法探察“网关”介导的“连接”问题,未来研究可考虑在方法层面与其他学科进一步互通,更全面地将“连接”“网关”等问题具体化。
参考文献从略,原文刊载于《国际新闻界》2025年第6期。
本期执编/张紫玉
订阅信息
全国各地邮局均可订阅《国际新闻界》,国内邮发代号:82-849,欢迎您订阅!
您也可通过下方二维码或网址https://mall.11185.cn/h5/#/bkGoodsDetails?spuId=113613&from=imgShare&dsId=zxSWChat&dsModule=c3df4964-af5d-40a8-d6cc-a768b5306e52 ,进入中国邮政微商城订阅本刊。
您还可访问《国际新闻界》官方网站 http://cjjc.ruc.edu.cn/ ,免费获取往期pdf版本。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.