来源:滚动播报
(来源:上观新闻)
面对大模型为代表的生成式人工智能之兴起,学界研究侧重于社交线索测量和治理规范阐释,尚未探索模型如何在数据、算法、算力等要素的装配下被持续建构的后端过程。本文承继人类学、STS、平台研究等领域的线索追踪传统,引入代码民族志方法,试图拆解模型装配的“黑箱”。文章搭建了一套以“模型社会化生命周期”为主轴的实践指南:研究者以Github仓库为起点,追溯训练数据集的“非自然史”,剖析模型训练的协作文化与算力政治,探究基准评测的声誉流通机制,洞察模型向外延伸的语境重构,从知识资源、组织和物质、评价标准、治理机制四个维度解析装配的政治。代码民族志不仅启发人们从可解释而非透明性的原则上重新审视打开“黑箱”的迷思,亦为智能传播研究提供了新的经验证据,它将有助于重估AI冲击下人文社科的价值。
生成式人工智能(GAI)正以史无前例的速度嵌入当代社会,其代表性应用ChatGPT在2个月内斩获1亿用户的早期采纳速率达到TikTok的4.5倍,互联网的43倍,个人电脑(PC)的91倍。与流行观点将这项技术视为神奇的超级智能代理(agents)不同,2025年《科学》(Science)杂志上的文章指出,应将大模型视为一种新型的文化和社会技术,它就像文字、印刷术、市场、官僚系统一般,是重组并协调人类文化的历史性信息处理系统(Farrell et al.,2025)。这意味着我们无法脱离社会因素去谈论新兴技术。正如凯特·克劳福德(Kate Crawford)(2021:8)所言,AI的运行仰赖于全球不同维度上物质与非物质资源的“装配”,包括能源矿产、基础设施、人类劳力、历史文化、分类体系等。在此基础上解释人工智能的社会影响、构想治理方案,变得日益重要。
新闻传播学素来以叩问“技术变革何以催生新型关系”为学科特点,如若对前沿技术置若罔闻,则会错失重要的学术创造性和服务于实践的机会(陈昌凤,2025)。针对生成式AI的兴起,新传学者一方面汲汲于发掘人机传播中的新经验、新特征,另一方面不断思考新问题的治理方案,贡献了宝贵的知识成果。不过,当前研究在扎堆探讨大模型“可见”的前端效应,而忽视了智能制造“不可见”的后端。于是,作为“生成型媒介”(孙少晶,2025)的大模型,其自身如何“生成”却几乎无人问津。这种知识生产的悖论既会深化技术“黑箱”的不可知论,成为管理方推卸责任的理由;又会加剧社会的“单向镜”效应——在科技企业对普通民众一举一动了如指掌的同时,我们却对这些信息如何被利用、如何影响个体或集体的重要决策一无所知(Pasquale,2015:196,9)。
本文将大模型的“生成”解释为一种非自然的装配政治,并以构建“可理解社会”(intelligible society)为目标探索打开“黑箱”的方式。我们认为,可引入代码民族志这一新方法回应上述知识生产的悖论。为此,文章会首先综述当前的生成式AI研究,揭示其中存在的技术实体化倾向与后端盲点;其次与人类学、STS、平台研究等领域的经典文献对话,通过方法渊源的梳理和比较提炼代码民族志的核心关切;再次围绕模型社会化的生命周期,以代码仓库GitHub为起点,构建一套代码民族志的实操指南;最后归纳这种新方法引入后可预期的知识贡献,同时反思其适用边界和局限性。
一、问题意识:生成式AI研究中的
实体化倾向与后端盲点
在新闻传播领域,近年来涌现的人机传播、AI治理方面的成果最能代表学者对生成式人工智能崛起的回应,它们也分别反映了智能传播在经验研究和规范研究上的特点。
生成式AI最醒目的特点莫过于交流中随记忆、时刻和语境灵活应变的“类人性”,这与过去仅限于少量、固定指令的交互助手存在云泥之别,传播渠道一跃成为交流的主体,这冲击了70多年来围绕人类传播而形成的理论范式,于是人与机器互动中所产生的意义,以及其对个人和社会的影响成为新的问题焦点(Guzman & Lewis,2019)。众多学者的研究从人机传播(Human-Machine Communication,HMC)出发,探讨生成式AI如何通过拟人化的言语、行为、界面、输出异常等功能表现,引发人类用户在效能感、性别认知、信任、情感调适等方面的反应。学者们测量的多是人机交流中的社会线索(social cues),所获取的材料多来自用户的感知、反馈与讨论。在此,生成式AI是自足、已完成的“刺激物”,并未展现其在“社会-技术”关系中被不断建构、转译和再生产的过程,这便是技术的实体化(reification)倾向。并且,这些在大模型运作前端测试出来的结果容易陷入经验碎片化的困境,让我们难以把握生成式AI的结构性特征。
生成式AI依赖机器学习和训练数据,不再受预先编写的规则约束,因此其自主创造、响应内容的能力可能导致幻觉、越狱、数据侵权、敏感信息暴露、不透明性、不受控制等一系列独特的风险(Taeihagh,2025)。进展缓慢的监管立法难以跟上智能技术的迭代,因此治理问题迫在眉睫,亦成为新闻传播学者探讨的重点。基于宏观的规制设计,学者们试图探索公平、正义、多元等规范理念如何事前嵌入生成式AI的监管链条,他们对治理方案的构想主要源自政策、规制与法案等二手材料。然而,由于生成式AI人机互动产生的不确定性和不可解释性,风险已从“外部”延伸至“内部”,即嵌入模型机理与运行过程本身,因此备案、评估等事前嵌入的做法很容易刻舟求剑(张凌寒,于琳,2023)。若想实现动态适应、快速响应的敏捷治理(agile governance),第一手的实证材料不可或缺,这恰是规范性分析所不擅长的。在AI治理研究中,生成式AI同样被塑造为一个既存的技术实体,并且其面庞更趋于模糊和笼统。
对新闻传播领域生成式AI研究的梳理,让人不禁回想起20世纪大众传播兴起之际,人们同样热衷于测量受众反馈来“摸清”新媒介的逻辑,期间的舆论操控、政治极化、道德恐慌、青少年犯罪等社会问题亦让规范理论(如社会责任论)登上历史舞台。而正是1960~1970年代塔克曼、甘斯、费什曼等一众学者将目光投向新闻编辑部的日常,运用民族志方法解析信息生产的社会建构过程,才逐渐打开了大众传播的“黑箱”。据此,本文主张引入代码民族志来回应生成式AI研究中的盲点,可以视为一种历史的回响。
二、方法渊源:时空变换下民族志的
线索追踪传统
代码民族志并非全新的方法,其渊源扎根于民族志的“线索追踪”传统。本文重访历史时空中的重要文献来勾沉这一知识脉络,将线索追踪对象从实在物、铭文、界面、算法拓展至代码,在多重比较中印证代码民族志的合理性,并介绍其问题意识与核心关切。
(一)从《金枝》到《实验室生活》:追踪万物的线索
现代民族志将长期驻扎于固定时空情境的定点研究奉为圭臬,容易忽视20世纪之前 “摇椅上的人类学家”对广袤、跨文化比较的二手材料的汇编拼接(陈学金,2023:6)。《金枝》、《原始文化》等博物志风格的作品通过命名定格、功能标注、地理定位、历时比对、引文链校准等方式奠定了追踪“物之线索”的早期传统。
随着20世纪全球贸易网络的展开,阿帕杜莱(Appadurai,1986:5)将静态的线索搜集转化为对“运动中的物”(things-in-motion)的考察,在生产、交换、消费的流转轨迹中探究实在物的意义铭刻过程。这种循着人、物轨迹所生发的现象,去追求一种在点之上的线和面的理解方法被称为“线索民族志”,线索既是可见的事实,也可以是想象形成的感受性联结。这意味着研究者不能仅是静态观察人类行动,还要关注行为所留存下来、以特征性物质形态呈现的痕迹,据此把握线索形态的时空差异(赵旭东,2015),并从可观察、可理解、可追溯、可关联、可容廓和可改变的角度讲述理论故事(赵旭东,2017)。
二战后殖民体系的瓦解让人类学家的田野从遥远异邦转向周遭世界,工作场所逐渐成为发掘新经验的沃土。科学工作尤其享有盛誉,在社会中影响巨大。但在拉图尔看来,科学家越是成功,科学系统内部如何运作就愈发模糊,所谓“黑箱”就源自科学与社会的区隔(Latour,1999:304)。因此他发展出一套基于实验室田野、追踪物之线索的认识论与方法论来解蔽“黑箱”,其代表作《实验室生活》指出:生产现代科学知识的实验室在日常运作中充满无序和混沌,而科学家要想抵抗熵增,将己方陈述转化为客体,努力使其在竞争性场域中胜出并实现物化,从而回馈于可信性循环,最为基础但又最不可或缺的工作就是保留操作秩序的痕迹(比如记录将试剂注入的具体烧杯及时间间隔),档案、标签、计划书、论文、数字等铭文(inscription)正是在无序中识别模式、创造秩序口袋的不二法门(拉图尔,伍尔加,1979/2023:260-272)。
本文认为,拉图尔给予我们探索大模型的启示既在于勇气——他本人在缺乏科学知识积累、英语沟通技能的情况下毅然进入实验室田野,而这种“陌生化”恰恰构成了后续发现的基础;也在于建构主义的认识论——算法、模型、数据等同样是经由日常实践、装置、代码与话语不断被生产、稳定和制度化的结果;还在于线索追踪的方法论——GitHub、HuggingFace上的commit记录、模型卡、日志、评测脚本等均可视为铭文痕迹,研究者能够基于此去发掘代码世界的知识政治。
(二)从界面到算法:拆解“黑箱”的多点民族志
如今,要想复刻拉图尔的实验室观察模式已是困难重重。一方面,上世纪80年代后学者们逐渐意识到,作为“小社会”的实验室不足以完成“科学事实”的建构,新范式需打破实验室的内外界限,将更广泛的行动者纳入科学知识的建构网络(王敏,2025)。另一方面,科技企业日益取代科研院所成为大模型研发的主力军,其内部运作涉及商业机密,研究者进入现场的门槛极高;模型开发又分布于全球数据中心、远程协作平台、云端接口等多重场所;而且技术人员的编程工作只体现在屏幕上,传统的现场观察捉襟见肘。在这种情况下,多点民族志(multi-sited ethnography)渐成趋势,它擅长分析文化相连但地理分离的传播现象,要求学者追踪对象的流动轨迹、信息线索,把分布在不同地方的知识片段整合起来,从而完成对分布式知识系统的“深描”(管成云,2024)。
近十余年来数字平台的扩张渗透促成了线上与线下世界的交融,成为连接全球协作的接触网络,与多点民族志有着天然的契合性。相较于传统的田野考察,数字环境的一大优势在于其拥有丰富的痕迹数据记录,为研究者追踪线索提供了便利。其中,界面和算法构成了拆解平台运作“黑箱”的核心线索。
界面(interface)作为连接硬件、软件与人类用户的共享边界深刻重塑了无数行业的工作习惯,也改变了日常实践可以被观察到的条件(Ritter,2022)。目前平台研究中风靡的“漫游法”(walkthrough method)已在如何解释人机交互机制方面做出贡献。通过鼓励研究者亲身进入App界面,借助笔记、截屏、录屏等形式去记录第一手的行动流,该方法能够揭示App的导航、按钮、文本语气、象征关联等要素如何引导并形塑用户的数字实践(Light,Burgess & Duguay,2018)。
算法(algorithm)作为居于平台后端、不可见的计算规则,决定了用户与界面及内容匹配的方式,由于事实不可触和法律保密性,它往往会激发更强的“黑箱”焦虑(Pasquale,2015:7-8)。尼克·西弗(Nick Seaver,2017)提议将算法视为由人类集体实践组成、不再区分技术和非技术问题的文化。既然研究准入的禁区重重,民族志学者不妨化身“拾荒者”,通过追踪异质零散的线索(如非正式聊天、新闻发布会材料、社交媒体资讯)、跨越多个地点、建立松散连接的网络,以把握算法的纹理。在这种理念的指导下,关注算法与社会参与者之间波澜和涟漪的“算法折射”,寻找不同领域算法共性和个性的“算法比较”,以及基于饱和度、位置性和脱离原则的“算法三角互证”等试图在外围拆解算法“黑箱”的方法已层出不穷(Christin,2020)。这些尝试既为我们探索大模型的装配提供了参考和借鉴,也有助于在比较中厘清代码民族志的特征。
(三)从阐释到装配:批判代码研究与代码民族志的比较
20世纪90年代Linux 和 Apache的诞生,标志着“开源”(open source)作为一种大规模、地理分散但却高效的分布式协作模式成为可能,工作的文档化和源代码的异步可读成为其特征(韦伯,2005/2007:70,97)。软件开源运动促使代码从功能性的机器指令迈向具有修辞意义的社会文本,逐渐成为批判理论家、文学家、艺术家等非程序员阅读和探讨的对象,批判代码研究(Critical Code Studies,CCS)应运而生,它首次将诠释学应用于解释计算机代码的超功能意义。马克·马里诺(Mark Marino,2020:17-33)揭示了这种方法的文本政治底色,他认为:计算机的墙壁并未区隔代码与世界,而是将人类偏见编入其中,因此我们必须超越对代码的数学理解,将其视为一种充满指称与内涵、根植于文化的符号系统;CCS正是要从代码阅读中挖掘被编码的结构、模型和表达方式,以及软件本身的发展历程,通过文本阐释来揭示代码在种族、性别、社会经济地位、意识形态等方面的深层意涵。这便是CCS拆解技术“黑箱”的方式。
代码民族志(code ethnography)与CCS存在相似之处,它同样提倡发掘代码在技术工程之外的社会建构意涵,但双方在知识脉络、适用问题、核心逻辑、主要方法等方面存在显著的差异:CCS沿袭了文学批评和文化研究的传统,试图回应“代码意味着什么”、“意识形态如何被表征”等文本政治的问题,主要通过文本细读、修辞分析来揭示阐释(interpretation)的逻辑;代码民族志则基于科学技术社会学(STS),旨在解释“代码如何生成”、“智能何以被多元力量所构造”等装配政治的问题,主要凭借多点田野、痕迹追踪、关系网络分析来揭示装配(assembling)的过程。在代码民族志中,“装配”意味着在工程师、网络服务商、国家机器、基础设施、海量用户等组成的异质网络中审视代码的作用;通过追踪分布式协作与共享行动揭示技术政治与权力不对称(如“全球南方”对北方的依赖),从而实现技术解释与社会解释的耦合(Rosa,2022)。
本文认为,代码民族志颇为适用于拆解大模型装配的“黑箱”,这与其技术特性密切相关。不同于人类程序员用C++或Python编写的逻辑语句(软件1.0),大模型的代码由优化算法在评估标准指导下自动生成(软件2.0),它们表现为无比抽象、不可阅读的神经网络权重(Karpathy,2017)。而开源模型所展示的代码架构,实际上是源代码(动辄TB级数据集)的编译器,它们揭示了模型层数、注意力机制(attention)如何运作、参数如何分布等装配信息。因此,尽管我们仍可运用CCS去细读训练框架、评测脚本、提示模版中的意识形态偏向,但代码民族志更关心的是代码如何被编写、审查、转译与治理的社会生命史,以及代码如何串联算力硬件、公共数据、人类劳动等资源要素。为了更清晰地论证这一点,下文将总结提炼一套更具实操价值的方法指南。
三、实践指南:串联模型社会化的
生命周期
本文引入人类学中“物的文化传记”(Kopytoff,1998:64-66)这一理念,以GitHub仓库为多点民族志的初始“地点”,围绕大模型的生命周期——数据集构造、模型参数训练、基准评测、向外部拓展——搭建了代码民族志的实践指南(见图1)。下文揭示了大模型装配政治的问题化时刻,每个部分既可形成独立的研究,又可将分布式知识拼成整体的图像。为了方便操作说明,我们选择目前开源最为彻底的OLMo模型作为示例。
![]()
(一)挖掘训练数据集的“非自然史”
在构造训练数据集的阶段,代码民族志旨在解释大模型知识资源的装配政治,即纷繁复杂的社会现实如何经过筛选、分类和处理,从而构成AI可理解的“基本事实”。从STS的角度出发,任何数据集的构建都不是对“自然状态”下无脚本活动的捕捉,其作为知识对象的稳定性源自实践标准(包括数据分类、标注等活动)和对齐工作(通过正式或非正式的沟通以达成协议的各种努力)(Engdahl,2024)。而一旦训练集被确立为有用的基准,就会成为“基本事实”被改编和扩展(Crawford,2021:98)。我们可以通过“浅描”和“深描”两种方式来回溯其知识资源装配的线索。
“浅描”旨在以查询来源的方式勾勒训练数据集的结构性图景。研究者要能够在GitHub仓库中用“configs”、“dataset”等关键词定位到最琐碎的预训练数据(例如“.npy”后缀的文件);或是通过HuggingFace上的模型卡找到数据集介绍,获悉不同的数据来源、更新时间、tokens、样本比例、处理方式。此外,模型的技术报告(通常是发表在Arxiv上的论文)也会介绍其预训练数据。例如,OLMo的超大训练集就来自对Common Crawl、Semantic Scholar、Reddit、Wikipedia等公共或社区数据的装配,研究者可研判其数据采集的合规性。我们还可以调取皮尤研究中心等机构的报告,通过用户画像和内容特征推导数据集的偏向,如Reddit、X上超60%的白人男性用户结构就能折射出模型在多样性和公正性上的缺陷(陈昌凤,张梦,2024)。2024年“弱智吧帖文成为AI中文训练语料”的新闻一度引发热议,展现了互联网草根亚文化对于人工智能训练的意外价值。
“深描”则意在填补数据集结构性图景背后的血肉,钩沉其被“物化”(reification)藏匿的建构痕迹(拉图尔,伍尔加,1979/2023:193-194),通常要求民族志从线上延伸至线下。凯特·克劳福德(Kate Crawford,2021:167-172)对情感分析数据集CK(Cohn-Kanade)的“考古”具有典范性,她揭示出这种演员面对相机时表演出来的模拟状态如何被固化为人类情感反应的基准,从而错误地在行业领域中扩散。研究者需规范性地审视训练数据集的装配正义,追问资金来源及潜在立场,评估样本的地理和群体多样性,考察是否涉及劳动力补偿、知情同意及伦理审查(Gebru et al.,2021)。“深描”材料的具体收集方式包括:(1)申请担任AI数据采集的志愿者,佩戴设备录制现场素材;(2)访谈AI开发者以捕捉他们获取训练数据的非正式情境(高泽晋,2022);(3)调研数据标注基地,揭示隐形劳动背后的权力博弈和认知对齐机制。
(二)洞察模型训练中的协作文化与算力政治
在模型训练的阶段,代码民族志可以揭示组织与物质层面的装配政治,一方面研究以代码为中介的开发者协作文化,从而回溯其组织沟通的权力关系;另一方面通过代码解读大模型算力硬件的装配形态,以还原智能生成背后的物质性提取逻辑。模型参数训练通常包括预训练(pre-training)和微调(fine-tuning)两个环节,前者在大规模的无标注数据集上训练,形成全面的多模态理解能力,后者则在小规模特定任务上施以针对性训练,使模型形成特定能力(拉施卡,2024/2025:5,85)。由于神经网络权重是不可理解和阅读之物,因此代码民族志主要追踪的是开发者决策架构与训练过程日志,以描绘人类行动者与非人行动者的交互轨迹。
在大模型装配的组织层面,部署参数训练的代码为我们提供了认识这种新型协作文化的渠道。研究者可以从GitHub的“洞察”界面获悉每位开发者的代码贡献频率、次数和字段,以及参与者的关系网络,从“操作”界面了解其工作流。此外我们还能在Github仓库的“scripts”文件夹中找到训练代码,了解开发者如何对代码工作进行监控、诊断和效率评估。在具体的代码阅读和分析上,豆包等大模型已集成了专门的代码解释模块,可以用于将代码转译为自然语言(见图2),然后导入Nvivo等质化分析软件进行编码,形成一套简易的工作流。代码是计算机的母语,LLM对代码的释义更可靠,研究者还可通过多种模型的比较提升稳健性。目前LLM已被广泛用于辅助人类开发者进行代码审计(Aðalsteinsson et al.,2025),也证明了本方法的合理性。
![]()
有学者根据其GitHub社区的民族志调查发现,代码协调了个体化作业(读、写、调试合一)与群体性作业(评审、清理、合并)这两大类工作流,促使原先大量基于口语和文档的沟通逐渐被以代码为中介的沟通所取代(Sharma,2024)。这反映了协作过程的脱域化,只有服膺于代码逻辑的思想才能进入模型的装配线。GitHub“半透明的社交系统”则彰显了一套非正式的等级制度,它通过可见性驱动开发者进行自我审查和声誉维护(方师师,2020),从而将个体劳动高效地装配进模型开发工程,同时排除了私人生活等“非生产性”要素的干扰。当我们转向模型的微调环节时,协作文化还烛照出在地创新的意义。 DeepSeek-R1成功证明大型推理模型的思维模式可以被低成本地“蒸馏”到小模型中,这种“去中心化”的装配逆转了权力的流向,让智能得以在低成本的创新公地中流转。
在大模型装配的物质层面,通过参数训练代码还可以洞察算力调用的痕迹和机制。这响应了基特勒(Friedrich Kittler)(1992)关于“软件不存在”的宣言,他认为编程语言掩盖了硬件对权力的垄断,所有代码操作都得回归电压差的位移,它们能控制硬件。从具体操作上,研究者可查找模型训练脚本(如scripts目录)和YAML配置文件,获取GPU型号、算力集群等被隐藏的硬件信息。仍然以OLMo为例,我们追踪其训练日志后发现:该模型的算力资源依附于NVIDIA的 GPU 基础设施(硬件层),采用PyTorch+DeepSpeed的深度学习框架(算法层),运行在 InfiniBand 互联的 HPC 集群上(网络层),训练任务在 AllenAI 内部集群平台Beaker上得到分布式调度(平台层),同时与外部云存储互联(AWS / GCP),构成了混合云算力模式(存储层)。换言之,OLMo通过研究所自有集群构建独立的算力节点,在一定程度上抵抗了商业算力霸权,但是它继续依附于 NVIDIA 硬件生态,说明其算力开源仍离不开特定国家与企业控制的堆栈。这揭示了智能装配依旧受到资本积累、地缘硬件贸易、环境代价的深度制约。
这种后殖民依附关系或许会在“全球南方”的科技实践中找到更多佐证,研究者甚至还能根据代码显示的GPU参数来量化AI的碳足迹,批判性审视人工智能的跨国流动。
(三)探究基准评测的声誉系统与跨圈层流动
在大模型基准评测的阶段,代码民族志需要探究评价标准的装配政治,即关于“好AI”的共识是如何在开发者社群(内部)和自媒体转译(外部)中形成的,并追问此类标准是否会反向驯化研发路径。基准评测(benchmark)通过标准化的任务(如数学推理、指令遵循)将抽象的“智能”转化为可度量的知识对象,是连接技术性能、科研声誉与社会期待的关键线索(Engdahl,2024)。正如拉图尔、伍尔加(1979/2023:218-223)笔下的“可信性循环”概念所揭示的,大模型研发也天然置身于竞争性的场域中,开发团队需不断投入算法、算力和数据,通过基准评测跑出高分,在公共场域中辐射其性能/价格优势,积累产品的学术/商业可信性,由此吸引更多资源投入模型的优化迭代。
基准评测并非中立的“测量尺”,而是权力共识的装置,首先开发者社群内会逐渐形成对“智能”边界与好坏的认定。通过在GitHub上检索“benchmark”、“evaluation”等关键词,我们可以获取基准评测的代码,或直接阅读Arxiv上模型的技术报告,从而追问基准评测会凸显大模型的哪些能力、又遮蔽哪些短板,不同模型的比较形成了怎样的展演性话语。例如,OLMo2显示了基础模型对通用语言能力、逻辑推理能力的重视;微调指令模型OLMo 2-Instruct则强化了回忆、指令遵循、安全性等能力。Llama 3.1(开源)、GPT-3.5(闭源)常常被各大模型列为跑分对标的标准,说明西方科技仍在无形中塑造模型评价的合法性位序。研究者还可以追溯模型跑分排行榜的历时性变化,关注开发者社群的争议事件,解析声誉系统在多方博弈下的权力再装配。Papers with Code一度是人工智能领域涵盖最全基准测试和历史数据的第三方平台,被称为全球科研人员的“快乐老家”,但在2025年7月25日宣布关停,后被HuggingFace 与 Meta打造的平台Trending Papers所取代,流量亦取代科学成了新的数据分发逻辑,引发了全球用户的不满。
大模型的评价标准并不局限于开发者内部,还会经历跨圈层的流动,科技自媒体的传播会将大众的认知想象、话题流量利益等纳入评价标准的装配要素。在此过程中,量子位、机器之心、新智元、数字生命卡兹克等头部AI自媒体扮演了关键的“转译者”,它们通过话语重构将模型跑分数据转化为杂糅了技术民族主义、商业主义、进步主义、企业家精神等意识形态的科技叙事,诸如“吊打GPT-4”、“国产之光”等表述便可见一斑。研究者可以挖掘上述转译过程中的话题时刻,开启知识社会学讨论;或者基于新榜发布的“AI账号影响力榜”数据,运用内容分析、主题模型等方法探究大模型声誉扩散的规律;以及通过访谈自媒体博主,梳理他们将代码信息转译为科普文章的工作流,用批判话语分析揭示模型性能背后的社会想象。这些做法都能丰富大模型社会生命的观察维度。
(四)追寻模型向外拓展的“再语境化”踪迹
大模型的社会生命并不止步于基准评测,它需要持续的数据流、计算周期、能源与劳动力消耗来支撑近乎无止境的扩张与维护(Crawford,2021:48-49)。这暗示了大模型在向外部世界拓展的过程中会不断经历“再语境化”。在此,代码民族志意欲探索大模型治理机制的装配政治,因为其代码不是静态的可执行文件,更是在与软硬件、人类及其他系统的交互中不断再生、不断改变意义、且具有行动能力的“机器施为”(machinic performative)(Chun,2011:22-25),它们是权力延伸的触手。本文重点关注议题、拉取请求和应用编程接口三种治理机制,它们规定了谁能提议、谁能合并代码,以及谁能以何种频率调用模型,由此主动地“治理”或“干预”外部世界。
“议题”(issues)体现了治理机制中的“前置协商”。它是GitHub中模型项目的讨论板和任务清单,任何用户皆可以在此提出问题、反馈错误、建议新功能,再由开发团队成员分配负责人、添加分类标签(如“bug”、“question”、“feature”等)、进行解答,使议题在“待办”(open)和“完成”(close)之间转化。在代码施为性视角下,议题机制构成了技术决策的现场——社区讨论促使模型的功能边界被重新定义并付诸实施。维护者通过关闭某些议题,或给某些议题贴上“优先”标签,实际上在行使定义什么是“重要问题”的权力。而当开发者与用户争论某个对齐准则(alignment)是否合宜时,他们也是在装配模型的“道德边界”。在现实中,一个活跃项目可能积累了上千个议题。面对这样的数据量,研究者不妨综合全景扫描和关键点深挖的方法,既采用内容分析梳理社群关切的整体轮廓,GitHub中的标签本身构成了编码归类的依据;又深挖那些引发多轮争议、促成架构重大调整的议题,解析其微观博弈的来龙去脉。
拉取请求(pull request,PR)则体现了治理机制中“准入与审批”的环节,就像是代码库的“海关”。在GitHub上,拉取请求用于代码合并与审查,任意开发者可以将原始代码“分支”(fork)拷贝一份并着手修改,再发起“Pull Request”申请将修改内容合并回主项目,由维护者进行代码审查、评论和测试,批准后便可“合并”代码。PR记录了代码从“建议”变为“事实”的时刻,研究者可以遍历PR讨论、提交、检查、更改的记录,考察管理者的意志如何修正开发者的代码逻辑,辨识哪些外来代码会被物化为模型的一部分,哪些又会被排除在外。在特定事件中PR还能创造出超越代码修改的可供性,如在996.ICU项目协作中不断增殖倡议书、行为艺术、歌谣、视频、新闻报道等社会文本,促使地理场所、网络空间、媒介话语在GitHub之外开辟新的“复合空间”(方师师,2020)。总之,不同于基准评测展现的“竞赛式声誉体系”,议题和拉取请求机制体现了“众包式创新”的治理方式。在此,模型的架构和意义不再由原始团队独占,而是在分叉、改写、评论与合并中得到再生产。
应用编程接口(API)体现了治理机制中的“边界装配”和“远程控制”,它是模型向社会输出其影响力的重要手段。API的治理性体现在它规定了谁拥有访问数据的权限、调用频率以及返回格式,控制了代码实施权力的边界(Helmond,2015),并且也定义了下游开发者和模型之间的从属关系。当医疗、教育等垂直行业通过API调用某通用大模型时,它们势必要接受已被装配完毕的底层价值观(如特定过滤逻辑等)。研究者可以通过至少四种路径分析大模型API的治理作用:(1)审计模型API档案和更新日志,推断它如何利用“经济杠杆”(价格)和“技术带宽”(延迟)对下游生态实施远程调控;(2)在GitHub用关键词检索API调用仓库,审视其预设的输入输出格式(schema)如何作为“技术契约”形成对开发者的隐形约束;(3)利用HuggingFace Spaces追溯API的被调用次数、分支复用、应用领域,思考其治理逻辑如何跨越行业语境;(4)通过Rapid、OpenRouter等网站检视模型API的全球调用占比、增长曲线、性能指标,从宏观层面揭示数智生态治理的格局。由此我们建构了一套从微观到宏观的API审计路径,以揭示大模型如何在向社会延伸的过程中重塑现实世界的权力。
四、贡献反思:打开智能“黑箱”的
新知与局限
为了矫正信息与认知不对称带来的种种社会问题,千百年来人文社科学者始终致力于打开新技术的“黑箱”、启迪民智。20世纪60年代,新闻编辑室民族志一度揭示了大众传播的生产奥秘,在转换学科问题意识的同时革新了其方法论。如今在智能传播时代,本文呼吁再次转向生产现场,从观察记者到追踪代码,从探究“新闻如何制造”到“智能如何装配”。据此,总结代码民族志的知识贡献与方法局限将大有裨益。
(一)从透明性到可解释:追问生成式 AI的装配过程
本文认为,代码民族志的第一重知识贡献就在于逼促我们重新思考打开“黑箱”的认识论本身。当人们谈论“黑箱”时,总是会不证自明地呼吁透明性(transparency),似乎“看见”(seeing)能够天然地触发“洞见”(insight),推动责任方承担相应的义务,使改变发生(Ananny & Crawford,2018)。然而,大模型即使开源,专家也难以解释其技术实质——复杂的参数权重与高维数学矩阵,当公开的信息过于庞杂和晦涩时,透明度原则反而会失灵。在此,我们不妨秉承实用主义原则,与其将目光投向技术内部不如横跨整个系统,通过追踪人类与非人行动者的连接与交织来呈现复杂性(Ananny & Crawford,2018),并将焦点落在可解释(intelligible)而非透明性上。这正是本文所呼吁的,通过代码民族志收集大模型装配的可追溯性证据,因为即便模型的输入端和输出端变动不居,其数据筛选标准、人机对齐原则、算力资源配置、算法创新成果、社群交流讨论、应用传播扩散等要素仍是可观察可审计的。当对社会装配的解释足以祛魅科技神话,“黑箱”便会自然退场。
代码民族志的第二重知识贡献在于能有效反哺以人机传播、AI治理为代表的智能传播研究。第一节综述中已谈到,对于生成式AI前端社交线索的测量,难以把握技术的结构性特征,而代码民族志进入技术生产后端挖掘的经验材料,不仅有助于回应“为何AI会这样或那样”的前因,后续转化为新的操作变量,还拓展了对AI生成意义社会物质过程的解释。例如,研究者可以将性别、声音、语气等类人线索还原至数据集构造、训练算法创新上,并追问对齐工作如何定义人机交流的“黄金标准”。学者对代码协作过程的追踪则有助于将开发者、数字基础设施、国家力量、商业资本等更多元的行动者吸纳到讨论中,使关系分析从交互行为延伸至物质基础层面,深化其技术政治意涵。
在AI治理领域,代码民族志对于大模型社会化生命周期的材料收集,有助于在“看见技术”和“创建问责”之间建立衔接,推动敏捷治理原则(张凌寒,于琳,2023)有效落地。针对全面性原则,大模型装配的全链路经验材料能够为监管方设计政策、实施分层治理提供可验证的相关证据。针对适应性原则,对commit、PR、issues、API等模块日志的追踪可以形成规制视角难以触及的“过程性观测”,使监管部门与科技企业之间形成更有机的沟通。针对灵活性原则,GitHub等开源社区则提供了天然的“沙盒环境”,研究者对于“代码如何被创建、审查与合并”的追踪本身就是对软法的实践性阐释,这使得敏捷治理成为一种可被检验的社会实验。
(二)在理想与现实之间:代码民族志的适用性探讨
尽管本文一再强调代码民族志在解析大模型“黑箱”上的价值贡献,但我们仍要警惕方法论的浪漫主义倾向,需客观评估其局限性和适用范围。首先要再次澄明,代码民族志所谋求的打开“黑箱”并非要暴力破解大模型的参数权重和数学矩阵,因此它并不是某种逆向工程;而是力图打破科技和社会的区隔,通过追踪数据、算法和算力在不同时空场景中社会性装配的痕迹,批判性审视大模型生成的“过程正义”。可以说,正是大模型区别于传统软件的特性——不可阅读的参数权重和庞大数据集——标明了代码民族志的有限性,另一方面也更加凸显了其价值所在。
其次,代码民族志在AI 后端的洞察力高度依赖于开源生态的繁荣程度。由于该方法强调基于数字痕迹的物性挖掘,其前提是开发者在GitHub、HuggingFace等社区中留下了足够丰富的铭文记录。面对ChatGPT、Gemini、豆包、文心一言等闭源、商用的模型,研究者只能退回到前端。尽管Qwen、DeepSeek的崛起引领了新的AI开源风潮,开源模型与闭源模型之间的平均能力差距也在缩小,但闭源模型仍然在市场上占据主导。另外,各种模型开源的程度也参差不齐,像OLMo这类彻底开源的模型仍是少数。不过随着AI向“全球南方”扩散,开源化趋势会越来越显著,代码民族志的应用前景也会更加广阔。
再次,代码民族志具有不低的准入门槛,并集中体现在对代码素养的要求上。虽然LLM的转译大大降低了研究者阅读代码的门槛,代码民族志也不像批判代码研究那样要求非常细致的文本分析技巧,但该方法仍需要研究者培养以下几项能力:首先是适应GitHub、HuggingFace的操作界面,能够在漫游中检索到想要找到的资源;然后是了解并掌握像PR、LGTM、RFC、Ping之类的技术黑话,明白编程工作者的沟通习惯;还有就是学会在代码海洋中敏锐地辨识“关键铭文”,并能用社会科学的话语讲述大模型装配的故事。这些都预示着代码民族志注定是一场跨学科的试炼。
最后,我们必须承认代码民族志无法取代传统的线下田野。在AI生产端仍然存在大量没有被数字化、隐秘而真实的社会实践需要探查:吴桐雨(2024/2025)揭示了硅谷的精英工程师如何在极客文化感召下构建起游戏化的主体,完成自我剥削式的生产;詹姆斯·马尔登等人(2024/2025)则记录了智能表象背后,在南方国家从事重复性、低薪标注工作的底层劳动者的故事。这些关乎肉身经验、权力结构和地缘张力的鲜活田野,是代码追踪所难以透视的。当然,代码民族志的经验能为学者进入上述田野提供更好的知识基础,总之线上与线下的民族志工作需要相互补充,方能“深描”人工智能社会性装配的复合图景。
五、结语
在生成式AI空前融入社会生活的当下,新闻传播学科的相关研究正如雨后春笋般涌现。然而,无论是人机传播还是AI治理的成果,无论是微观的用户反馈测量还是宏观的法规注解,现有研究往往不自知地预设了大模型封闭、逻辑上自足的“黑箱”性,鲜有学者探索其算法、算力、数据在后端的装配过程。
本文以构建“可理解社会”为目的,针对大模型不同于传统软件的特性来重新审视如何打开智能“黑箱”,主张引入代码民族志这一新方法,让社会解释回到科技生产的现场。该方法承继了人类学、STS、平台研究脉络中的线索追踪传统,将代码、脚本、日志、接口等理解为技术与社会互嵌的铭文,主张以多点民族志的方式进行数据收集与分析,以期回应大模型装配政治的问题。本文还围绕大模型社会化的生命周期构造了代码民族志的实操指南:研究者可以大模型的Github仓库为基点,追溯数据集构造的“非自然史”、揭示模型训练的协作文化与算力政治、探究基准评测的声誉系统与跨圈层流动机制、追寻模型向外拓展的“再语境化”踪迹,从知识资源、组织和物质、评价标准、治理机制四个维度具体解析了模型的装配政治。其中每个环节都可以作为独立研究深挖,又可以成为拼接完整图谱的分布式知识。尽管存在依赖开源生态、准入门槛不低、无法取代传统田野等局限性,但代码民族志仍启发人们从可解释原则上重新审视模型“黑箱”的迷思,并反哺了以人机传播、AI治理为代表的智能传播研究。
此外,代码民族志还顺应了世界范围内将信息公开性与可重复验证性作为知识生产新标准的趋势,可与近年来兴起的“开源情报分析”(OSINT)形成积极对话。其意义还在于鼓励人文社科学者进入数据关系创新(江小娟等,2024)的真实现场,将智能制造转译为一种镶嵌了社会关系、伦理争议、国家叙事与知识政治的鲜活故事。这种方法论转向将推动人文社会科学重新成为理解智能社会秩序的活力源泉。
(曹钺:《探索大模型的装配足迹:代码民族志的方法渊源与实践指南》,2026年第5期,微信发布系节选,学术引用请务必参考原文)
特别声明:本文经上观新闻客户端的“上观号”入驻单位授权发布,仅代表该入驻单位观点,“上观新闻”仅为信息发布平台,如您认为发布内容侵犯您的相关权益,请联系删除!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.