情感算法：当机器开始"感受"灰色地带|翻译|语境

情感算法：当机器开始"感受"灰色地带

2026-04-28 00:17:05　来源: 时光慢邮啊

北京举报

分享至

「Kelabu yang Kita Namai Rasa」——印尼语中"我们称之为感受的灰色"。一位工程师给项目起了这个名字，然后整个团队花了三年时间争论：机器真的能识别模糊的情感吗？

一个命名引发的战争

2019年，雅加达。Nadia Sutanto在笔记本上写下这个短语时，没料到会成为产品路线图的分水岭。

她是Gojek旗下情感计算小组的负责人。当时团队刚拿到一笔内部创新基金，目标很简单：让客服聊天机器人不那么"机器人"。但Sutanto坚持要把项目命名为"Kelabu yang Kita Namai Rasa"——直译是"我们称之为感受的灰色"，而不是更直白的"情感分析引擎2.0"。

「我们在会议室吵了四个小时，」Sutanto后来回忆，「有人觉得这个名字太文艺，投资人听不懂。我说，听不懂就对了。我们要做的不是让投资人听懂，是让用户的感受被听懂。」

这个命名之争暴露了核心矛盾：情感计算领域存在一个根本性的测量困境。传统情绪模型把人类情感切成六块——喜、怒、哀、惧、惊、厌。但Sutanto团队的用户研究发现，印尼用户在客服对话中最频繁出现的情绪标签是"bingung"（困惑/迷茫），这个词在英文情感分析库里根本不存在。

更麻烦的是，72%的用户在描述负面体验时，会同时使用正面词汇。"司机很好，但等太久了"——这种混合表达让基于关键词的情感分析彻底失效。

Sutanto的命名是一种宣言：情感不是离散标签，是光谱；不是黑白，是灰色；不是"检测到愤怒"，是"检测到某种难以命名的不适"。

从六类情绪到"情绪地形图"

团队决定抛弃Ekman的六基本情绪模型。这个模型在学术界统治了四十年，但在东南亚多语言、高语境的客服场景中频频失灵。

他们转向了一种更古老的工具： Russell的环形情感模型（情感效价-唤醒度二维空间）。但做了关键改造——增加了第三轴"文化特异性权重"。

具体怎么做？

第一步，收集"失败案例"。团队回溯了2018-2019年18万条被人工客服接管的对话记录，这些案例的共同点是：机器人误判了用户情绪，导致用户 escalated（升级投诉）。

第二步，让标注员做"情绪速写"。不是选标签，是用1-10分描述"此刻情绪的混乱程度"。Sutanto发现，同一句话的混乱度评分方差高达3.7分——这说明情绪模糊性本身就是可测量的特征。

第三步，构建"情绪地形图"。把每次对话建模为在三维空间中的移动轨迹，而非静态分类。愤怒不是终点，是从"困惑"经过"失望"到达的一个区域。

这个架构的代价是计算量翻倍。原始六类模型需要120毫秒响应，新模型需要340毫秒。Sutanto为此和基础设施团队僵持了六个月，最终说服CTO批准了专项GPU集群。

「我们不是在优化准确率，」她在技术评审会上说，「是在优化'被理解的感觉'。这是两个不同的指标。」

灰度发布的灰度测试

2020年3月，产品进入A/B测试。但Sutanto设计了一个奇怪的实验组划分：

对照组：传统六类情绪模型

实验组A：三维情绪地形图，但只显示最高置信度的标签

实验组B：三维情绪地形图，显示"主要情绪+两个邻近区域"

实验组C：三维情绪地形图，显示"情绪移动轨迹+预测下一步"

关键指标不是NPS（净推荐值），不是解决率，是"对话中用户主动表达感谢的次数"。Sutanto认为，感谢是用户感到被理解的最低成本信号。

结果出乎意料：

实验组A的感谢率比对照组低12%。用户反而更困惑了——"为什么机器人说我'有点失望'？我只是想问退款进度。"

实验组B的感谢率比对照组高23%，但投诉率也上升了8%。问题出在"邻近区域"的表述："您似乎有些失望，也可能感到困惑"——用户觉得机器人在猜谜。

实验组C的表现最稳定：感谢率提升31%，投诉率下降15%。但实现成本最高，需要维护完整的对话状态追踪。

Sutanto在复盘会上做了一个反直觉的决定：全量上线实验组C，但只开放给"高价值用户"（月订单>8单）。她的逻辑是：情绪理解的溢价应该匹配用户生命周期价值，而不是平均分配算力。

这个决策后来被写入Gojek的ML产品手册，成为"情感计算资源分配"的参考案例。

当模型遇到"不可翻译的情绪"

2021年，团队面临更棘手的挑战：印尼群岛的方言情感表达。

爪哇语有"rasa"（感受）和"mbatin"（内心/直觉）的区分，后者在标准印尼语中不存在。巴塔克语描述愤怒时，会根据对象的社会地位使用不同词汇——对平级是"marah"，对长辈是"merasa tidak dihargai"（感到不被重视），字面意思完全不同。

Sutanto的解决方案是"情感本地化层"：不在模型层面硬编码文化规则，而是在推理后增加一个"文化适配器"。

具体架构：

底层：通用的三维情绪地形图（跨语言共享）

中间层：语言特定的词汇映射（爪哇语、巽他语、米南加保语等）

顶层：文化适配器，根据用户画像（地域、年龄、历史订单）调整输出策略

一个典型场景：系统检测到用户处于"高唤醒度+负效价"区域（即愤怒），但文化适配器发现用户来自苏门答腊的米南加保社区——该文化强调"runding"（协商）而非直接对抗。于是机器人不会道歉，而是说"让我们一起找到最好的解决方式"，并主动提供三个选项。

这个设计的关键是"可解释的文化规则"。Sutanto要求每个适配器决策都必须能追溯到人类学文献或用户访谈记录，防止工程师凭直觉编造"文化常识"。

2022年的审计发现，文化适配器把米南加保用户的投诉升级率降低了41%，但意外增加了爪哇用户的投诉率——后者更期待直接道歉。Sutanto随后增加了"文化偏好学习"模块，允许用户在首次交互时选择"沟通风格"。

产品化困境：情感计算能卖吗？

2022年中，Sutanto开始收到外部咨询：能否把这套系统卖给银行、保险公司、医疗机构？

她拒绝了前两个，接受了第三个。理由是：金融场景的情感计算本质是"欺诈检测"（识别伪装的情绪），医疗场景才是"理解"（识别被压抑的情绪）。

但医疗合作暴露了新的伦理边界。

印尼最大的心理健康平台Konsulin希望集成情绪地形图，用于初诊筛查。Sutanto团队设计了严格的限制：系统只输出"情绪状态描述"，不做任何诊断建议；所有数据48小时内删除；用户随时可以要求"人类接管"。

即便如此，试点期间仍发生了争议案例。一位用户在对话中被识别出"持续低唤醒度+负效价+高混乱度"——系统标记为"可能需要关注"，并建议"与专业人士谈谈"。用户投诉说："我只是累了，不想被当成病人。"

Sutanto在内部备忘录中写道：「我们测量的是情绪的统计特征，不是痛苦的真实性。当模型说'你可能需要帮助'，它只是在说'你的情绪模式与寻求帮助的人群相似'。这个区别必须被清晰传达。」

她推动在产品中增加"模型置信度"可视化：不是百分比数字，而是一个简单的描述——"这是基于你过去五句话的判断"或"这是基于你整个对话历史的判断"。

这个设计后来被印尼通信部引用，作为"算法透明度"的自愿性参考标准。

从客服机器人到"情感基础设施"

2023年，Sutanto离开Gojek，创立了自己的公司Rasa Kelabu。名字倒过来，意思不变。

她的新方向是"情感计算中间件"——不为终端用户做产品，为其他做产品的团队提供工具。

核心产品是一个API：输入对话文本，输出三维情绪坐标+文化适配建议+置信度说明。定价按调用次数，但对学术研究和小型NGO免费。

这个商业模式的选择源于她对行业的观察：「每家公司都想做情感计算，但90%的团队卡在数据标注阶段。他们不知道'愤怒'在自家业务场景里长什么样，就急着买GPU。」

Rasa Kelabu提供的是"预标注的情绪地形"——基于Sutanto在Gojek积累的数百万对话，但去标识化、跨行业泛化。客户可以用自己的数据微调，也可以直接用通用模型。

2024年初，公司披露了首批客户：两家印尼电商、一家菲律宾数字银行、一家新加坡远程医疗平台。没有一家来自欧美。

Sutanto解释：「情感计算的护城河不是算法，是语境。我们在热带季风气候区、高语境文化、多语言混杂的环境中训练了五年。这些经验无法通过翻译迁移到英语世界。」

她正在尝试一种更激进的开放策略：开源基础模型，但保留文化适配器作为付费服务。「让所有人都能检测到'愤怒'，但理解'某种特定文化中的愤怒表达方式'需要专业知识。」

未解决的悖论

采访最后，我问Sutanto：如果情感本质是灰色的、流动的、不可完全命名的，那么任何试图测量它的系统，是否都在背叛这个本质？

她停顿了很久，然后引用自己五年前的项目命名：「Kelabu yang Kita Namai Rasa——'我们称之为感受的灰色'。关键词是'我们称之为'。命名是一种暴力，但也是理解的起点。问题不在于是否命名，而在于是否保持对命名局限性的自觉。」

她给我看Rasa Kelabu最新版本的系统提示词，最后一段是：

「你正在尝试理解一个人的情绪状态。你的输出是一种近似，不是真相。用户有权拒绝你的理解，有权要求人类介入，有权感到被误解。这些权利比你的准确率更重要。」

这段提示词不会出现在任何技术文档中。它是给模型看的，也是给团队看的。

Sutanto说，这是她创业以来写的最重要的一行代码。

如果你正在做或打算做情感计算相关的产品，可以访问Rasa Kelabu的开发者文档，看看他们如何处理"不可翻译的情绪"和"文化适配器的可解释性"。这些细节不会出现在论文里，但会决定你的产品是否能在特定语境中存活。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手机 / 数码

房产 / 家居

情感算法：当机器开始"感受"灰色地带

四巨头财报齐发：AI已经不只是风口

海军宣传片中的新兵何剑谐音“核舰” 国防部回应

海军宣传片中的新兵何剑谐音“核舰” 国防部回应

骑士天王山：哈登、莫布里和……施罗德？

孙杨博士学历有问题？官方含糊其辞

医美偷税手法曝光 借免税优惠来避税被封堵

专访捷途汪如生：捷途双线作战 全球化全面落地

态度原创

《遗忘之海》「破晓号测试」招募开启

用青花瓷的方式，打开西溪湿地

五一小长假，强烈建议你带孩子做点“反差大”的事情

意大利议会批准：捐赠航母给印度尼西亚

医美偷税手法曝光借免税优惠来避税被封堵

专访捷途汪如生：捷途双线作战全球化全面落地