「Kelabu yang Kita Namai Rasa」——印尼语中"我们称之为感受的灰色"。一位工程师给项目起了这个名字,然后整个团队花了三年时间争论:机器真的能识别模糊的情感吗?
一个命名引发的战争
![]()
2019年,雅加达。Nadia Sutanto在笔记本上写下这个短语时,没料到会成为产品路线图的分水岭。
![]()
她是Gojek旗下情感计算小组的负责人。当时团队刚拿到一笔内部创新基金,目标很简单:让客服聊天机器人不那么"机器人"。但Sutanto坚持要把项目命名为"Kelabu yang Kita Namai Rasa"——直译是"我们称之为感受的灰色",而不是更直白的"情感分析引擎2.0"。
「我们在会议室吵了四个小时,」Sutanto后来回忆,「有人觉得这个名字太文艺,投资人听不懂。我说,听不懂就对了。我们要做的不是让投资人听懂,是让用户的感受被听懂。」
这个命名之争暴露了核心矛盾:情感计算领域存在一个根本性的测量困境。传统情绪模型把人类情感切成六块——喜、怒、哀、惧、惊、厌。但Sutanto团队的用户研究发现,印尼用户在客服对话中最频繁出现的情绪标签是"bingung"(困惑/迷茫),这个词在英文情感分析库里根本不存在。
更麻烦的是,72%的用户在描述负面体验时,会同时使用正面词汇。"司机很好,但等太久了"——这种混合表达让基于关键词的情感分析彻底失效。
Sutanto的命名是一种宣言:情感不是离散标签,是光谱;不是黑白,是灰色;不是"检测到愤怒",是"检测到某种难以命名的不适"。
从六类情绪到"情绪地形图"
团队决定抛弃Ekman的六基本情绪模型。这个模型在学术界统治了四十年,但在东南亚多语言、高语境的客服场景中频频失灵。
他们转向了一种更古老的工具: Russell的环形情感模型(情感效价-唤醒度二维空间)。但做了关键改造——增加了第三轴"文化特异性权重"。
具体怎么做?
第一步,收集"失败案例"。团队回溯了2018-2019年18万条被人工客服接管的对话记录,这些案例的共同点是:机器人误判了用户情绪,导致用户 escalated(升级投诉)。
第二步,让标注员做"情绪速写"。不是选标签,是用1-10分描述"此刻情绪的混乱程度"。Sutanto发现,同一句话的混乱度评分方差高达3.7分——这说明情绪模糊性本身就是可测量的特征。
第三步,构建"情绪地形图"。把每次对话建模为在三维空间中的移动轨迹,而非静态分类。愤怒不是终点,是从"困惑"经过"失望"到达的一个区域。
这个架构的代价是计算量翻倍。原始六类模型需要120毫秒响应,新模型需要340毫秒。Sutanto为此和基础设施团队僵持了六个月,最终说服CTO批准了专项GPU集群。
「我们不是在优化准确率,」她在技术评审会上说,「是在优化'被理解的感觉'。这是两个不同的指标。」
灰度发布的灰度测试
2020年3月,产品进入A/B测试。但Sutanto设计了一个奇怪的实验组划分:
对照组:传统六类情绪模型
实验组A:三维情绪地形图,但只显示最高置信度的标签
实验组B:三维情绪地形图,显示"主要情绪+两个邻近区域"
实验组C:三维情绪地形图,显示"情绪移动轨迹+预测下一步"
关键指标不是NPS(净推荐值),不是解决率,是"对话中用户主动表达感谢的次数"。Sutanto认为,感谢是用户感到被理解的最低成本信号。
结果出乎意料:
实验组A的感谢率比对照组低12%。用户反而更困惑了——"为什么机器人说我'有点失望'?我只是想问退款进度。"
实验组B的感谢率比对照组高23%,但投诉率也上升了8%。问题出在"邻近区域"的表述:"您似乎有些失望,也可能感到困惑"——用户觉得机器人在猜谜。
实验组C的表现最稳定:感谢率提升31%,投诉率下降15%。但实现成本最高,需要维护完整的对话状态追踪。
Sutanto在复盘会上做了一个反直觉的决定:全量上线实验组C,但只开放给"高价值用户"(月订单>8单)。她的逻辑是:情绪理解的溢价应该匹配用户生命周期价值,而不是平均分配算力。
这个决策后来被写入Gojek的ML产品手册,成为"情感计算资源分配"的参考案例。
当模型遇到"不可翻译的情绪"
2021年,团队面临更棘手的挑战:印尼群岛的方言情感表达。
爪哇语有"rasa"(感受)和"mbatin"(内心/直觉)的区分,后者在标准印尼语中不存在。巴塔克语描述愤怒时,会根据对象的社会地位使用不同词汇——对平级是"marah",对长辈是"merasa tidak dihargai"(感到不被重视),字面意思完全不同。
Sutanto的解决方案是"情感本地化层":不在模型层面硬编码文化规则,而是在推理后增加一个"文化适配器"。
具体架构:
![]()
底层:通用的三维情绪地形图(跨语言共享)
中间层:语言特定的词汇映射(爪哇语、巽他语、米南加保语等)
顶层:文化适配器,根据用户画像(地域、年龄、历史订单)调整输出策略
一个典型场景:系统检测到用户处于"高唤醒度+负效价"区域(即愤怒),但文化适配器发现用户来自苏门答腊的米南加保社区——该文化强调"runding"(协商)而非直接对抗。于是机器人不会道歉,而是说"让我们一起找到最好的解决方式",并主动提供三个选项。
这个设计的关键是"可解释的文化规则"。Sutanto要求每个适配器决策都必须能追溯到人类学文献或用户访谈记录,防止工程师凭直觉编造"文化常识"。
2022年的审计发现,文化适配器把米南加保用户的投诉升级率降低了41%,但意外增加了爪哇用户的投诉率——后者更期待直接道歉。Sutanto随后增加了"文化偏好学习"模块,允许用户在首次交互时选择"沟通风格"。
产品化困境:情感计算能卖吗?
2022年中,Sutanto开始收到外部咨询:能否把这套系统卖给银行、保险公司、医疗机构?
她拒绝了前两个,接受了第三个。理由是:金融场景的情感计算本质是"欺诈检测"(识别伪装的情绪),医疗场景才是"理解"(识别被压抑的情绪)。
但医疗合作暴露了新的伦理边界。
印尼最大的心理健康平台Konsulin希望集成情绪地形图,用于初诊筛查。Sutanto团队设计了严格的限制:系统只输出"情绪状态描述",不做任何诊断建议;所有数据48小时内删除;用户随时可以要求"人类接管"。
即便如此,试点期间仍发生了争议案例。一位用户在对话中被识别出"持续低唤醒度+负效价+高混乱度"——系统标记为"可能需要关注",并建议"与专业人士谈谈"。用户投诉说:"我只是累了,不想被当成病人。"
Sutanto在内部备忘录中写道:「我们测量的是情绪的统计特征,不是痛苦的真实性。当模型说'你可能需要帮助',它只是在说'你的情绪模式与寻求帮助的人群相似'。这个区别必须被清晰传达。」
她推动在产品中增加"模型置信度"可视化:不是百分比数字,而是一个简单的描述——"这是基于你过去五句话的判断"或"这是基于你整个对话历史的判断"。
这个设计后来被印尼通信部引用,作为"算法透明度"的自愿性参考标准。
从客服机器人到"情感基础设施"
2023年,Sutanto离开Gojek,创立了自己的公司Rasa Kelabu。名字倒过来,意思不变。
她的新方向是"情感计算中间件"——不为终端用户做产品,为其他做产品的团队提供工具。
核心产品是一个API:输入对话文本,输出三维情绪坐标+文化适配建议+置信度说明。定价按调用次数,但对学术研究和小型NGO免费。
这个商业模式的选择源于她对行业的观察:「每家公司都想做情感计算,但90%的团队卡在数据标注阶段。他们不知道'愤怒'在自家业务场景里长什么样,就急着买GPU。」
Rasa Kelabu提供的是"预标注的情绪地形"——基于Sutanto在Gojek积累的数百万对话,但去标识化、跨行业泛化。客户可以用自己的数据微调,也可以直接用通用模型。
2024年初,公司披露了首批客户:两家印尼电商、一家菲律宾数字银行、一家新加坡远程医疗平台。没有一家来自欧美。
Sutanto解释:「情感计算的护城河不是算法,是语境。我们在热带季风气候区、高语境文化、多语言混杂的环境中训练了五年。这些经验无法通过翻译迁移到英语世界。」
她正在尝试一种更激进的开放策略:开源基础模型,但保留文化适配器作为付费服务。「让所有人都能检测到'愤怒',但理解'某种特定文化中的愤怒表达方式'需要专业知识。」
未解决的悖论
采访最后,我问Sutanto:如果情感本质是灰色的、流动的、不可完全命名的,那么任何试图测量它的系统,是否都在背叛这个本质?
她停顿了很久,然后引用自己五年前的项目命名:「Kelabu yang Kita Namai Rasa——'我们称之为感受的灰色'。关键词是'我们称之为'。命名是一种暴力,但也是理解的起点。问题不在于是否命名,而在于是否保持对命名局限性的自觉。」
她给我看Rasa Kelabu最新版本的系统提示词,最后一段是:
「你正在尝试理解一个人的情绪状态。你的输出是一种近似,不是真相。用户有权拒绝你的理解,有权要求人类介入,有权感到被误解。这些权利比你的准确率更重要。」
这段提示词不会出现在任何技术文档中。它是给模型看的,也是给团队看的。
Sutanto说,这是她创业以来写的最重要的一行代码。
如果你正在做或打算做情感计算相关的产品,可以访问Rasa Kelabu的开发者文档,看看他们如何处理"不可翻译的情绪"和"文化适配器的可解释性"。这些细节不会出现在论文里,但会决定你的产品是否能在特定语境中存活。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.