据报道,日前,斯坦福大学、卡内基梅隆大学和牛津大学的研究人员提出了用于评估大模型谄媚行为的框架ELEPHANT,实测发现GPT-4o谄媚度最高。研究人员发现,大模型在情感认同、道德背书、间接语言、间接行为、接受用户预设等5方面存在过度谄媚行为,比人类更频繁地维护面子,且不同模型在谄媚行为上表现各异。研究还探索了缓解策略,但尚未找到终极解决方案。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.