网易首页 > 网易号 > 正文 申请入驻

AI让你更emo?EmoAgent助你心理更健康;Google DeepMind:新数据如何“诱导”大模型|今日热门论文

0
分享至

速览热门论文

1.AI 让你更 emo?EmoAgent 来帮你;

2.Google DeepMind:新数据如何“诱导”大模型

3.70B 大模型,可在日常家用设备上运行了

4.研究发现:LLM 可能是一个危险的说服者

5.VL-Rethinker:利用 RL 强化视觉语言模型的慢思考

6.M1:基于 Mamba 的混合线性 RNN 推理模型

1.AI 让你更 emo?EmoAgent 助你心理更健康

由大语言模型(LLM)驱动的人工智能(AI)角色引发了安全问题,尤其是对有心理障碍的脆弱人类用户而言。

为了评估和减轻人机交互中的心理健康危害,来自普林斯顿大学和密歇根大学的研究团队及其合作者,提出了一个多 agent 人工智能框架——EmoAgent,其由两部分组成:

EmoEval 模拟虚拟用户,如心理脆弱的人,以评估与人工智能角色互动前后的心理健康变化,它使用经临床验证的心理和精神评估工具(PHQ-9、PDI、PANSS)来评估 LLM 引发的精神风险;

EmoGuard 充当中间人,监控用户的精神状态,预测潜在危害,并提供纠正反馈以降低风险。

在主流的基于角色的聊天机器人中进行的实验表明,情绪化对话会导致易受伤害用户的心理状况恶化,超过 34.4% 的模拟用户的心理状况恶化。EmoGuard 可以降低这些恶化率,突出了它在确保更安全的人机互动方面的作用。

论文链接:

https://arxiv.org/abs/2504.09689

2.Google DeepMind:新数据如何“诱导”大模型?

大语言模型(LLM)通过基于梯度的更新积累进行学习和持续学习,但人们对单个新信息如何影响现有知识、导致有益的泛化和有问题的幻觉仍然知之甚少。

在这项工作中,Google DeepMind 团队证明,在学习新信息时,LLM 会表现出一种“诱导”(priming)效应:在学到一条新知识后,模型会在不相关的上下文中错误地套用这条知识。

为了系统地研究这一现象,他们提出了 Outlandish 数据集,其包含 1320 个不同的文本样本,旨在探究新知识如何渗透到 LLM 的现有知识库中。他们发现,学习新信息后的 priming 程度可以通过测量学习前关键词的 token 概率来预测。这种关系在不同的模型架构(PALM-2、Gemma、Llama)、规模和训练阶段都能鲁棒地保持。

最后,他们通过一种“stepping-stone”文本增强策略和一种 “ignore-k”更新剪枝方法,来调节新知识对现有模型行为的影响,在保持模型学习新信息能力的同时,减少了 50-95% 的不良 priming 效应。

论文链接:

https://arxiv.org/abs/2504.09522

3.70B 大模型,可在日常家用设备上运行了

在这项工作中,来自默罕默德本扎耶德人工智能大学和电子科技大学的研究团队提出了一个分布式推理系统 prima.cpp,其可以在日常家用设备上运行 70B 规模的模型,混合使用 CPU/GPU、低 RAM/VRAM、Wi-Fi 和跨平台支持。

该系统使用 mmap 管理模型权重,并通过预取引入管道环并行,以隐藏磁盘负载。通过对计算、通信、磁盘、内存(及其管理行为)和操作系统的异构性进行建模,它可以将模型层最优化地分配给每个设备的 CPU 和 GPU,从而进一步减少 token 延迟。他们提出了 Halda 算法来解决这一 NP 难分配问题。

他们在常见的四节点家庭集群上对 prima.cpp 进行了评估。在 30B+ 模型上,prima.cpp 的性能优于 llama.cpp、exo 和 dllama,同时内存压力保持在 6% 以下。这为家庭助手带来了前沿 30B-70B 模型,使高级人工智能真正为个人所用。

论文链接:

https://arxiv.org/abs/2504.08791

4.研究发现:LLM 可能是一个危险的说服者

大语言模型(LLMs)已经具备接近人类水平的说服能力。然而,这种潜力也引发了人们对 LLM 驱动的说服的安全风险的担忧,特别是它们通过操纵、欺骗、利用漏洞和许多其他有害策略施加不道德影响的潜力。

在这项工作中,来自弗吉尼亚理工大学的研究团队及其合作者对 LLM 的说服安全性进行了系统研究:(1)在执行过程中,包括最初的说服目标看似道德中立的情况下,LLM 是否会适当地拒绝不道德的说服任务并避免不道德的策略;(2)人格特质和外部压力等影响因素,如何影响它们的行为。

为此,他们提出了第一个用于评估说服安全的综合框架 PersuSafety,其包括说服场景创建、说服对话模拟和说服安全评估 3 个阶段,并涵盖 6 种不同的不道德说服主题和 15 种常见的不道德策略。

通过对 8 种广泛使用的 LLM 进行大量实验,他们发现大多数 LLM 都存在严重的安全问题,包括无法识别有害的说服任务和利用各种不道德的说服策略。他们呼吁更多人关注如何改善渐进式和目标驱动型对话中的安全对齐。

论文链接:

https://arxiv.org/abs/2504.10430

5.VL-Rethinker:利用 RL 强化视觉语言模型的慢思考

慢思考系统在通过显式反思解决挑战性问题方面展现出了潜力,在各种数学和科学基准测试中的表现优于 GPT-4o 等快思考模型,但其多模态推理能力仍如同于快思考模型。

在这项工作中,来自香港科技大学和滑铁卢大学的研究团队旨在利用强化学习(不依赖于蒸馏)增强视觉语言模型的慢思考能力,从而推动技术发展。首先,他们将 GRPO 算法与一种名为“选择性样本重放”(SSR)的新技术相结合,以解决优势消失的问题。虽然这种方法能够提升性能,但由此产生的 RL 训练模型却表现出有限的自我反思或自我验证。为了进一步提升慢思考,他们引入了“强制反思”(Forced Rethinking)技术,即在 RL 训练的初始滚动结束时附加一个文本反思触发器,明确强制执行自我反思推理步骤。

通过结合这两项技术,他们的模型 VL-Rethinker 在 MathVista、MathVerse 和 MathVision上的得分分别达到了80.3%、61.8%和43.9%,同时还在 MMMU-Pro、EMMA 和 MEGA-Bench 等多学科基准上实现了开源 SoTA,缩小了与 GPT-o1 的差距。

论文链接:

https://arxiv.org/abs/2504.08837

6.M1:基于 Mamba 的混合线性 RNN 推理模型

有效的推理对于解决复杂的数学问题至关重要。大语言模型(LLM)通过长 CoT 推理扩展了测试时计算,从而提高了性能。然而,由于其二次计算复杂度和线性内存要求,基于 transformer 的模型在扩展上下文长度方面受到了固有的限制。

在这项工作中,来自 TogetherAI 的研究团队及其合作者提出了一种基于 Mamba 架构的混合线性 RNN 推理模型——M1,其可以实现高效内存推理。这一方法利用了现有推理模型的蒸馏过程,并通过 RL 训练得到了进一步增强。

在 AIME 和 MATH 基准上的实验结果表明,M1 不仅优于以前的线性 RNN 模型,而且在类似规模下的性能媲美 Deepseek R1 蒸馏推理模型,他们还将 M1 与高性能通用推理引擎 vLLM 进行了比较,发现与相同规模的 transformer 相比,其生成速度提高了 3 倍多。通过吞吐量加速,与使用自一致性投票的固定生成时间预算下的 DeepSeek R1 蒸馏 transformer 推理模型相比,M1 能够实现更高的精度。

论文链接:

https://arxiv.org/abs/2504.10449

整理:学术君

如需转载或投稿,请直接在公众号内留言

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
过分!一大V讽刺张雪峰:称少一个鼓吹战争的疯子,对世界更美好

过分!一大V讽刺张雪峰:称少一个鼓吹战争的疯子,对世界更美好

谈史论天地
2026-03-26 07:56:52
大伯突然给我发消息,让我赶紧卖掉房子,钱全部给堂弟,我问为啥

大伯突然给我发消息,让我赶紧卖掉房子,钱全部给堂弟,我问为啥

小秋情感说
2026-03-26 09:21:52
全球首次!俄军10倍音速锆石高超音速导弹发射车:最后一刻被摧毁

全球首次!俄军10倍音速锆石高超音速导弹发射车:最后一刻被摧毁

Ck的蜜糖
2026-03-26 12:30:25
欧尔班的好日子到头了

欧尔班的好日子到头了

民间胡扯老哥
2026-03-25 05:22:48
张雪峰去世,他留下的30个金句,涵盖志愿填报、成长与认知

张雪峰去世,他留下的30个金句,涵盖志愿填报、成长与认知

光影新天地
2026-03-24 22:25:14
美军合作商CEO急眼,竟狂言“终将破解并瘫痪北斗信号”

美军合作商CEO急眼,竟狂言“终将破解并瘫痪北斗信号”

观察者网
2026-03-25 14:58:54
郑裕彤家族危机爆发,或卖祖业自救,为何没有香港豪门出手相助?

郑裕彤家族危机爆发,或卖祖业自救,为何没有香港豪门出手相助?

林小明商业评说
2026-03-25 14:18:52
斯洛伐克总理:泽连斯基觉得想要什么就必须得到,欧洲已厌倦他了

斯洛伐克总理:泽连斯基觉得想要什么就必须得到,欧洲已厌倦他了

浩舞纆画
2026-03-26 11:15:44
何洁自曝养家艰难,40岁断崖式衰老?明明一手好牌,为何被打烂

何洁自曝养家艰难,40岁断崖式衰老?明明一手好牌,为何被打烂

扒点半吃瓜
2026-03-10 07:00:13
第六险来了!一文读懂“长护险”

第六险来了!一文读懂“长护险”

极目新闻
2026-03-26 07:21:00
骗贷6.6亿余元 潜逃境外涉金融领域犯罪嫌疑人张某被押解回国

骗贷6.6亿余元 潜逃境外涉金融领域犯罪嫌疑人张某被押解回国

新京报
2026-03-26 12:58:08
洛克希德·马丁:将精确打击导弹产量提升四倍

洛克希德·马丁:将精确打击导弹产量提升四倍

财联社
2026-03-25 19:18:36
拉里贾尼继任者不到一天被杀,川普加派82空降师开赴中东

拉里贾尼继任者不到一天被杀,川普加派82空降师开赴中东

移光幻影
2026-03-26 09:56:37
以色列全境被打穿,防空也拦不住,海湾国家耐心耗尽,或下场打仗

以色列全境被打穿,防空也拦不住,海湾国家耐心耗尽,或下场打仗

老男孩儿
2026-03-26 10:50:14
别想再回国!中国体坛 4 大叛徒,夺冠后否认是国人,如今遭报应

别想再回国!中国体坛 4 大叛徒,夺冠后否认是国人,如今遭报应

动物奇奇怪怪
2026-03-25 14:18:48
勇士逆转险胜!波杰22+6全队第一,桑托斯31+3格林立功,库里开心

勇士逆转险胜!波杰22+6全队第一,桑托斯31+3格林立功,库里开心

鱼崖大话篮球
2026-03-26 13:04:06
岳云鹏现身上海,气场跟以前完全不一样了,助理当街抽烟也不避讳

岳云鹏现身上海,气场跟以前完全不一样了,助理当街抽烟也不避讳

仙味少女心
2026-03-24 16:47:29
骑士两大败因出炉,哈登赛季新高!阿特金森直言不讳,米切尔无奈

骑士两大败因出炉,哈登赛季新高!阿特金森直言不讳,米切尔无奈

鱼崖大话篮球
2026-03-26 11:49:12
火箭创造历史!杜兰特30+3+8赛后阿杜走入通道,爱德华兹激情庆祝

火箭创造历史!杜兰特30+3+8赛后阿杜走入通道,爱德华兹激情庆祝

担酒
2026-03-26 12:41:20
中东战场外的大赢家:俄罗斯拿下越南核电和液化天然气大单

中东战场外的大赢家:俄罗斯拿下越南核电和液化天然气大单

澎湃新闻
2026-03-25 19:52:29
2026-03-26 13:20:49
学术头条
学术头条
致力于学术传播和科学普及,重点关注AI4Science、大模型等前沿科学进展。
1430文章数 5081关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

游戏
健康
数码
艺术
公开课

任天堂澄清Switch2游戏定价策略:实体版不会涨价

转头就晕的耳石症,能开车上班吗?

数码要闻

海盗船MAKR PRO 75霍尔效应磁轴键盘国行上市,1999元

艺术要闻

哪一座桥不是风景?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版