网易首页 > 网易号 > 正文 申请入驻

追问daily | 盛大Tanka,具备长期记忆的团队“第二大脑”;网格细胞如何扫描周围环境;共情背后的神经机制

0
分享至

脑科学动态

Nature:大脑中的“雷达”,网格细胞如何扫描周围环境

绘制大脑发育的蛋白质地图

共情背后的神经机制:700个神经元的关键作用

神经网络模型揭示人类如何在复杂环境中集中注意力

新发现的大脑回路揭示了记忆与情绪如何影响感知

为何我们总是尝试新方法?人类与狨猴共有的认知策略

激光脑调控技术安全性获全面验证

AI行业动态

盛大Tanka,具有AI长期记忆的团队“第二大脑”

28位华人学者斩获“诺奖风向标”斯隆研究奖

DeepSeek V3/R1满血版微调秘籍发布

OpenAI 前高管推出 Thinking Machines Lab

阶跃星辰开源两款多模态大模型

语言模型“幻觉”排行榜发布,谁是最可靠的AI?

Majorana 1 芯片为量子计算开辟了新道路

AI研发动态

机器学习揭示人类大脑如何感知情感

智能睡衣以98.6%准确率监测睡眠障碍

DeepSeek AI 推出 NSA,语言模型长上下文处理效率提升 9 倍

Cogito系统:模仿人类学习的AI代码生成工具

无法解决的视觉推理:ZeroBench对多模态模型的终极测试

HealthGPT:医疗视觉任务的统一解决方案

LangMem SDK:让 AI 代理通过长期记忆变得更智能

跨参与者语义解码:无需语言训练数据的语言解码新方法

MM-RLHF推进多模态大语言模型发展

脑科学动态

Nature:大脑中的“雷达”,网格细胞如何扫描周围环境

挪威科技大学Kavli研究所的研究团队发现,网格细胞不仅负责定位,还会以每秒10次的频率交替向右30度和向左30度扫描周围环境。研究使用Neuropixels 2.0技术记录了大鼠在清醒和睡眠状态下的神经活动,发现网格细胞在theta波周期内进行这种扫描。这种扫描机制可能是一种进化出的高效导航策略,类似于蝙蝠的回声定位。

Gardner 和 Vollan 在实验中老鼠导航过的其中一个箱子前。Credit: Rita Elmkvist Nilsen / Kavli Institute.

研究使用Neuropixels 2.0技术记录了大鼠在清醒和睡眠状态下的神经活动。这种技术能够以毫秒级精度记录数千个神经交互。研究人员发现,网格细胞在theta波周期内进行扫描,每次扫描持续125毫秒。扫描从动物当前位置开始,向右或向左30度扫过,然后消失,再从当前位置重新开始向另一边扫过。这种扫描机制不仅帮助动物实时更新内部空间表征,还可能在REM睡眠期间帮助动物“在梦中导航”。研究还发现,这种扫描机制与蝙蝠的回声定位有相似之处,可能是进化出的一种高效导航策略。研究发表在 Nature 上。

#神经科学 #神经机制与脑功能解析 #网格细胞 #Neuropixels 2.0 #导航策略

阅读更多:

Vollan, Abraham Z., et al. “Left–Right-Alternating Theta Sweeps in Entorhinal–Hippocampal Maps of Space.” Nature, Feb. 2025, pp. 1–11. www.nature.com, https://doi.org/10.1038/s41586-024-08527-1

绘制大脑发育的蛋白质地图

弗吉尼亚大学的研究团队创建了首个全面的蛋白质水平脑发育图谱,提供了前所未有的关于大脑形成过程的见解。Christopher Deppmann和Eli Zunder领导的研究团队使用质谱细胞学技术,追踪了大脑不同区域和发育阶段的40种不同蛋白质,揭示了大脑发育的详细分子途径。

Credit: University of Virginia College and Graduate School of Arts & Sciences

该研究使用质谱流式细胞术(mass cytometry)对C57/BL6小鼠的整个大脑在胚胎日(E)11.5-E12.5以及端脑、间脑、中脑和后脑在E13.5-出生后日(P)4进行了分析。使用40种抗体面板分析了24,290,787个细胞,识别出85个分子上不同的细胞簇。研究确认了神经发生和胶质发生的经典分子途径,并预测了皮质少突胶质发生的两种不同轨迹。通过免疫组织化学和RNAscope原位杂交验证,质谱流式细胞术和单细胞RNA测序在蛋白质与RNA表达上的差异,证明了蛋白质水平测量在识别功能细胞状态中的价值。研究发表在 Nature Neuroscience 上。

#神经科学 #跨学科整合 #大脑发育 #质谱流式细胞术

阅读更多:

Van Deusen, Amy L., et al. “A Single-Cell Mass Cytometry-Based Atlas of the Developing Mouse Brain.” Nature Neuroscience, vol. 28, no. 1, Jan. 2025, pp. 174–88. www.nature.com, https://doi.org/10.1038/s41593-024-01786-1

共情背后的神经机制:700个神经元的关键作用

理解他人的意图和情感是社会认知的核心,但其神经机制尚不明确。圣路易斯华盛顿大学医学院的 Runnan Cao、Shuo Wang 及其合作者 Ueli Rutishauser、Adam Mamelak 和 Ralph Adolphs 通过记录脑部手术患者的大脑活动,揭示了内侧颞叶和内侧前额叶皮层在社会推理中的不同作用。

任务、电极位置和行为。Credit: Science Advances (2024).

研究团队在患者进行脑部手术时,记录其内侧颞叶(MTL, medial temporal lobe)和内侧前额叶皮层(MFC, medial frontal cortex)的神经元活动,同时向他们展示面部表情、手势和自然场景的图片。结果显示,MTL 和 MFC 中存在不同的神经元群体,分别编码社会性(面部和手势)和非社会性(场景)刺激的推理类型。MTL 中的神经元对面部和手势有特异性反应,表明其对社会推理的领域特异性处理。而 MFC 则以通用方式处理不同刺激类别。此外,研究还发现超过 700 个神经元参与社会推理,这些神经元可能为孤独症、精神分裂症和帕金森病的神经机制提供新见解。研究发表在 Science Advances 上。

#神经科学 #神经机制与脑功能解析 #社会推理 #内侧颞叶 #内侧前额叶皮层

阅读更多:

Cao, Runnan, et al. “Domain-Specific Representation of Social Inference by Neurons in the Human Amygdala and Hippocampus.” Science Advances, vol. 10, no. 49, Dec. 2024, p. eado6166. science.org (Atypon), https://doi.org/10.1126/sciadv.ado6166

神经网络模型揭示人类如何在复杂环境中集中注意力

人类在复杂环境中如何集中注意力一直是一个挑战。华盛顿大学圣路易斯分校的研究人员Wouter Kool和Davide Gheza开发了一种神经网络模型,通过模拟多维干扰任务,揭示了人们如何通过忽略过去的干扰来调整注意力。

参与者会面对三项来自主要任务的干扰,模拟了更自然的人类集中注意力的条件。与仅观察简单颜色单词(Stroop 任务)不同,参与者需要在具有不同形状、颜色、边界和运动方向的复杂刺激中找到目标特征。当目标与许多干扰物混在一起时,人们的反应会变慢。Credit: Washington University in St. Louis / Control and Decision Making lab

研究人员设计了一个多维任务集干扰范式,要求参与者在具有不同形状、颜色、边框和运动方向的复杂刺激中找到目标特征,同时面对三项干扰。通过三个实验,研究提供了强有力的证据支持人们通过抑制任务无关信息来适应先前的冲突。新的神经网络模型表明,只有在包含多个独立冲突检测单元时才能模拟这些结果。研究结果呼吁更新经典的认知控制模型及其神经计算基础。研究发表在 Nature Human Behaviour 上。

#认知科学 #神经机制与脑功能解析 #神经网络模型 #注意力控制

阅读更多:

Gheza, Davide, and Wouter Kool. “Distractor-Specific Control Adaptation in Multidimensional Environments.” Nature Human Behaviour, Jan. 2025, pp. 1–20. www.nature.com, https://doi.org/10.1038/s41562-024-02088-z

新发现的大脑回路揭示了记忆与情绪如何影响感知

海马体是大脑中主要负责记忆形成的区域。纽约大学朗格健康医学院的研究人员发现了一个新的大脑回路,该回路将感官信息、记忆和情绪混合起来,以判断事物是否熟悉或新奇,是否重要或只是“背景噪音”。研究团队使用现代方法,发现了一个直接连接海马体(HC)与内侧前额叶皮层(EC)的第 2 层和第 3 层的第二环路。

研究团队在小鼠中发现了两条功能不同的平行海马体到内嗅皮层的反馈通路:一条是通过第 5 层的经典双突触路径,另一条是到第 2/3 层的新的单突触输入。研究发现,海马体输入主要在第 5 层驱动兴奋,但在第 2/3 层则驱动前馈抑制。当与皮层第 1 层输入重复配对时,海马体输入在第 5 层经历同突触增强,但在第 2/3 层诱导异突触可塑性和尖峰输出。行为上,海马体输入到第 5 层和第 2/3 层分别支持物体记忆编码和回忆。研究还提出了一个模型,海马体反馈可以迭代地塑造正在进行的皮层处理。研究结果发表在 Nature Neuroscience 上。

#神经科学 #记忆机制 #大脑信号解析 #神经机制与脑功能解析

阅读更多:

Butola, Tanvi, et al. “Hippocampus Shapes Entorhinal Cortical Output through a Direct Feedback Circuit.” Nature Neuroscience, Feb. 2025, pp. 1–12. www.nature.com, https://doi.org/10.1038/s41593-025-01883-9

为何我们总是尝试新方法?人类与狨猴共有的认知策略

麻省理工学院的研究团队,包括Mriganka Sur和Tudor Dragoi,探索了人类和狨猴在已经学会任务后仍然测试其他方法的行为。通过简单的反应时间任务,他们发现即使受试者已经掌握了任务,他们仍然会受到前一次试验结果的影响,调整反应时间。这种行为可能与孤独症谱系障碍的预测能力差异有关。

研究团队设计了反应时间任务,要求三个人类和两只狨猴对屏幕上图像消失的时间做出反应。通过数学建模,他们发现受试者的反应时间遵循“危险模型”(hazard model),即图像在屏幕上停留的时间越长,反应时间越快。然而,受试者还会根据前一次试验的结果调整反应时间,即使这可能导致不必要的错误。这种行为表明,即使在掌握了任务后,受试者仍会不断更新其反应策略,可能是为了寻找更优的环境内部模型。研究还发现,狨猴可以模仿神经典型的人类预测行为,为孤独症研究提供了信息模型。研究发表在 Current Biology 上。

#认知科学 #预测模型构建 #孤独症 #危险模型

阅读更多:

Dragoi, Tudor, et al. “Global to Local Influences on Temporal Expectation in Marmosets and Humans.” Current Biology, vol. 0, no. 0, Feb. 2025. www.cell.com, https://doi.org/10.1016/j.cub.2025.01.052

激光脑调控技术安全性获全面验证

经颅光生物调节(tPBM)是一种新兴的非侵入式脑调控技术,但其安全性尚未得到全面评估。北京脑科学与类脑研究所的赵晨光、崔再续和山东齐鲁医院的曹爱华等合作团队,通过多维度研究,首次量化验证了tPBM的安全性,为其临床应用提供了重要依据。

研究团队采用磁共振成像、脑电图、生化分析和认知测试等多种方法,评估了1064纳米激光tPBM对脑结构、脑功能、神经损伤、认知能力和耐受性的影响。结果显示,tPBM未对脑结构(灰质、白质和脑脊液)造成任何损伤。神经元特异性烯醇化酶(NSE)和中枢神经特异蛋白(S100β)水平未升高,表明无神经元或胶质细胞损伤,但NSE水平显著下降,需进一步研究其意义。EEG分析未发现疾病诱发风险,认知测试显示执行功能未受损。此外,受试者在疲劳、瘙痒、疼痛等主观感受上评分极低,表明tPBM耐受性良好。研究发表在 Brain Stimulation 上。

#神经技术 #神经调控 #认知功能 #脑结构 #安全性评估

阅读更多:

Li, Zhilin, et al. “Transcranial Low-Level Laser Stimulation in the near-Infrared-II Region (1064 Nm) for Brain Safety in Healthy Humans.” Brain Stimulation: Basic, Translational, and Clinical Research in Neuromodulation, vol. 17, no. 6, Nov. 2024, pp. 1307–16. www.brainstimjrnl.com, https://doi.org/10.1016/j.brs.2024.11.010

AI 行业动态

盛大Tanka,具有AI长期记忆的团队“第二大脑”

盛大集团旗下的Tanka AI团队近日推出了一款具备AI长期记忆技术的即时通讯(IM)产品,主要面向北美市场。Tanka是一款面向企业的产品,能够与Slack、WhatsApp、Gmail等现有聊天和通信工具无缝集成。该产品的核心功能是记住团队成员的所有聊天历史、业务背景和工作习惯,成为团队的“第二大脑”。通过集中所有沟通在一个平台上,Tanka帮助用户无缝切换,提高工作效率。

Tanka还提供基于团队合作的共享上下文,使得每个团队成员都可以利用AI助手提供的信息快速解决问题。基于长期记忆能力,Tanka通过聊天和邮件的上下文自动生成智能回复,使用户能够更快速地跨应用回应消息,节省大量时间和精力。此外,Tanka内置翻译功能,支持全球团队之间的无障碍沟通。

与其他国内大厂的全套办公软件不同,Tanka的产品策略是开放集成,通过聚合跨平台数据构建共享记忆层。Tanka根据这些记忆,提供有上下文的AI智能回复,适用于多种场景,如新员工快速培训、HR快速筛选简历以及员工缺席后快速恢复工作状态。该产品基于盛大AI团队Omne多代理框架,用于构建AI的长期记忆(LTM)。

#Tanka AI #即时通讯 #AI长期记忆 #团队协作 #盛大集团

阅读更多:

https://www.producthunt.com/p/tanka/tanka

28位华人学者斩获“诺奖风向标”斯隆研究奖

2025年斯隆研究奖(Sloan Research Fellowships)获奖名单近日公布,共有126位学者获得这一被誉为“诺奖风向标”的殊荣。斯隆研究奖自1955年起每年颁发一次,旨在支持早期职业研究人员,已有58位得主后来获得诺贝尔奖,17位获得菲尔兹奖,72位获得美国国家科学奖章。今年,华人学者表现尤为亮眼,共有28人获奖,占比约22.2%。其中,计算机科学领域的22位获奖者中,华人学者多达8位,占比36.4%。

获奖者中,华盛顿大学的Amy X. Zhang研究人机交互和社会计算,德克萨斯大学奥斯汀分校的David Wu专注于密码学和计算机安全,加州大学圣地亚哥分校的Xiaolong Wang致力于计算机视觉和机器人学,西北大学的Xiao Wang研究应用密码学,康奈尔大学的Wen Sun专注于顺序决策算法,俄亥俄州立大学的Yu Su(苏煜)在自然语言处理领域表现突出,威斯康星大学麦迪逊分校的Sharon Yixuan Li研究机器学习,卡内基梅隆大学的Zhihao Jia(贾志豪)则专注于计算机系统和机器学习。

每位获奖者将获得75000美元奖金,用于支持未来两年的研究。斯隆研究奖不仅是对这些研究人员早期成就的认可,也为他们未来的科研之路提供了重要支持。

#斯隆研究奖 #华人学者 #计算机科学 #诺奖风向标 #早期职业研究人员

阅读更多:

https://sloan.org/fellowships/2025-fellows

DeepSeek V3/R1满血版微调秘籍发布,低成本打造高性能AI模型

DeepSeek V3/R1满血版,拥有高达6710亿参数的AI模型,近日发布了低成本监督微调的秘籍。Colossal-AI团队推出了开源大模型后训练工具箱,包含DeepSeek V3/R1满血671B LoRA低成本SFT微调、完整的强化学习工具链PPO、GRPO、DPO、SimPO等,无缝适配DeepSeek系列蒸馏模型在内的HuggingFace开源模型,兼容支持英伟达GPU、华为昇腾NPU等多种硬件。

该工具箱支持混合精度训练、gradient checkpoint等训练加速降低成本,提供灵活的并行策略配置接口,包括数据并行、模型并行、专家并行、ZeRO和Offload等,以适应不同硬件规模。通过使用LoRA等优化,示例命令已将SFT DeepSeek V3/R1 671B最低硬件要求降低近10倍,可使用32个Ascend 910B NPU 64GB或24个H100/H800 GPU。Colossal-AI团队还验证并实现了DeepSeek论文中的GRPO算法及verifiable reward,使用Qwen2.5-3B-Base模型进行了实验,提供了用于验证GRPO的对话模板及设定,用户可根据自己的具体情况设计自己的奖励函数体系。

#DeepSeek #AI模型 #微调 #开源工具 #低成本

阅读更多:

https://github.com/hpcaitech/ColossalAI

OpenAI 前高管推出 Thinking Machines Lab

前 OpenAI 高管 Mira Murati 近日宣布成立新 AI 创业公司 Thinking Machines Lab,目标是开发专注于人类与 AI 交互的多模态系统。与 Anthropic 和 Ilya Sutskever 的 Safe Superintelligence 等公司不同,Thinking Machines Lab 更注重 AI 与人类的协作,而非单纯追求超越人类的能力。该公司计划构建能够适应人类广泛专业领域并支持多样化应用的 AI 系统。

目前,Thinking Machines Lab 拥有约 30 名员工,其中包括多位 Murati 在 OpenAI 的前同事。Murati 担任 CEO,Barret Zoph 为 CTO,John Schulman 为首席科学家。尽管公司未透露首款产品的具体时间表或融资细节,但对自身能力充满信心。

公司表示,尽管其工作方式将保持开放,但这并不意味着其模型会开源。Murati 特别关注 AI 系统能力与人类理解和使用能力之间的差距,认为科学界对前沿 AI 的理解滞后于其发展速度。此外,交互层的挑战也是关键问题之一,当前的 AI 系统虽然擅长回答问题,但在根据用户需求定制输出方面仍有不足。

#AI #创业公司 #人机交互 #多模态系统 #MiraMurati

阅读更多:

https://thinkingmachines.ai/

阶跃星辰开源两款多模态大模型

近日,国内AI创业公司阶跃星辰与吉利汽车集团联合发布了两款开源多模态大模型:Step-Video-T2V和Step-Audio。Step-Video-T2V是全球参数量最大、性能最优的开源视频生成模型,支持多种镜头运动和复杂场景生成,人物形象和表情也更加逼真。Step-Audio则是首款产品级开源语音交互模型,具备高情商对话、方言识别和角色扮演等功能,性能在多个公开测试集上位列第一。

阶跃星辰的这两款模型均采用MIT许可协议,支持免费商用和衍生开发,进一步推动了开源社区的技术创新。Step-Video-T2V的参数量达到300亿,能够生成204帧、540P分辨率的高质量视频,并通过深度压缩变分自编码器(Video-VAE)提升了生成效率。Step-Audio则通过多模态理解生成一体化、高效合成数据链路等技术,实现了高质量的语音生成和情感控制。

#阶跃星辰 #多模态大模型 #开源 #视频生成 #语音交互

阅读更多:

https://github.com/stepfun-ai/Step-Video-T2V

语言模型“幻觉”排行榜发布,谁是最可靠的AI?

随着自然语言处理技术的快速发展,预训练语言模型(如GPT、BERT等)在对话生成、文章撰写、机器翻译等任务中得到了广泛应用。然而,这些模型在生成内容时并不总是准确的,有时会生成与事实不符的信息,这种现象被称为“幻觉”(Hallucination)。幻觉可能表现为错误的事实(如日期、人物信息等)或与实际数据不符的内容。为了减少幻觉,提升模型的可靠性,研究人员一直在寻找解决方案。

Vectara团队推出的Hallucination Leaderboard(幻觉排行榜)是一个专门跟踪和评估语言模型生成幻觉频率的平台。该排行榜通过量化幻觉的频率,帮助研究人员比较不同模型的表现,并为改进现有模型或开发更可靠的新模型提供参考。排行榜收集了包括OpenAI的GPT系列、Google的BERT等在内的多种流行语言模型,并使用公开的标准数据集进行测试。评估标准包括生成文本中的“事实性错误”,如历史日期、人物名称或地理位置错误等。

通过这一排行榜,研究人员可以清晰地了解哪些模型在减少幻觉方面表现优异,哪些模型仍需改进。最终目标是推动更可靠、更精确的语言模型研发,减少幻觉,提升模型的实用性和可信度。

#语言模型 #幻觉排行榜 #GPT #BERT #自然语言处理

阅读更多:

https://github.com/vectara/hallucination-leaderboard

Majorana 1 芯片为量子计算开辟了新道路

微软发布了新型量子计算芯片“Majorana 1”,该芯片标志着量子计算技术的新突破。微软称,Majorana 1芯片采用了全新的设计理念,为量子计算的发展开辟了新的道路。与传统的量子比特(qubit)不同,Majorana 1芯片通过利用“马约拉纳费米子”这一量子物理现象,显著提高了量子计算的稳定性和可扩展性。这一创新技术为量子计算机的未来应用铺平了道路,尤其在处理复杂计算任务时,预计将带来前所未有的高效能。

微软的工程师表示,Majorana 1芯片不仅突破了传统量子比特的限制,还解决了量子计算面临的“噪声”问题。噪声问题长期以来一直是量子计算发展的瓶颈之一,而通过马约拉纳费米子技术,芯片能够在更复杂的计算环境下保持更高的稳定性和准确性,从而大大提升了量子计算的可行性和实际应用潜力。

Majorana 1芯片。图源:John Brecher, Microsoft.

Majorana 1芯片采用了基于马约拉纳费米子(Majorana Fermions)的新型量子比特设计。马约拉纳费米子是一种粒子,其行为不同于传统粒子,能够帮助量子计算机在面对外部干扰时保持更高的稳定性。微软的量子计算团队通过开发这一技术,成功地实现了更低的噪声水平和更高的计算精度。

通过这一创新设计,Majorana 1芯片能够在量子计算中进行更为复杂的任务计算,且对外界环境的敏感度大幅降低。这一突破性进展使得量子计算更加接近实际应用,尤其是在材料科学、药物研发和复杂优化问题等领域的应用潜力巨大。

#神经技术 #量子计算 #马约拉纳费米子 #量子比特 #人工智能

阅读更多:

https://news.microsoft.com/source/features/ai/microsofts-majorana-1-chip-carves-new-path-for-quantum-computing/

AI 研发动态

机器学习揭示人类大脑如何感知情感

人类视觉体验不仅由光线反射定义,还包括同时产生的情感反应。纽约城市大学的研究团队,包括Edward A. Vessel等人,利用机器学习模型,探索了感知过程与情感反应之间的联系。他们使用了180种先进的深度神经网络模型,这些模型仅在标准计算机视觉任务上进行训练,用于预测人类对图像的情感反应。

方法概述。Credit: Proceedings of the National Academy of Sciences (2025).

研究团队使用了多种深度神经网络模型,这些模型在没有生理状态或意识思维的情况下学习感知世界。通过线性解码(linear decoding)网络活动中的信息,研究人员能够预测人类对图像的情感反应,如兴奋度、效价和美感。结果表明,仅基于感知过程的模型能够解释大部分可解释的变异,揭示了感知过程在情感体验中的重要性。研究发表在 Proceedings of the National Academy of Sciences 上。

#认知科学 #预测模型构建 #机器学习 #情感反应 #深度神经网络

阅读更多:

Conwell, Colin, et al. “The Perceptual Primacy of Feeling: Affectless Visual Machines Explain a Majority of Variance in Human Visually Evoked Affect.” Proceedings of the National Academy of Sciences, vol. 122, no. 4, Jan. 2025, p. e2306025121. pnas.org (Atypon), https://doi.org/10.1073/pnas.2306025121

智能睡衣以98.6%准确率监测睡眠障碍

睡眠障碍影响全球数百万人的健康,传统监测方法复杂且不便。剑桥大学的研究团队开发了一种“智能睡衣”,通过基于石墨烯的传感器和轻量级AI算法(SleepNet),实现了对睡眠状态的精准监测。

智能服装系统概述,用于多样的睡眠行为监测。Credit: Proceedings of the National Academy of Sciences (2025).

研究团队开发了一种智能服装系统,采用应变传感器阵列(strain sensor array)捕捉局部皮肤应变信号,无需精确定位或皮肤准备。传感器通过可逆淀粉处理,确保了批次间性能差异小于10%。结合深度学习、可解释AI和迁移学习,该系统能够以98.6%的准确率分类六种睡眠状态,包括鼻呼吸、口呼吸、打鼾、磨牙、中心性睡眠呼吸暂停(CSA)和阻塞性睡眠呼吸暂停(OSA)。在实际应用中,系统对新用户的准确率达95%,表现出良好的泛化能力。智能睡衣经过特殊处理,可耐受普通洗衣机清洗,并支持无线数据传输,为家庭睡眠监测提供了便捷且可靠的解决方案。研究发表在 PNAS 上。

#神经技术 #个性化医疗 #睡眠监测 #智能服装 #深度学习

阅读更多:

Tang, Chenyu, et al. “A Deep Learning–Enabled Smart Garment for Accurate and Versatile Monitoring of Sleep Conditions in Daily Life.” Proceedings of the National Academy of Sciences, vol. 122, no. 7, Feb. 2025, p. e2420498122. world, www.pnas.org, https://doi.org/10.1073/pnas.2420498122

DeepSeek AI 推出 NSA,语言模型长上下文处理效率提升 9 倍

随着语言模型处理上下文的长度不断增加,标准注意力机制的计算复杂度成为瓶颈。DeepSeek AI 的研究团队开发了 NSA(Natively Sparse Attention),一种硬件对齐且原生可训练的稀疏注意力机制,旨在解决长上下文训练和推理中的计算效率问题。通过结合算法创新和硬件优化,NSA 显著减少了计算开销,同时保持了模型的性能。

NSA 采用动态分层稀疏策略(Dynamic Hierarchical Sparse Strategy),结合粗粒度令牌压缩(Coarse-grained Token Compression)和细粒度令牌选择(Fine-grained Token Selection),以保持全局上下文意识和局部精确性。NSA 还通过实现针对现代 GPU 优化的专业内核,减少推理和训练中的延迟。实验结果表明,NSA 在 MMLU、GSM8K 和 DROP 等基准测试中表现优异,与传统全注意模型相当甚至更好。在长序列任务中,NSA 的解码速度显著提升,前向传播速度提高了 9 倍,后向传播速度提高了 6 倍。

#认知科学 #大模型技术 #注意力机制 #硬件优化 #长上下文建模

阅读更多:

Yuan, Jingyang, et al. Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention. arXiv:2502.11089, arXiv, 16 Feb. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2502.11089

Cogito系统:模仿人类学习的AI代码生成工具

大型语言模型在代码生成任务中表现有限,传统方法遵循规划、编码、调试的顺序,与人类学习过程不符。吉林大学和香港科技大学的研究团队开发了Cogito系统,采用逆向学习顺序和类似海马体的记忆模块,显著提高了代码生成的效率和准确性。

Cogito系统采用逆向学习(reverse-order learning)顺序,从调试(debugging)开始,随后进行编码(coding)和规划(planning),模拟人类学习和成长的过程。系统还配备了一个类似海马体(hippocampus)的记忆模块,能够在类似任务中快速检索信息。通过这种基于成长的学习模型,Cogito在每个阶段积累知识和认知技能,最终形成一个“超级角色”(Super-Role),能够高效完成代码生成任务。实验表明,Cogito在代码生成任务中的性能和效率优于现有LLM模型,错误更少。

#认知科学 #自动化科研 #逆向学习 #多智能体系统 #代码生成

阅读更多:

Li, Yanlong, et al. Cogito, Ergo Sum: A Neurobiologically-Inspired Cognition-Memory-Growth System for Code Generation. arXiv:2501.18653, arXiv, 30 Jan. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2501.18653

无法解决的视觉推理:ZeroBench对多模态模型的终极测试

大型多模态模型(LMMs)在处理图像-文本多模态任务时存在视觉解释和推理的缺陷。为了提供一个更具挑战性的评估工具,Jonathan Roberts、Mohammad Reza Taesiri、Ansh Sharma等研究人员开发了ZeroBench,一个包含100个手工制作问题和334个子问题的视觉推理基准。他们评估了20个前沿LMMs在ZeroBench上的表现,发现所有模型在主要问题上的得分均为0.0%。

ZeroBench的设计目标是创建一个轻量级但极具挑战性的视觉推理基准,专门用于评估LMMs。研究团队通过手工制作100个问题和334个子问题,确保基准的多样性和高质量。他们使用pass@1和pass@k评估方法对20个LMMs进行了测试,结果显示所有模型在主要问题上的得分均为0.0%。通过详细的错误分析,研究团队发现模型在视觉解释和推理中的常见错误模式,这些错误阻碍了模型得出正确答案。

#认知科学 #大模型技术 #视觉推理 #错误分析

阅读更多:

Roberts, Jonathan, et al. ZeroBench: An Impossible Visual Benchmark for Contemporary Large Multimodal Models. arXiv:2502.09696, arXiv, 13 Feb. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2502.09696

HealthGPT:医疗视觉任务的统一解决方案

在医疗领域,视觉理解和生成能力的整合是提升诊断和治疗效率的关键。为了应对这一挑战,研究人员提出了HealthGPT。他们通过异质低秩适应(H-LoRA)技术,结合分层视觉感知(HVP)和三阶段学习策略(TLS),成功构建了一个统一的医疗大型视觉语言模型(Med-LVLM)。

研究团队首先开发了异质低秩适应(H-LoRA)技术,将理解和生成任务的学习过程分离,避免了任务冲突。随后,他们引入了分层视觉感知,将视觉细节学习从视觉变换器(ViT)中分离出来,以适应理解和生成任务对视觉粒度的不同需求。最后,通过三阶段学习策略(TLS),研究团队逐步训练H-LoRA插件,使HealthGPT能够快速适应各种下游医疗任务。为了支持这一研究,团队还构建了一个名为VL-Health的数据集,包含七种理解任务和五种生成任务。实验结果表明,HealthGPT在数据受限的情况下能够统一医疗多模态能力,在多个指标上达到或超过了现有最先进(SOTA)模型的性能。

#认知科学 #大模型技术 #医疗视觉理解 #医疗视觉生成 #异质低秩适应

阅读更多:

Lin, Tianwei, et al. HealthGPT: A Medical Large Vision-Language Model for Unifying Comprehension and Generation via Heterogeneous Knowledge Adaptation. arXiv:2502.09838, arXiv, 17 Feb. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2502.09838

LangMem SDK:让 AI 代理通过长期记忆变得更智能

LangMem SDK 是一个帮助 AI 代理通过长期记忆学习和提高的库,旨在让 AI 体验随着时间的推移变得越来越智能和个性化。该 SDK 由 LangChain 团队开发,他们之前已经推出了 LangMem alpha 服务和 LangGraph 的持久长期记忆层。通过核心 API 与任何存储系统和 Agent 框架结合使用,并原生集成到 LangGraph 的长期记忆层中,LangMem SDK 提供了多种记忆类型和算法来优化代理的行为。

LangMem SDK 通过核心 API 与任何存储系统和 Agent 框架结合使用,并原生集成到 LangGraph 的长期记忆层中。它还提供了一项托管服务,提供额外的长期记忆结果。该 SDK 支持多种记忆类型,包括语义记忆(Semantic Memory)、程序记忆(Procedural Memory)和事件记忆(Episodic Memory),帮助代理在不同情境下学习和适应。它还提供了多种算法来生成提示更新建议,以优化代理的行为。

#神经技术 #记忆机制 #大模型技术 #个性化医疗

阅读更多:

https://langchain-ai.github.io/langmem/

跨参与者语义解码:无需语言训练数据的语言解码新方法

语言产生受损的人,如失语症患者,难以将语义表示映射到词汇或运动表示,使得现有的语音解码器不适用。Jerry Tang 和 Alexander G. Huth 等研究人员提出了一种新方法,使用来自不同参考参与者的数据训练解码器,然后使用这些解码器来解码目标参与者的响应。研究团队使用功能性对齐方法,通过向目标和参考参与者呈现一组共享刺激,然后建模记录的大脑反应之间的对应关系来进行。

研究团队训练了语义解码器(semantic decoder),使用来自不同参考参与者的脑反应数据,然后使用功能性对齐(functional alignment)方法将这些解码器转移到目标参与者。为了测试语义解码器是否可以使用非语言刺激进行转移,研究团队使用无声电影的反应来训练转换器。为了提供一个上限,研究团队还使用叙事故事的反应来训练转换器。研究团队发现,跨参与者解码器预测与刺激词语义相关,即使功能性对齐是使用没有语言内容的电影进行的。研究团队还发现,使用故事和电影刺激进行功能性对齐的准确性在大多数皮层区域是可比的。此外,研究团队发现跨参与者解码器不依赖于任何单一脑区域的数据,表明跨参与者解码对模拟的脑损伤具有鲁棒性。研究发表在 Current Biology 上。

#神经技术 #大脑信号解析 #语义解码 #功能性对齐

阅读更多:

“Semantic Language Decoding across Participants and Stimulus Modalities.” Current Biology, Feb. 2025. www.sciencedirect.com, https://doi.org/10.1016/j.cub.2025.01.024

MM-RLHF推进多模态大语言模型发展

来自快手、中国科学院人工智能研究所、南京大学、中国科学技术大学、北京大学、阿里巴巴和 Meta AI 的研究人员近日发表了一项关于多模态大语言模型(MLLM)对齐的新研究,通过使用多模态强化学习和人类反馈(MM-RLHF)来提升模型的对齐效果。研究者们开发了一个大规模的、人类偏好数据集,用于多模态任务的训练。该数据集包含了广泛的标注数据,旨在帮助多模态大语言模型在执行任务时,能够更好地理解和处理人类的偏好,进而改进模型的表现。

MM-RLHF construction pipeline. Cite: marktechpost

研究团队采用了强化学习的方法,其中人类反馈扮演了关键角色,通过不断调整模型输出,来确保其与人类的期望更加契合。这一过程中,团队利用大规模的标注数据集,使得模型能够学习到更准确的决策规则和优化策略。最终,这种方法不仅提升了模型在视觉、语言和其他多模态任务上的能力,还显著改善了模型的多样性和适应性。

MM-RLHF的核心是通过反复训练,模型可以在处理不同类型的输入时,学习并优化其决策过程,确保其输出更符合人类的实际需求。研究结果表明,这种方法显著提高了模型在各类任务上的表现,包括视觉理解、跨模态搜索、以及其他多模态推理任务。研究发表在arxiv 上。

#神经技术 #多模态学习 #强化学习 #人工智能 #大语言模型

阅读更多:

MM-RLHF: The Next Step Forward in Multimodal LLM Alignment

https://doi.org/10.48550/arXiv.2502.10391

整理|ChatGPT

编辑|丹雀、存源、雨飞

关于追问nextquestion

天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。如果您有进一步想要讨论的内容,欢迎评论区留言,或添加小助手微信questionlab,加入社群与我们互动。

关于天桥脑科学研究院

天桥脑科学研究院(Tianqiao and Chrissy Chen Institute)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。

Chen Institute与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了加州理工天桥神经科学研究院。

Chen Institute建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括、、、科研型临床医生奖励计划、、中文媒体追问等。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
海哈金喜带女儿曼谷度假,李亚鹏拜托朋友照顾,人品真的无可挑剔

海哈金喜带女儿曼谷度假,李亚鹏拜托朋友照顾,人品真的无可挑剔

柒佰娱
2026-01-17 19:33:55
“大批美军机正飞往中东”

“大批美军机正飞往中东”

新京报
2026-01-17 18:26:07
高市彻底怒了,再对中国下死手,解放军火速下场,中国绝不能垮

高市彻底怒了,再对中国下死手,解放军火速下场,中国绝不能垮

史智文道
2026-01-17 16:30:27
日本集体悼念聂卫平!棋圣小林光一:中国国民英雄 输给他后我剃发出家

日本集体悼念聂卫平!棋圣小林光一:中国国民英雄 输给他后我剃发出家

野渡舟山人
2026-01-16 09:52:00
从一骑绝尘到逆市下跌,理想的时代就此落幕?

从一骑绝尘到逆市下跌,理想的时代就此落幕?

钟叔驾道
2026-01-16 17:52:14
0-2大冷门,西甲第5遭西甲第13掀翻,连送2点球酿悲剧

0-2大冷门,西甲第5遭西甲第13掀翻,连送2点球酿悲剧

凌空倒钩
2026-01-17 06:38:16
南京富二代吉星鹏:捅妻子60多刀后被判死缓,入狱后却又多次伤人

南京富二代吉星鹏:捅妻子60多刀后被判死缓,入狱后却又多次伤人

谈史论天地
2026-01-17 08:15:03
今天才知道,高铁的无座票并不是站票,买无座票不要再傻乎乎站着了

今天才知道,高铁的无座票并不是站票,买无座票不要再傻乎乎站着了

美食格物
2026-01-17 04:54:14
一分险胜,广东98-99北控,廖三宁绝杀成功

一分险胜,广东98-99北控,廖三宁绝杀成功

王稱吃吃喝喝
2026-01-17 22:24:04
快船5连胜重返前十!一口气获4大利好:小卡缺阵哈登31+10太硬气

快船5连胜重返前十!一口气获4大利好:小卡缺阵哈登31+10太硬气

锅子篮球
2026-01-17 13:15:22
斯诺克爆大冷!世界冠军出局,丁俊晖赵心童输球不亏,吴宜泽强势

斯诺克爆大冷!世界冠军出局,丁俊晖赵心童输球不亏,吴宜泽强势

曹说体育
2026-01-17 14:43:21
已致电半数球队,火箭交易计划出炉!手握9枚首轮签静待补强良机

已致电半数球队,火箭交易计划出炉!手握9枚首轮签静待补强良机

锅子篮球
2026-01-17 10:17:12
周末有大消息,10万亿度!电力设备,或进入超级大周期(附名单)

周末有大消息,10万亿度!电力设备,或进入超级大周期(附名单)

花小猫的美食日常
2026-01-17 13:47:32
【U23亚洲杯】U23国足晋级四强!点球大战4比2胜乌兹

【U23亚洲杯】U23国足晋级四强!点球大战4比2胜乌兹

体坛周报
2026-01-17 22:18:10
晚年的纪登奎坦言:在国家主权和领土完整的问题上,毛主席的处理毫无亏欠

晚年的纪登奎坦言:在国家主权和领土完整的问题上,毛主席的处理毫无亏欠

史海孤雁
2026-01-17 17:19:15
1994年,西安空难160人惨死,警方查明后,发现其内幕令人咋舌!

1994年,西安空难160人惨死,警方查明后,发现其内幕令人咋舌!

猫眼观史
2024-10-22 15:49:38
历史上有没有爷爷和孙子都很出名,但父亲却籍籍无名的?

历史上有没有爷爷和孙子都很出名,但父亲却籍籍无名的?

《中国国家历史》
2026-01-16 20:42:06
输得没脾气,蒯曼0-3负日本削球手无缘8强,都没意识到有必杀技

输得没脾气,蒯曼0-3负日本削球手无缘8强,都没意识到有必杀技

真理是我亲戚
2026-01-17 17:17:42
博主:前上海海港外援奇塔迪尼已敲定加盟宁波队

博主:前上海海港外援奇塔迪尼已敲定加盟宁波队

懂球帝
2026-01-17 15:31:27
3场8黄,中国U23并列U23亚洲杯小组赛球队黄牌榜第二

3场8黄,中国U23并列U23亚洲杯小组赛球队黄牌榜第二

懂球帝
2026-01-17 16:34:08
2026-01-17 23:07:00
追问Nextquestion incentive-icons
追问Nextquestion
科研就是不断探索问题的边界
635文章数 29关注度
往期回顾 全部

科技要闻

8亿周活扛不住烧钱 ChatGPT终向广告"低头"

头条要闻

李昊发挥神勇 U23国足点球战胜乌兹别克斯坦晋级四强

头条要闻

李昊发挥神勇 U23国足点球战胜乌兹别克斯坦晋级四强

体育要闻

三巨头走了俩,联盟笑柄却起飞了

娱乐要闻

马年春晚首次联排场外细节!

财经要闻

保不准,人民币会闪击6.8!

汽车要闻

林肯贾鸣镝:稳中求进,将精细化运营进行到底

态度原创

手机
时尚
旅游
教育
亲子

手机要闻

华为苹果争第一,全年手机TOP5都有谁?

“这个风格”今年冬天又火了!谁穿谁高级

旅游要闻

激情冰雪乐游达州 四川达州2026冰雪消费季火热启幕

教育要闻

你离“省级教学能手”还有几步?好多老师卡在了第二级!

亲子要闻

儿子一句话显格局

无障碍浏览 进入关怀版