由德克萨斯农工大学工程学生开发的基于记忆的导航系统正在重新塑造人们对救援机器能力的期望。
这种人工智能驱动的机器人狗不仅仅是听从指令——它们能够看见、记住位置,并实时做出决策。
它是专门为混乱环境设计的,旨在支持搜救队、急救人员和灾难应对小组。“它理解语音命令,并利用人工智能和摄像头输入进行路径规划和物体识别,”团队在一份声明中表示。
研究人员表示,凭借先进的记忆、灵活的移动和语音控制,这款机器人提供的不仅仅是自动化——它承诺在关键任务中成为一个更聪明、更直观的伙伴。
上个月,麻省理工学院的研究人员 开发了一种人工智能系统,让机器人能够快速生成详细的3D地图,从而改善在危险、倒塌或灾难环境中的导航和响应,在这种情况下,每一秒都至关重要。
基于记忆的导航
该系统是一种地面机器人,搭载了由多模态大型语言模型驱动的基于记忆的导航框架。
该模型处理视觉输入,支持环境感知,并生成路线决策。它集成了图像捕捉、高级推理和路径优化,并与混合控制架构协同工作,能够既能制定长期战略,又能快速调整应对。
机器人导航随着时间的推移,从简单的基于地标的方法转变为使用多种传感器数据的先进计算系统。然而,不可预测且无结构的环境——如灾区、倒塌的建筑或偏远的地形——仍然对自主系统构成挑战,在这些环境下,灵活性、效率和快速决策是至关重要的。
研究人员强调,虽然机器人狗和基于语言模型的导航已经分别被研究过,但将定制的多模态语言模型与视觉记忆结合在一个通用的模块化平台上,代表了一种新颖的方向。
AI增强的探索
开发团队首先研究了该模型如何解读摄像头获取的视觉数据,并将这些信息转化为导航逻辑。在国家科学基金会的支持下,团队将这一能力与语音命令交互相结合,以展示视觉、记忆和语言是如何协同工作的。
根据研究人员的说法,这种机器人工作方式类似于人类在陌生环境中导航,将反应行为与有意识的规划相结合。它能够瞬间避开障碍物,同时利用高级推理,根据当前的视觉上下文和记忆来决定下一步行动。
德克萨斯农工大学的跨学科工程博士生Sanjaya Mallikarachchi在接受采访时表示:“展望未来,这种控制结构可能会成为类人机器人普遍采用的标准。”
机器人的记忆驱动导航系统使其能够记忆和重用之前走过的路线,从而减少重复探索,提高效率。这种能力在没有GPS信号或未映射的环境中尤为重要,因为快速可靠的移动对搜索和救援工作至关重要。
根据团队的说法,除了应急响应之外,潜在的应用非常广泛。医院、仓库和其他大型设施可以利用该系统来提高工作效率。同样的技术可以支持视力障碍人士的移动辅助,在危险区域进行侦察,或帮助安全地探索雷区及其他危险地形。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.