(原标题:Google正在教AI如何“跑酷”,跑姿有点好笑)
罗骢
比起赢下围棋和通关游戏,如何让AI理解什么是后空翻的目标?
对于AI来说,围棋和一些雅达利的老游戏一样,虽然规则复杂,但目标还是很清晰——就是赢。但你如何让AI理解完成一个后空翻的目标,或者让它理解,“完美的跳跃”意味着什么?
Google研究人工智能的子公司DeepMind最近试图攻破这个难题,它的办法是让AI在复杂的环境里“运动”。
DeepMind最近在博客上放出一篇技术文章,标题是《AI如何用灵活的方式通过复杂的环境》,研究人员构建了一个从头到脚模拟人类关节的棒状小人,然后在不给予具体指令的方式下,要求它们通过障碍到达终点。
这些火柴小人会不断试错,并改进动作,用更效率的跳跃,转弯,下蹲动作向前奔跑。当然从结果来看,有一种古怪的趣味感。
研究的团队指出:“在教会人工智能学习运动时,对复杂行为的精确描述往往是最为困难的。”
为了让人工智能自发地模拟更流畅和复杂的动作,Deepmind采用了“反馈学习算法”,程序员不会限制人工智能的行动,而是让他们自己尝试通过矮墙,平板等挑战。顺利通过就会获得奖励,而比上一次通过花费时间更少则会奖励更多。人工智能会逐渐调整自己的关节,用更好的方式来完成目标。
Deepmind这次发布了三篇论文来展示学习人类行动的AI方案,虽然仅仅只是模拟相对简单的奔跑和运动,研究人员希望AI可以在未来自主地理解更加复杂多变的现实世界,而不是纯粹的数据世界。并且能在障碍很多的现实世界里流畅地行走和奔跑。
所以未来《西部世界》里那些灵活的机器人,说不定就是现在动图里这些古怪又有趣的棒状小人?
