麻省理工学院的研究人员利用41000个CAD界面操作视频训练了一个人工智能系统,以教导它人类如何设计物体。
![]()
麻省理工学院的工程师们正在开发一种能够像人类设计师一样操作CAD软件的人工智能模型。该系统接收一个二维草图,通过点击软件内的按钮和导航菜单,将其转化为三维模型。
该项目旨在降低CAD软件陡峭的学习曲线,使设计工作更快、更易于上手。
研究团队创建了一个名为VideoCAD的新数据集。该数据集包含超过41000个实例,展示了设计师如何在CAD工具内部构建三维模型。
这些视频记录了塑造物体时的每一次点击、拖拽和选择。通过研究这些数据,人工智能得以学习人类如何操作CAD界面来创建零件和物体。
工程师们将此视为通往"CAD协同设计助手"的一条路径,该助手可以在建模工作中为用户提供支持。
这样的系统不仅可以根据草图生成三维设计,还能建议后续步骤或自动化重复性操作。
"人工智能有机会提高工程师的生产力,同时让更多人能够使用CAD软件,"麻省理工学院机械工程系研究生加迪·内姆表示。
研究人员称,这有助于初学者更快上手。
"这一点很重要,因为它降低了设计的入门门槛,帮助那些没有多年CAD培训经验的人更容易地创建三维模型,并激发他们的创造力,"麻省理工学院机械工程系副教授法伊兹·艾哈迈德补充道。
逐点击建模
该团队基于人工智能驱动的用户界面代理的最新进展进行构建。这些代理已经能够使用电子表格或浏览器等软件来执行任务。
然而,CAD需要复杂得多的交互。工程师必须选择精确的工具、选取区域、缩放、调整角度,然后执行形状操作。
为了教会人工智能这些详细步骤,团队首先研究了一个现有的人类设计的CAD物体数据集。
每个设计都包含高级命令,如"草图直线"或"拉伸"。但这些命令还不够。一个真正的代理必须理解每个指令背后精确的用户界面交互。
研究人员开发了一个系统,将这些命令映射到真实的屏幕操作上。
内姆解释了该方法 —— "例如,假设我们通过从点1画一条线到点2来绘制了一个草图。我们将这些高级动作转换为用户界面动作,也就是说,我们指示系统,在选中'直线'操作的情况下,从第一个像素位置移动并点击,然后移动到第二个像素位置并点击。"
这个映射过程产生了超过41000个训练视频。每个视频都捕捉了一个完整的建模序列,实时显示每一个用户界面操作。
随后,团队利用VideoCAD数据集,在这些示例上训练了他们的模型。
迈向CAD协同设计助手
经过训练后,该人工智能能够接收一个简单的二维草图并直接操作CAD软件。它通过点击、拖拽和选择工具来构建正确的三维形状。
该系统适用于简单物体以及像房屋布局这样更复杂的结构。团队目前正在针对更困难的设计对其进行训练。
业界研究人员看到了这种方法的潜力。
"VideoCAD是迈向AI助手宝贵的第一步,这些助手可以帮助新用户上手,并自动化那些遵循熟悉模式的重复性建模工作,"欧特克研究院高级研究科学家迈赫迪·阿塔伊表示。
他指出,未来的系统可以支持多个CAD平台和更高级的工作流程。
如果朋友们喜欢,敬请关注“知新了了”!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.