网易首页 > 网易号 > 正文 申请入驻

MoGraphGPT:基于模块化大模型与图形控制的2D交互场景创作

0
分享至



想要快速制作一款网页小游戏、交互式动画或是教学演示,却苦于复杂的代码逻辑与多元素交互调试?尽管如今大语言模型或 AI Agent 能帮我们写代码、搭建交互场景,但在处理多元素交互时往往极易出错,且纯文本的交互方式让人难以直观地调整视觉效果。

近日,来自香港浸会大学、香港科技大学、香港城市大学及深圳大学的研究团队共同提出了一款名为 MoGraphGPT 的创新系统。该系统结合了上下文感知模块化大模型与直观的图形化和精确化控制,让用户通过自然语言和简单的画布涂鸦,就能零代码快速搭建出逻辑复杂的 2D 交互场景。该研究成果最近已被计算机图形学与可视化领域顶级期刊 IEEE TVCG 录用。

论文作者包括:香港浸会大学传理学院互动媒体系助理教授叶卉,香港科技大学肖楚烽,香港城市大学创意媒体学院博士生冷佳业,以及深圳大学计算机与软件学院副教授徐鹏飞,通讯作者为香港科技大学艺术与机器创造力学部教授、代理系主任傅红波。该团队长期深耕于计算机图形学、人机交互和计算机视觉的交叉方向。



  • 论文标题:MoGraphGPT: Creating Interactive Scenes Using Modular LLM and Graphical Control
  • 作者:Hui Ye (HKBU/HKUST), Chufeng Xiao (HKUST), Jiaye Leng (CityU), Pengfei Xu (SZU), Hongbo Fu (HKUST)
  • 录用期刊:IEEE Transactions on Visualization and Computer Graphics (TVCG) 2026
  • 论文链接:https://ieeexplore.ieee.org/abstract/document/11410096

一、 研究背景:

LLM 生成交互场景的四大痛点

使用 LLM/Agent 可以直接生成 2D 交互场景(比如游戏,动画)或代码,在实际操作中,创作者通常会面临四个致命挑战:

1.代码质量堪忧:在处理多个元素(如主角、怪物、障碍物)的复杂交互逻辑时,LLM 容易生成不完整或存在错误的代码。

2.缺乏独立编辑性:LLM 的线性对话结构导致修改非常困难。比如只是想让平台移动,却可能不小心把原本静止的背景也带跑了。

3.图形控制缺失:仅靠文本很难精准描述空间信息。例如想让物体沿着特定的 S 型曲线运动,用文字描述极其痛苦且不准确。

4.精确控制极其繁琐:生成效果后,如果想微调速度、弹跳高度等参数,用户必须反复修改提示词进行盲盒式抽奖,极大地消耗耐心。



二、 核心技术:

MoGraphGPT 如何破局?

为了解决上述痛点,研究团队提出了 MoGraphGPT 的架构,带来了两项具有突破性的核心机制:

1. 上下文感知的 LLM 模块化

MoGraphGPT 摒弃了将所有需求丢给单一 LLM 的做法,采用了自顶向下的分层管理结构:

  • 专属独立模块(Individual LLM Modules):场景中的每个元素(如 “猴子”、“香蕉”)都有自己专属的 LLM 会话。用户可以独立调整单一元素的行为,完全不用担心破坏其他元素的代码。
  • 中心统筹模块(Central LLM Module):作为大管家,专门负责处理元素之间的交互(如 “猴子吃到香蕉加一分”)。各个独立模块会将其变量和函数精简为上下文(Context)供中心模块调用,实现了既独立互不干扰,又能完美协同的优雅逻辑。



2. 无缝融合的图形控制与 UI 精准微调

代码生成不应该是纯文本的黑盒,MoGraphGPT 赋予了用户强大的可视化和精准掌控力:

  • 指哪打哪的图形代理:用户可以在系统画布上直接标点、画直线、画曲线或圈出区域(P1, L1, C1, R1),然后在输入提示词时直接引用(例如:“让平台沿着 C1 曲线来回移动”)。系统会在底层自动将这些手绘图形转化为精确的坐标参数。
  • 自动生成的控制滑块:生成交互逻辑后,系统会利用专属 LLM 自动解析代码中的关键参数,并在界面右侧动态生成滑动条。用户想精确调整移动速度或重力大小?拖动滑块即可,所见即所得。



三、 效果与对比

为了验证系统的实际表现,研究团队与当前业界顶尖的 AI 编程助手 Cursor Composer 进行了对比实验:

  • 效率实现显著提升:在完成同样的交互场景还原任务时,MoGraphGPT 的平均耗时比 Cursor 缩短了约 73.8%。
  • 极大降低试错成本:用户所需要输入的提示词数量和文本长度分别大幅 减少了 68.4% 和 88.9%。在易用性、可控性与总体表现等主观评分上也显著提升。
  • 告别致命 Bug:基于 LLM-as-a-Judge 及真实编译环境的测试结果显示,MoGraphGPT 生成的代码在致命错误(Fatal)和严重错误(Major)数量上均远低于基线工具。



开放式创作:释放无界创意

在自由创作环节中,无论是完全没有编程基础的小白,还是经验丰富的游戏开发者,都能在 10 到 30 分钟内使用 MoGraphGPT 完整构建出各具特色的作品,涵盖了双人游戏、射击游戏、教学演示动画、学术论文动态插图以及网页交互 Demo 等多种应用。



四、 总结与展望

MoGraphGPT 巧妙地在大语言模型代码生成与可视化无代码编辑之间架起了一座桥梁。其核心的模块化 LLM 调度策略和图形化操控不仅解决了复杂场景下的代码耦合问题,也为未来多智能体协同生成复杂应用程序提供了一种全新的交互范式。

未来,团队将进一步探索如何支持更庞大场景的交互式创作,探索代码可见性分级,并验证其在更多专业级引擎中的管线对接潜力。

想要体验零代码创造世界的乐趣吗?欢迎阅读原论文获取更多技术细节!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国已被卷入美伊生死局!如果伊朗倒下,下一个将会是我们?

中国已被卷入美伊生死局!如果伊朗倒下,下一个将会是我们?

沙溪解说
2026-03-03 16:20:03
24GB+1TB+9000mAh!新机官宣:3月18日,正式发布!

24GB+1TB+9000mAh!新机官宣:3月18日,正式发布!

科技堡垒
2026-03-18 11:41:32
8年“大限”已到,第一批电车真成废铁了?只有这类车逃过一劫!

8年“大限”已到,第一批电车真成废铁了?只有这类车逃过一劫!

优视汽车
2026-03-18 18:51:10
19岁219天!贝利成为NBA历史0罚球得到30+最年轻球员

19岁219天!贝利成为NBA历史0罚球得到30+最年轻球员

北青网-北京青年报
2026-03-20 15:17:15
国乒新消息:3月19日世乒赛名单出炉!樊振东待抉择,王励勤发威

国乒新消息:3月19日世乒赛名单出炉!樊振东待抉择,王励勤发威

削桐作琴
2026-03-20 13:46:50
穷游壶口瀑布被投诉?景区:这是我司资产!网友:黄河是全民的

穷游壶口瀑布被投诉?景区:这是我司资产!网友:黄河是全民的

潮鹿逐梦
2026-03-19 11:33:25
等我们老了,最扎心的从不是病与死,而是这无声的“溃败”

等我们老了,最扎心的从不是病与死,而是这无声的“溃败”

青苹果sht
2026-03-18 05:35:16
以色列疯了,干出这种事!特朗普:我不知情!美国再砸2000亿美元

以色列疯了,干出这种事!特朗普:我不知情!美国再砸2000亿美元

张牧之
2026-03-19 19:35:59
1996年美军让中国防长操作M1A2坦克,本想看笑话,结果一片死寂

1996年美军让中国防长操作M1A2坦克,本想看笑话,结果一片死寂

鉴史录
2026-03-20 07:55:31
卧槽!老鹰攀上第6了,勇士后悔吗!最少库明加支棱起来了

卧槽!老鹰攀上第6了,勇士后悔吗!最少库明加支棱起来了

体育新角度
2026-03-19 22:08:27
美民调:5成大陆受访者认为任何情况不应军事统一,仅32%支持武统

美民调:5成大陆受访者认为任何情况不应军事统一,仅32%支持武统

混沌录
2026-03-20 20:06:11
上海终于动手了,支持老年人就业!什么时候轮到中年人?

上海终于动手了,支持老年人就业!什么时候轮到中年人?

黑企鹅观察
2026-03-20 14:00:41
俄油轮马上抵达中国,却在南海掉头把油送往印度,普京这回真笑了

俄油轮马上抵达中国,却在南海掉头把油送往印度,普京这回真笑了

福建平子
2026-03-19 11:49:00
外媒:特朗普证实五角大楼申请紧急追加2000亿军费,声称这是“小小的代价”

外媒:特朗普证实五角大楼申请紧急追加2000亿军费,声称这是“小小的代价”

环球网资讯
2026-03-20 10:11:12
无聊热议!"token"应该翻译成哪个中文词?

无聊热议!"token"应该翻译成哪个中文词?

AI先锋官
2026-03-19 16:13:18
伊朗的导弹为什么打不完?重要的不是库存有多少,而是伊朗手中有两张底牌!

伊朗的导弹为什么打不完?重要的不是库存有多少,而是伊朗手中有两张底牌!

健身狂人
2026-03-18 13:45:35
解放前的西藏有多黑暗?触目惊心,少女沦为玩物,农民不如耗牛

解放前的西藏有多黑暗?触目惊心,少女沦为玩物,农民不如耗牛

新一说史
2026-03-12 19:26:35
确诊肺部塌陷!他可是mvp前三啊!!

确诊肺部塌陷!他可是mvp前三啊!!

柚子说球
2026-03-20 00:07:29
毛新宇参观祖宅时突然发现家谱记载:原来毛主席是毛太华第20代孙

毛新宇参观祖宅时突然发现家谱记载:原来毛主席是毛太华第20代孙

老杉说历史
2026-03-14 20:54:20
李汉俊被捕即遭处决,妻子携三子深山避难二十年,子女皆成栋梁。

李汉俊被捕即遭处决,妻子携三子深山避难二十年,子女皆成栋梁。

唠叨说历史
2026-03-17 10:31:04
2026-03-20 20:59:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12555文章数 142588关注度
往期回顾 全部

科技要闻

新SU7只涨4千!雷军:真怕交车慢挨骂

头条要闻

美防长:盟友不知感恩 全世界都应对特朗普说声"谢谢"

头条要闻

美防长:盟友不知感恩 全世界都应对特朗普说声"谢谢"

体育要闻

6年前的一场悲剧,造就了“法国瓦尔迪”

娱乐要闻

总台首届电影盛典,“沈马”CP再合体

财经要闻

金融法草案向社会公开征求意见

汽车要闻

何小鹏坦白局:每月3亿的“慌”与通向L4的坚定

态度原创

时尚
家居
教育
健康
艺术

今日热点:张译张小斐担任天坛奖评委;《白日提灯》发布定档预告……

家居要闻

时空交织 空间绮梦

教育要闻

保护孩子的最好方法,就是让她懂得只认行为不认身份!

转头就晕的耳石症,能开车上班吗?

艺术要闻

吴昌硕『圆扇花卉』清新俊逸

无障碍浏览 进入关怀版