网易首页 > 网易号 > 正文 申请入驻

专用于理解游戏场景的开源大模型-VideoGameBunny

0
分享至

大模型在游戏开发领域扮演了重要角色,从AI机器人生成到场景搭建覆盖各个领域。但在游戏场景理解、图像识别、内容描述方面很差。

为了解决这些难题,加拿大阿尔伯塔的研究人员专门开源了一款针对游戏领域的大模型VideoGameBunny(以下简称“VGB”)。

VGB可以作为视觉AI助理,能够理解游戏环境并提供实时反馈。例如,在探索型的3A游戏中,可以帮助玩家识别关键物品或进行问答,帮助玩家能够更快地掌握游戏技巧,从而增强游戏的互动性和沉浸感。

VGB也可以通过分析大量的游戏图像数据,够检测到图形渲染的错误、物理引擎的不一致性等,帮助开发人员快速识别和修复游戏中的bug和异常。

开源地址:https://huggingface.co/VideoGameBunny/VideoGameBunny-V1/tree/main

VGB是基于Bunny模型(高性能低消耗版本)基础之上开发而成,这个模型的设计方法类似于LLaVA,采用多层感知器网络作为投影层,将来自强预训练视觉模型的视觉嵌入转化为图像标记,供语言模型处理,可有效利用了预训练的视觉和语言模型使它们能够高效地协同处理数据。

Bunny模型支持最高1152×1152像素的图像分辨率,这在处理视频游戏图像时非常重要,因为游戏画面通常包含从UI图标到大型物体等不同尺寸的视觉元素。多尺度特征的提取有助于模型捕捉这些元素,从而提高对游戏内容的理解能力。

为了使VGB能够更好地理解和处理游戏的视觉内容,研究人员使用了Meta开源的LLama-3-8B作为语言模型,并结合了SigLIP视觉编码器以及S2包装器。这种多尺度特征提取方法能够捕捉游戏中不同尺度的视觉元素,从微小的用户界面图标到大型游戏对象,从而为模型提供了丰富的上下文信息。

此外,为了生成和游戏图像相匹配的指令数据,研究人员使用了多种先进的模型,包括Gemini-1.0-Pro-Vision、GPT-4V、GPT-4o等,以生成不同类型的指令。这些指令包括简短的标题、详细的标题、图像到JSON的描述以及基于图像的问答等,可以帮助模型更好地理解和响应玩家的查询和命令。

在模型训练方面,VGB使用了比较流行的LoRA参数高效微调方法,允许模型在保持预训练权重的同时,对特定任务进行微调,从而在不显著增加计算成本的情况下提高模型的性能。此外,研究团队还使用了PEFT库来指导模型的训练过程,进一步提升了训练的高效性和稳定性。

训练数据方面,研究人员收集了来自413款不同游戏的超过185,000多张图像以及将近39万个图像-指令对,涵盖了图像说明、问答对以及136,974张图像的JSON表示。

JSON格式的数据包含了16个元素,能够捕捉图像的多层次细节信息,包括整体概述、具体的人物描述、天气信息、用户界面和玩家库存的摘要、场景中的物体、照明和环境效果等。

为了创建图像到JSON的数据集,研究团队使用Gemini-1.5-Pro结合特定的指示,将给定的图像转换成一个具有层次结构细节和信息的JSON文件。

研究人员认为,全球游戏市场总额超过3000亿美元,在游戏开发、性能测试、提升游戏体验等方面对大模型有着巨大需求,VGB是可以辅助开发人员以及玩家达到这些目的。

本文素材来源VGB论文,如有侵权请联系删除

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
小姑子把一碗汤泼我头上,全家都在笑,一周后她的饭店全关门停业

小姑子把一碗汤泼我头上,全家都在笑,一周后她的饭店全关门停业

千秋文化
2026-03-02 20:56:45
解放前的成都原来还有这么雄伟壮观的城墙,那时候通惠门还在!

解放前的成都原来还有这么雄伟壮观的城墙,那时候通惠门还在!

史之铭
2026-01-08 07:47:12
甲骨文创始人埃里森给所有AI公司判死刑:你们的模型,一文不值

甲骨文创始人埃里森给所有AI公司判死刑:你们的模型,一文不值

可达鸭面面观
2026-03-03 16:32:48
手机建议买口碑好的,目前接近零差评的3款手机,512GB可以闭眼入

手机建议买口碑好的,目前接近零差评的3款手机,512GB可以闭眼入

科技阿维
2026-03-03 20:53:44
迪班萨冲击状元生变数!自曝今年可能不参选 我妈想让我大学毕业

迪班萨冲击状元生变数!自曝今年可能不参选 我妈想让我大学毕业

罗说NBA
2026-03-04 08:27:27
中国石油,A股市值重回第一

中国石油,A股市值重回第一

金融界
2026-03-04 17:17:23
一场战争把中国打醒!美军最毒的不是装备,中国用30年才真正看清

一场战争把中国打醒!美军最毒的不是装备,中国用30年才真正看清

达文西看世界
2026-03-02 14:25:12
突发!阿里Qwen多位负责人离职 团队或将分拆

突发!阿里Qwen多位负责人离职 团队或将分拆

CNMO科技
2026-03-04 09:48:13
AI,成核心卖点,苹果新款,MacBook,开放预订

AI,成核心卖点,苹果新款,MacBook,开放预订

揽星辰入梦
2026-03-04 17:16:40
炸完总领馆,再炸指挥部,中国又帮伊朗大忙,特朗普彻底坐不住了

炸完总领馆,再炸指挥部,中国又帮伊朗大忙,特朗普彻底坐不住了

咣当地球
2026-03-04 16:40:23
俄军事专家:如果伊朗继续以当前强度回应打击,美以局势或变危急

俄军事专家:如果伊朗继续以当前强度回应打击,美以局势或变危急

俄罗斯卫星通讯社
2026-03-03 15:08:19
特朗普“护航”失效,亚洲市场崩了

特朗普“护航”失效,亚洲市场崩了

华尔街见闻官方
2026-03-04 16:44:34
31分钟7失误太阳新高!格林第三场20+仍遭喷 他怎与杜兰特争辉?

31分钟7失误太阳新高!格林第三场20+仍遭喷 他怎与杜兰特争辉?

颜小白的篮球梦
2026-03-04 15:05:52
88年我替村里寡妇挑水,扁担断了,她拉着我说:你赔我一根硬的

88年我替村里寡妇挑水,扁担断了,她拉着我说:你赔我一根硬的

晓艾故事汇
2025-08-20 08:23:30
44岁贵州女子返岗途中突然离世,在广东的老板和员工坐飞机赶来送她最后一程

44岁贵州女子返岗途中突然离世,在广东的老板和员工坐飞机赶来送她最后一程

深圳晚报
2026-03-04 14:18:33
iOS 26.3.1 正式版即将发布

iOS 26.3.1 正式版即将发布

简科技
2026-03-04 16:22:44
德黑兰防空网被打穿,红旗-9的谣言终于破除了

德黑兰防空网被打穿,红旗-9的谣言终于破除了

子桑说
2026-03-02 20:23:40
不鸣则已,一鸣惊人!这3个生肖今年悄悄暴富,低调中藏大运!

不鸣则已,一鸣惊人!这3个生肖今年悄悄暴富,低调中藏大运!

毅谈生肖
2026-03-04 12:53:01
舒淇在节目里第一次承认,她和冯德伦为要孩子已经折腾了整整九年

舒淇在节目里第一次承认,她和冯德伦为要孩子已经折腾了整整九年

南权先生
2025-12-05 16:25:34
夺冠+MVP!中国男篮18岁2米15新星崛起闪耀:曾单场轰30+8真猛

夺冠+MVP!中国男篮18岁2米15新星崛起闪耀:曾单场轰30+8真猛

李喜林篮球绝杀
2026-03-03 17:10:02
2026-03-04 17:47:00
AIGC开放社区
AIGC开放社区
AIGC开放社区是专注于AIGC(生成式人工智能)领域的开放性社区
540文章数 53关注度
往期回顾 全部

游戏要闻

《生化危机:安魂曲》首周销量突破500万份 系列累计1.83亿

头条要闻

女孩花8684元买到1978年苹果16手机 直呼"太离谱"

头条要闻

女孩花8684元买到1978年苹果16手机 直呼"太离谱"

体育要闻

2026年中超,为什么值得你多看一眼?

娱乐要闻

迪丽热巴转机滞留迪拜 错过巴黎时装周

财经要闻

谈扩内需等 人大新闻发布会回应这些热点

科技要闻

多位核心离职,阿里亲手废掉最强AI天团?

汽车要闻

鸿蒙智行首款猎装车 尚界Z7/Z7T首发

态度原创

健康
手机
数码
本地
公开课

转头就晕的耳石症,能开车上班吗?

手机要闻

消息称三星已在试产新一代手机AP Exynos 2700,目标上半年完成

数码要闻

苹果M5芯片MacBook全系亮相:Air轻薄便携,Pro性能猛增

本地新闻

食味印象|一口入魂!康乐烤肉串起千年丝路香

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版