网易首页 > 网易号 > 正文 申请入驻

游戏开发者警告:尽快摆脱 LLM,不要让它做决定!

0
分享至

在 LLM 迅猛发展的今天,许多开发者试图将其用于各种任务,包括核心业务逻辑和决策制定。然而,这种做法往往会带来一系列问题,从性能低效到难以调试,再到安全性隐患。本文将深入探讨为什么你应该尽快摆脱对 LLM 的过度依赖,以及如何避免常见陷阱。

原文链接:https://sgnt.ai/p/hell-out-of-llms/

作者 | pete

翻译工具 | ChatGPT 责编 | 苏宓

出品 | CSDN(ID:CSDNnews)

不要让 LLM 负责决策或实现业务逻辑——它们在这方面表现很差。我正在给一款在线游戏开发 NPC(非玩家角色),经常有人问我:“你是怎么让 ChatGPT 做到这些的?”我的回答总是:“我没有用 ChatGPT,而且你也不应该在游戏开发时使用。”

在大多数应用中,LLM 只应该作为用户和应用程序逻辑 API 之间的用户界面,即把用户的自然语言转换成系统可执行的指令。LLM 不应该负责做决定或执行复杂逻辑。尽快摆脱 LLM,并且尽可能长时间地避免依赖它。

为什么?

举个简单的例子:假设你想开发一个在 WhatsApp 上运行的国际象棋机器人。用户可以发送指令,比如“用我的象吃掉对方的马”,然后机器人进行相应的操作。

你能让 LLM 负责维护棋盘状态并做出合理的棋步决策吗?也许可以。但你应该这么做吗?绝对不行!理由如下:

  • 性能:LLM 能够下棋本身已经很神奇了,但它的棋艺并不好(截至 2025 年 4 月 1 日)。专业的国际象棋引擎总是比 LLM 更快、更强、成本更低。像 Stockfish 这样的现代棋类 AI,专门为下棋设计,能准确计算每一步的最优选择。而 LLM 只是个通用的聊天模型,它并不真正“懂”下棋,只是靠文字来记住棋盘状态,既慢又容易出错。

  • 调试与调整:你没法搞清楚 LLM 为什么会做出某个决定,所以也很难调整它的行为。LLM 生成答案的过程像是在一个复杂的迷宫里穿行,没人能准确还原它的思考路径,它自己也说不清楚。即使是专门训练的 AI(比如国际象棋引擎),都很难完全看透它的运作逻辑,而 LLM 在这方面更是乱得一塌糊涂——虽然 Anthropic 在让 LLM 更可解释方面做了一些努力,但问题依然很大。

  • 使用 LLM 还有一堆其他问题会出现,比如难测试,普通代码可以用单元测试检查是否正常运行,但 LLM 的输出不稳定,测试起来麻烦得多;数学太烂,LLM 处理数学题远不如 CPU,简单计算可能都出错;随机数不靠谱,LLM 生成的随机数并不真正“随机”,可能影响游戏或算法的公平性;版本管理混乱,普通代码可以清楚地记录版本变化,但 LLM 输出是动态的,难以追踪和审计;难以监控,LLM 的决策过程像个黑箱,想要监测它的运行情况变得更加复杂;状态管理脆弱,用自然语言记住状态容易出错,比如游戏中的棋盘布局,LLM 可能随时“忘记”或搞混;API 限制和成本问题,你得考虑 LLM 的调用次数限制,超了就用不了,而且每次调用都要花钱;安全边界模糊,传统系统有清晰的权限控制,而 LLM 处理所有内容都靠提示词,容易导致意想不到的安全风险。

示例

国际象棋的例子只是 LLM 不适合核心应用逻辑的一个缩影。在任何对精确性、可靠性和效率有要求的领域,你都应该遵循相同的原则:

  1. 游戏:如果用户说要用斩龙剑攻击玩家 X,LLM 不应该负责判断用户是否真的有斩龙剑,或者攻击会造成多少伤害。LLM 只负责将用户输入转换为 API 调用,并将结果转换回文本返回给用户。

  2. 谈判代理:如果你在构建一个自动谈判代理,LLM 不应该负责谈判本身,而只是传递信息、调用谈判引擎,并将结果反馈给用户。

  3. 随机选择:如果你的应用需要做出随机选择,LLM 不应该决定结果,而应该调用专门的随机数生成器。

LLM 适合做什么?

尽管上面强调了 LLM不适合的工作,但理解它擅长的领域同样重要,这样你才能合理利用它的优势。

LLM 擅长转换、分类,并且有一定的常识推理能力。这些才是你应该利用它的地方:

  • 文本转换:将“用剑砍兽人”转换为 attack(target="orc", weapon="sword"),或者将 {"error": "insufficient_funds"} 转换为“你的金币不足”。

  • 任务路由:识别用户意图,并将请求路由到正确的系统模块。比如,判断“查看我的背包”是库存查询,而“攻击”是战斗指令。

  • 自然语言理解:LLM 知道“blade”可能指的是剑,“smash”可能意味着攻击,这样可以提高交互的自然度。

注意,LLM 的优势在于转换、理解和沟通,而不是复杂决策或关键业务逻辑。将它们限制在这些角色,你可以充分利用其优势,同时避免前面提到的问题。

未来展望

LLM 的能力正在快速进化,就像“上帝的空白”理论——每当人们发现某个现象无法解释时,就归因于神的力量,直到科学填补了这个空白。同样,人们总是会找出一些“只有人类才能完成”的任务,但几个月后,新的 LLM 版本可能就能胜任这些任务了,迫使人们不断修改标准。

因此,未来的 LLM 可能会在这些任务上表现得更好,但很多核心问题仍然无法消除:传统的非 LLM 逻辑依然更易于理解、维护、更便宜且更易于版本控制。

即使 LLM 不断进步,核心架构原则仍然不变:让 LLM 负责它最擅长的用户交互部分,而将关键逻辑交给专业的系统来处理。

4 月 2 日 20:00,CSDN《万有引力》栏目特别邀请到OpenManus 项目一作、MetaGPT 开源核心贡献者梁新兵,DeepWisdom 算法研究员、OpenManus 核心作者向劲宇相聚 CSDN 视频号直播间,在CSDN &《新程序员》执行总编、《万有引力》主理人唐小引主持下,一起聊聊 00 后程序员的故事,以及 OpenManus 背后的秘密!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
元宵节已过,全国打工人再出发,原来他们有鄙视链分三六九等…

元宵节已过,全国打工人再出发,原来他们有鄙视链分三六九等…

慧翔百科
2026-03-04 09:04:13
奉劝所有40到50岁后的中年人,只要不被开除,干到退休就是成功

奉劝所有40到50岁后的中年人,只要不被开除,干到退休就是成功

岁月有情1314
2026-03-03 14:49:44
美军出动B-2轰炸机,伊朗动用“卡德尔-380”

美军出动B-2轰炸机,伊朗动用“卡德尔-380”

扬子晚报
2026-03-04 12:20:39
湖南卫视元宵晚会直播发生意外,一名表演嘉宾在完成舞台动作时意外失误撞向何炅,何炅:这是要给我拜个晚年吗

湖南卫视元宵晚会直播发生意外,一名表演嘉宾在完成舞台动作时意外失误撞向何炅,何炅:这是要给我拜个晚年吗

极目新闻
2026-03-04 09:59:45
最后一天!亦庄山姆即将暂停营业!

最后一天!亦庄山姆即将暂停营业!

亦庄指南
2026-03-03 16:44:21
你不知道的卡塔尔!亚洲最富,却严格管控男人私生活,遍地是光棍

你不知道的卡塔尔!亚洲最富,却严格管控男人私生活,遍地是光棍

青梅侃史啊
2026-02-23 09:26:45
明朝第五位皇帝朱瞻基,一生存在不少谜团,600年来“始终无解”

明朝第五位皇帝朱瞻基,一生存在不少谜团,600年来“始终无解”

铭记历史呀
2026-03-04 01:36:49
黄维被少将特务扇耳光,他手下两个军长两个师长,为啥也想打他?

黄维被少将特务扇耳光,他手下两个军长两个师长,为啥也想打他?

史之铭
2026-03-03 22:43:36
美伊激战进入第四天!美国突然对中国发难,其真实目的着实龌龊!

美伊激战进入第四天!美国突然对中国发难,其真实目的着实龌龊!

安安说
2026-03-04 12:16:48
现世报!ASML裁员1700人,450亿芯片烂仓库,荷兰:断供是步臭棋

现世报!ASML裁员1700人,450亿芯片烂仓库,荷兰:断供是步臭棋

丁丁鲤史纪
2026-03-04 09:26:36
2026款路虎揽胜及路虎卫士上市,售68.99万元起

2026款路虎揽胜及路虎卫士上市,售68.99万元起

IT之家
2026-03-03 15:38:17
《纯真年代》方穆静求原谅被拒!原来,全家福,才是母亲心里的疤

《纯真年代》方穆静求原谅被拒!原来,全家福,才是母亲心里的疤

乡野小珥
2026-03-04 01:42:02
太难了!中国女足艰难击败第112位孟加拉国:王霜进球后痛哭

太难了!中国女足艰难击败第112位孟加拉国:王霜进球后痛哭

邱泽云
2026-03-03 18:38:46
北京楼市起飞上天了,北京楼市万柳板块房价从12.8万变成11.7万

北京楼市起飞上天了,北京楼市万柳板块房价从12.8万变成11.7万

有事问彭叔
2026-03-02 21:58:37
一到半夜就嗷嗷叫,房子隔音差,到底怎么办?

一到半夜就嗷嗷叫,房子隔音差,到底怎么办?

绘本家居
2026-03-03 11:34:44
迪班萨冲击状元生变数!自曝今年可能不参选 我妈想让我大学毕业

迪班萨冲击状元生变数!自曝今年可能不参选 我妈想让我大学毕业

罗说NBA
2026-03-04 08:27:27
18战15胜!黄蜂8人上双大胜独行侠升东部第九 三球15+5+9+5

18战15胜!黄蜂8人上双大胜独行侠升东部第九 三球15+5+9+5

醉卧浮生
2026-03-04 10:37:13
韩媒:韩国世界杯大名单已确定17人,剩余9个名额竞争激烈

韩媒:韩国世界杯大名单已确定17人,剩余9个名额竞争激烈

懂球帝
2026-03-04 11:14:11
血债血偿,伊朗也发起“斩首”行动,导弹袭击以色列总理办公室

血债血偿,伊朗也发起“斩首”行动,导弹袭击以色列总理办公室

Ck的蜜糖
2026-03-04 12:29:19
洗个澡回来Win10变Win11!用户愤怒开骂微软:真是白痴

洗个澡回来Win10变Win11!用户愤怒开骂微软:真是白痴

快科技
2026-03-03 18:36:07
2026-03-04 13:19:00
CSDN incentive-icons
CSDN
成就一亿技术人
26353文章数 242237关注度
往期回顾 全部

游戏要闻

官方误操作提前泄露?这款竞速游戏定档4月29日!

头条要闻

从霍尔木兹海峡到地中海 伊朗首度攻击欧盟国家

头条要闻

从霍尔木兹海峡到地中海 伊朗首度攻击欧盟国家

体育要闻

“头铁”拼图在NBA也有生存环境

娱乐要闻

迪丽热巴转机滞留迪拜 错过巴黎时装周

财经要闻

伊朗,正在打破特朗普的幻想

科技要闻

新MacBook Pro首发M5 Pro/Max芯片 17999起

汽车要闻

比亚迪元PLUS遭导弹袭击 车辆未起火/乘员均生还

态度原创

健康
数码
旅游
游戏
家居

转头就晕的耳石症,能开车上班吗?

数码要闻

AI路由器接管一切!MWC上的智能家居,终于开始治「连接病」

旅游要闻

擂响“东方第一鼓”雅集翰墨绘团圆,浦东元宵游园会劲展“动”“静”中国韵

《生化危机9》里昂配音不愿透露支持CP 怕被粉丝干掉!

家居要闻

极简无界 静居自安然

无障碍浏览 进入关怀版