来源:新浪科技
新浪科技讯 1月8日上午消息,智谱AI今日上市,新浪科技了解到,上市当天,清华大学计算机系教授、智谱创立发起人兼首席科学家唐杰发布内部信,宣布很快将推出新一代模型 GLM-5。并进一步明确了2026年公司的目标是“成为国际领跑的大模型企业”。
唐杰提及了DeepSeek出现带给自己的警醒道:“文锋2023年创业的时候和我聊过,当时我并没有意识到他对AGI如此执着,感谢他带给我很多不一样的思考。”唐杰称,“选择对AGI技术的执着追求,不断探索AGI的上界,同时精准的未来预判成为下一步智谱需要不断改进和升华的地方。”
在他看来,真正决定下一阶段格局的,还是更底层的两件事——模型架构与学习范式。同时,应用侧可能会出现一个清晰的方向:AI替代不同工种/任务的爆发年。基于这一判断,智谱在2026年将聚焦于以下四个方面:
一,很快GLM-5将跟大家见面,通过进一步的Scaling和很多全新技术改进,相信GLM-5会带给大家很多新奇体验,让AI帮大家完成更多真实任务。
二,全新的模型架构设计。已经广泛使用近10年的Transformer架构已经显露出一些不足,包括超长上下文的计算开销、记忆机制、更新机制等。这些都需要探索全新的模型架构,发现新的Scaling范式,通过芯片-算法协同设计等技术提高计算效率。
三,具有更强泛化能力的RL。当前主流的RLVR范式虽然在数学和代码领域取得了成功,但其依赖人工构造可验证环境的局限性也日益凸显。今年需要探索更通用的RL范式,支持AI不仅能在人类指令下完成特定任务,更要能理解并执行跨越数小时甚至数天的长时程任务。
四,最具挑战性的探索,是开启通往持续学习与自主进化的道路。当前所有主流的AI模型,其智能在部署后基本上是静态的。它们通过一次性的、耗资巨大的训练过程获得知识,然后在应用中逐渐过时。这与人脑能够从与世界的持续交互中不断学习、进化的方式截然不同。我们需要对下一代学习范式——在线学习(Online Learning)或持续学习(Continual Learning)进行前瞻性布局。(文猛)
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.