聚焦
印度要不要自己的大模型?Sarvam AI 给出的答案是“要”,但当它真的发布了 Sarvam-M 之后,质疑声也接踵而至。
240亿参数、支持10种印度本土语言、权重开放、面向全社会……这些听起来本应代表技术突破的关键词,却在发布两天后仅收获了334次下载。相比韩国大学生开发的模型两天20万次的下载量,这一成绩令不少业内人士“感到尴尬”。
这一对比迅速引爆社交网络,印度AI圈随即陷入一场围绕“本土大模型是否必要”的热烈争论。而这场争议背后,实则是印度AI生态发展阶段、使用习惯、数据基础与算力条件之间的多重现实碰撞。
01
Sarvam-M发布了什么?
从国家使命走向冷启动,Sarvam-M到底发布了什么?
Sarvam AI 是印度国家AI战略 IndiaAI Mission 早期扶持的代表企业之一,由前 UIDAI 技术负责人 Vivek Raghavan 和 AI4Bharat 联合创始人 Pratyush Kumar 于2023年成立,目标明确——打造“主权AI栈”。
Sarvam-M 是他们最新发布的开源大语言模型,具备以下特点:
构建基础为 Mistral Small(法国开源模型);
参数规模为 240亿,支持 印地语、孟加拉语、古吉拉特语、卡纳达语、马拉雅拉姆语等 10种本地语言;
强调为印度语境优化,支持多场景、多领域适配;
模型权重开放,并在 Hugging Face 上提供使用。
这被视作印度AI自主化进程的重要一步。Sarvam 联合创始人 Raghavan 表示:“Sarvam-M 是印度迈向主权AI的重要基石。”
但理想与现实之间存在明显落差。上线两日仅 334 次下载,最新数据也不过 1200 次,引发外部投资人、开发者和评论者的普遍质疑。
02
核心争议是什么?
1
批评的核心在于价值定位
这场质疑最具代表性的声音来自 Menlo Ventures 投资人 Deedy Das。他的观点可总结为三点:
产品缺乏明确需求:“没有人在等一个稍微好点的 24B 印度语言模型。”
投入与产出不匹配:“Sarvam 已经获得 4100 万美元融资,成果却过于保守。”
替代性强,竞争力弱:“Google 和 TWO.ai 的产品性能更强,价格更低。”
更具争议的是,Das 将 Sarvam-M 与一款由两位韩国大学生开发的模型对比,后者在 Hugging Face 上两天获得近 20 万次下载,而 Sarvam-M 的冷启动成绩则被形容为“embarrassing”。
2
印度AI有自己的节奏
面对质疑,印度AI开发者群体迅速展开回应。
Lightspeed 合伙人 Hemant Mohapatra 强调,Sarvam 的用户规模在上月增长了10倍,并覆盖了4%的成年人口,体现出其在印度本土的落地能力。
AI4Bharat 社区开发者表示,Sarvam-M 的真正意义在于构建范式,而非短期指标。它不仅公开了模型,还分享了微调流程,为印度AI从业者提供可复制的路径。
Sarvam 内部员工指出,部分评论者并未亲自测试模型,就开始下结论。有人称这是“一种对印度AI生态缺乏理解的表现”。
更有开发者强调,模型的使用场景包括 小商户语音问答、农业助手、法律文书辅助等,服务的是 Bharat(印度非英语、农村与中小城镇人口),不是精英市场。
03
主权模型是否值得构建?
回到根本问题:为什么要构建印度自己的基础大模型?它值得吗?
这一问题不能简单用“下载量”回答,而需从三大结构性现实出发理解:
01
算力门槛高,训练成本极大
Sarvam-M 虽由 Mistral Small 微调而来,但 Sarvam 的中期目标是训练 70B 参数模型,预计投入约 4000–5000 万美元。这对印度本土算力环境而言,是一项挑战。
在 DeepSeek 成功用 H800 GPU 低成本训练模型之后,印度是否也能复制“国产AI硬件+本地训练”的路径,尚未可知。
02
多语言语料难收集,模型适配复杂
印度有超过 20 种主要语言,90%以上人口的数字行为以本土语言为主。大模型若不能精准服务本地语言习惯,将难以落地。
Sarvam 的一个核心任务,就是完成大规模 Indic 语言数据的清洗与组织,这部分工作对外界而言是“不可见的壁垒”。
X上的用户评论
03
产品场景分发链条尚未完善
很多开发者指出,Sarvam-M 面向的是那些 尚未形成明确AI使用习惯的用户群体。基础设施、终端使用体验、语言理解模型、语音识别系统缺一不可,这要求产品能力与生态组织能力并重。
这使得 Sarvam 既要当“基础设施建设者”,又要当“应用产品开发者”。
不是热度问题,而是生态构建问题
这场关于 Sarvam 的争议,最终折射出一个行业普遍性问题:
一个开源大模型的价值,应如何衡量?
如果从“社交媒体热度”出发,Sarvam-M 显然不够热度;但如果从“基础工程搭建”的视角观察,它代表了本土AI生态一次踏实的起步。
正如谷歌研究员 Raj Dabre 所言:“Sarvam-M发布前,大家抱怨没有印度大模型;发布后,又说它不够好。这暴露的是我们对‘自主AI’的认知缺失。”
在冷启动之后,真正的问题才刚刚开始
Sarvam-M 并不是一款完美的产品,但它开启的是印度AI从“用户国”迈向“建设国”的技术自主路径。
这不仅是对产品功能的考验,更是对战略方向、产业组织能力与基础生态的系统性检验。
Sarvam 的争议并不奇怪,它面临的是任何试图自建AI基础设施国家都会遇到的问题——从0到1的成本高、回报慢、不确定性极强。
这也是为什么我们不应以一时的热度去评判它,而应关注其长期的价值沉淀:是否能支撑起真正意义上的“印度AI技术栈”。
毕竟,属于印度的AI,不一定要从硅谷出发。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.