“穿透”作者|冯庆艳
1
11月14日,新晋AI2.0独角兽的零一万物,陷入抄袭同行的质疑声之中。
零一万物是创新工场董事长兼CEO李开复旗下AI公司。此次遭质疑的开源大模型产品Yi-34B,正是8天前,即11月6日,该公司发布的Yi-34B 和Yi-6B两个开源大模型之一。
质疑声来自于Yi-34B的Hugging Face开源主页上,一位名为ehartford的开发者称,Yi-34B模型使用了Meta LLaMA 的架构,只对两个张量(Tensor)名称进行了修改,分别为 input_layernorm 和 post_attention_layernorm。
Ehartford进一步表示,开源社区肯定会重新发布Yi大模型,并重命名张量以符合LLaMA架构。他希望,该公司在模型获得大量采用之前考虑将这一更改应用到官方模型中,下方则引来了多方议论。
巧合的是,疑似原阿里首席 AI 科学家贾扬清的一则朋友圈,11月14日在网上广为流传。该朋友圈截图称,“某国内大厂新模型exactly就是LLaMA的架构,但是为了表示不一样,把代码里面的名学从LLaMA改成了他们的名字,然后换了几个变量名。”
今年3月,贾扬清离开阿里,在美国联合创立了一家名为Lepton AI的AI公司。
来自两个业内人士的质疑声,迅速引发外界关注。
质疑同一天,正当质疑快速发酵之时,零一万物官方迅速作出回应称,GPT是一个业内公认的成熟架构,LLaMA在GPT上做了总结。
其官方进一步表示,零一万物研发大模型的结构设计基于GPT成熟结构,借鉴了行业顶尖水平的公开成果,由于大模型技术发展还在非常初期,与行业主流保持一致的结构,更有利于整体的适配与未来的迭代。
“同时零一万物团队对模型和训练的理解做了大量工作,也在持续探索模型结构层面本质上的突破。”零一万物官方称。
2
零一万物是李开复于今年3月成立的生成式AI弄潮儿,ChatGPT去年底引发该轮热潮。
这波生成式AI浪潮,火热程度可谓近几年之最,今年7月在上海举办的世界人工智能大会展区,“大模型”招牌更是席卷几乎所有参展商。因此,更是有人将之称为“百模大战”或者“千模大战”。
零一万物从出生就自带光环。李开复是投资圈里的风云人物。早年间先后任职于微软、谷歌等科技巨头,其从业履历无疑让零一万物站在了更高的起跑线上。
虽然成立至今,短短数月,其汇聚的人才却是实力强劲。前谷歌中国高管、前微软/SAP/Cisco/副总裁、前阿里巴巴副总裁、前百度副总裁、前滴滴/百度首席算法负责人等等,组成了零一万物的技术团队。
或许正因为此,零一万物颇受机构青睐。其最新一轮融资估值超10亿美金,由阿里云领投,成功晋级为AI 2.0 独角兽。
零一万物顺势而为,11月6日推出了其Yi系列模型,包括34B和6B两个版本。
公开资料显示,Yi-6B适合个人及研究用途,Yi-34B则已具备大模型涌现能力,适合发挥于多元场景,满足开源社区的刚性需求。Yi-34B数据参数量达到340亿,可支持200K超长上下文窗口,可以处理约40万汉字超长文本输入,是目前全球最长版本。两者目前都已开放免费商用申请。
Yi系列模型发布现场,李开复曾表示,创立公司第一天起,他的目标就是“做一个世界级公司”,能够进入世界的第一梯队。
李开复还称,“今天我们在中英文上就是最好的底座,没有之一,也希望更多人选择 Yi-34B。”
如今,开发者ehartford的质疑声,让外界开始理性审视,作为生成式AI创业公司,零一万物等弄潮儿的技术基座,到底在经历着什么样的阶段。
质疑之下,李开复和零一万物需要考虑的是,狂奔的同时,脚踏实地,方可长久。不要像纪伯伦所说的那样:“走的太远,以至于忘了当初为什么而出发。”
本文首发于“穿透”原创。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.