观点网讯:2月6日,美团发布轻量化MoE模型LongCat-Flash-Lite。
根据公开资料整理,该模型拥有685亿参数,每次推理仅激活29亿~45亿参数,通过将超300亿参数高效用于嵌入层,在智能体与代码领域表现突出,且依托YARN技术支持最长256K上下文,可高效处理长文档、大规模代码分析等场景。
据了解,LongCat-Flash-Lite不仅超越了参数量等效的MoE基线模型,还在与同规模现有模型的对比中展现出卓越竞争力。
免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.