![]()
DeepSeek拟募资最高500亿,梁文锋自掏200亿
市场消息显示,DeepSeek正进行其首轮大规模融资,目标金额高达500亿元人民币(约合73.5亿美元)。若融资顺利完成,将创下国内人工智能领域单轮融资的最高纪录。
值得关注的是,本轮融资中最大的一笔出资来自创始人梁文锋本人。据悉,其个人出资额达到200亿元人民币,占本轮融资总额的40%,以真金白银彰显了对公司前景的坚定信心。
百度文心大模型5.1发布:登顶多个榜单,预训练成本仅为业界 6%
百度文心大模型5.1 正式发布,其继承文心5.0 知识,显著降低预训练成本,将总参数压缩至约1/3、激活参数压缩至约1/2,仅使用业界同规模模型约6% 的预训练成本,实现同级别模型基础效果领先。
登录文心一言官网即可与文心5.1模型对话体验最新能力。开发者可以通过千帆大模型平台修改model_name为ernie-5.1即可调用API服务。
从今天起,文心大模型 5.1 将陆续在超过十个创意生产智能体平台上线,包括 ISEKAI ZERO(全球领先的 AI 角色扮演互动平台)、Mulan AI(创意智能体平台)、谛听幻流(AI 原生创意画布)和 Storymaster(AI 短剧生成平台)等。
接入超300款AI大模型 国内最大大模型服务平台正式上线
国内最大的大模型服务平台近日正式上线,由中国移动开发的这个平台已接入并提供300余款国内主流AI大模型的服务与能力,是国内汇聚大模型数量最多的平台。
据了解,该平台首创词元(Token)集约化运营模式,记者在现场看到,平台能够自动分析用户需求,智能为任务匹配最优模型。通过“成本优先”“效果优先”“均衡优先”三种模式,为用户动态筛选适配方案,以更低的词元消耗、更高的执行效率完成工作。
当模型出现超时、限流或故障时,平台能自动实现秒级切换,确保业务连续不中断。目前,该平台实现单位词元成本降低30%左右,资源占用率减少50%以上,日均调用量超过千亿级。
MiniMax深度复盘“马嘉祺消失”,揭秘Token退化真相与修复策略
近日,开发者社区发现MiniMax M2系列模型输出“马嘉祺”异常。官方排查后揭示,后训练阶段低频Token退化是主因,分词器切分“马嘉祺”后,“嘉祺”因样本不足致向量空间未优化。约4.9%的Token显著退化,引发日语对话等异常。MiniMax提出三项修复策略,日语混淆率降至1%,未来将兼顾多层面保障表达力。
Lanmeih/今日话题
你在用DeepSeek吗?
咱们评论区聊聊~
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.