![]()
文心4.5最强衍生模型发布,PaddleOCR-VL登顶OCR综合性能全球第一
10月16日,百度正式发布并开源自研多模态文档解析模型PaddleOCR-VL。在全球权威文档解析评测榜单OmniBenchDoc V1.5中,PaddleOCR-VL以92.6分取得综合性能全球第一成绩。据了解,PaddleOCR-VL其核心模型参数仅0.9B,轻量高效,能够在极低计算开销下,精准识别文本、手写汉字、表格、公式、图表等复杂元素,支持109 种语言,覆盖中文、英语、法语、日语、俄语、阿拉伯语、西班牙语等多语场景,广泛适用于政企文档管理、知识检索、档案数字化、科研信息抽取等文档智能任务。
美团首次披露餐饮商家AI经营产品全图
10月16日,美团在“第八届餐饮产业大会”上首次体系化展示LongCat大模型在餐饮行业的应用进展,并面向餐饮人推出“袋鼠参谋”“智能掌柜”等AI工具。目前,超150万真实顾客体验过AI能力,实现咨询、预订及取号排队等事宜。
美团开源LongCat-Audio-Codec
美团LongCat团队宣布正式开源专用语音编解码方案LongCat-Audio-Codec。它提供一套一站式的Token生成器(Tokenizer)与Token还原器(DeTokenizer)工具链,其核心功能是将原始音频信号映射为语义与声学并行的token序列。
甲骨文称AI云毛利率可达35%,已签下650亿美元订单
在甲骨文AI World大会上,公司联席CEO克莱·马古伊克(Clay Magouyrk)举例称,一个为期六年、总收入600亿美元的AI基础设施项目,其毛利率可达35%,这样的毛利率水平“即使对于规模最大的客户来说也有参考意义”。此外,甲骨文方面透露,公司的剩余履约义务(RPO,客户已签约但尚未计入收入的合同)已经超过5000亿美元。马古伊克表示,在上季度的30天内,甲骨文已经签订了价值650亿美元的新云基础设施供应合同,由“来自四个不同客户的七份不同合同”构成。
李飞飞团队发布世界模型最新成果
当地时间10月16日,李飞飞宣布对外推出全新模型RTFM(A Real-Time Frame Model),不仅具备实时运行、持久性和3D一致性,单张H100 GPU就能运行。
花旗:OpenAI需投入超1万亿美元才能兑现算力承诺
花旗分析师指出,OpenAI计划与英伟达、博通及超威半导体等芯片制造商合作,以部署其承诺的海量算力;要兑现这一承诺,该公司未来五年需投入超1万亿美元。花旗估算,要实现 1 吉瓦计算能力的上线运行,需在计算硬件、能源基础设施及数据中心建设方面投入500亿美元。
Lanmeih/今日话题
你认为AI能赋能餐饮商家吗?
咱们评论区聊聊~
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.