—— ·要点速览· ——
1、百度发布新一代文字识别 AI 模型 PP-OCRv5:仅 0.07B,部分测试超 GPT-4o
2、腾讯宣布开源 Youtu-GraphRAG 框架,解决图检索增强技术难题
3、支付宝发布 AI 就业助手“晓叶”:支持“岗位找人”、职业规划、职业培训
4、微软推出突破性实时翻译 API,支持 143 个地区 76 种语言实时交流
5、AI制药迎重要催化:甲骨文医疗战略再落一子 云基建成关键助攻
更聚焦的科技行业交流群,捕捉每一条科技动态,诚挚邀请创业者、发烧友加入我们。微信扫码进群:
进群后,你有机会得到:
最新、最热的科技资讯;
最精准的行业资源对接;
论坛、沙龙、企业游学门票。
1、AI游戏研发商「梦熵科技」完成股权投资。
梦熵科技是一家AI游戏研发商,业务范围集中于AI技术领域,譬如AI游戏/交互应用、虚拟伴侣、AIGC创作以及虚拟演出&元宇宙。
2、3D传感器芯片研发商「灵明光子」完成C3轮融资,投资方为浙江金融控股。
灵明光子是一家3D传感器芯片研发商,专注于研发高效率单光子探测器(SPAD)的大规模集成芯片。主要有两条产品业务线:适用于高性能激光雷达光子接收方案的硅光子倍增管(SiPM)和适用于消费级电子产品的SPAD成像传感器(SPADIS)及整体dToF解决方案。已推出SiPM、单光子成像SPAD面阵芯片以及多点和有限点dToF芯片及模组等产品,不断加速产品在智能汽车、高端手机、机器人、自动控制、人机交互、智慧家居等领域的应用落地。
3、超算力云服务提供商「是石科技」完成1亿人民币Pre-A轮融资,投资为百度风投领投,誉道创投跟投。
是石科技是一家超算力云服务提供商,以“HPC+AI”为核心技术,打造领先的HAI统一计算平台,提供算力调度、并行优化及模型专家服务。依托自身长期积累的技术实力,以高性能计算为基础、以性能优化为内核、以超级计算产业化为使命,实现国产超智融合计算突破,通过市场化运营方式,发展计算软硬件核心技术和应用生态。
4、水导激光设备制造商「科诗特」完成数千万人民币A轮融资,投资方为兴泰创投,科大硅谷,合肥产投集团,滨湖金投集团,逻之稻芯等。
科诗特是一家水导激光设备制造商,科诗特水导激光设备已在碳化硅晶体、金刚石及金刚石复合材料、精密陶瓷、硬质金属、复合材料等精密加工领域成功应用,其产品及解决方案广泛服务于第三代半导体用设备、汽车电子及核心部件、航空航天精密部件和高端医疗器械等领域。
1、百度发布新一代文字识别 AI 模型 PP-OCRv5:仅 0.07B,部分测试超 GPT-4o
9 月 13 日消息,百度于 9 月 10 日在 Hugging Face 发布新一代文字识别解决方案PP-OCRv5。
百度介绍称,PP-OCRv5 是一个为缓解大型视觉语言模型(VLMs)局限性而设计的专用 OCR 模型,它提供了一种高效、准确且轻量级的解决方案。
PP-OCRv5 通过保持模块化、两阶段的流程,专门针对高速、精确的文本检测和识别,解决了大型 VLMs 的精确文本定位和边界框精度局限性问题。
PP-OCRv5 的亮点如下:
效率:该模型参数量仅为 0.07B,能够在 CPU 和边缘设备上实现更高性能,其移动版本在英特尔 Xeon Gold 6271C CPU 上每秒可处理超过 370 个字符。
性能:PP-OCRv5 在 OCR 特定基准测试中优于通用型 VLM 模型,如 Gemini 2.5 Pro、Qwen2.5-VL 和 GPT-4o,包括手写和印刷的中英文以及拼音文本。
定位:PP-OCRv5 旨在提供精确的文本行边界框坐标,这对于结构化数据提取和内容分析是关键要求。
多语言支持:该模型支持五种文字类型 ——简体中文、繁体中文、英文、日文和拼音,并能识别超过 40 种语言。
PP-OCRv5 由四个核心组件构成:
图像预处理:处理图像的旋转和畸变,以标准化输入。
文本检测:识别图像中文本行的精确位置。
文本行方向:分类检测到的文本方向,以确保其正确对齐以进行识别。
文本识别:将每行文本中的字符解码为文本字符串。(IT之家)
2、腾讯宣布开源 Youtu-GraphRAG 框架,解决图检索增强技术难题
9 月 13 日消息,图检索增强生成(GraphRAG)已成为大模型解决复杂领域知识问答的重要解决方案之一。然而,当前学界和开源界的方案依然面临开销巨大、效果有限、适配成本高等难题。
因此,腾讯优图实验室今日宣布 —— 正式开源 Youtu-GraphRAG 框架。据介绍,Youtu-GraphRAG 在六个跨领域多语言基准测试中均展现出了优秀的性能表现:
大幅成本优化:相比同类最佳方案,构图成本节省 30%+;
显著精度提升:在复杂推理任务中获得最高 16%+ 的准确率提升;
强大泛化能力:支持中英双语处理,通过最小化人为干预 Schema 实现跨领域无缝迁移。(IT之家)
3、支付宝发布 AI 就业助手“晓叶”:支持“岗位找人”、职业规划、职业培训
9 月 13 日消息,在今年的 2025 Inclusion 外滩大会上,支付宝数字就业团队正式发布 AI 就业助手“晓叶”,可依托人工智能大模型与数字人技术,进一步提升企业招聘与求职者找工的体验。
汇总该产品主要功能如下:
“晓叶”具备 4 大核心能力,包括撮合匹配岗位、在线面试、职业规划和培训推荐,提升就业市场两端的服务。
AI 撮合匹配:实现从“人找岗位”到“岗位找人”,求职者在支付宝上搜“找工作”,进入就业服务页面后,即可点击和“晓叶”进行对话;与 AI 助手的智能交互,可深度了解求职者需求,更精准地推荐相关岗位,解决求职者在海量岗位中苦苦搜寻的痛点。目前,支付宝就业频道 1200 万的岗位已接入 AI 匹配功能。
AI 在线面试:实现免等待直通面试环节,通过 AI 助手“晓叶”推荐报名岗位后,可免等待免奔波直通 AI 在线面试间,让面试不再受地域和时间所限,求职效率进一步提升。目前已有 15 万岗位开通 AI 在线面试功能。面试后,AI 助手还能快速出具面试报告,供招聘方参考和决策。
AI 职业规划:根据求职者个人特点、过往经验、技能 / 证书、个人意向等,给出可落地的行动建议,助力短、中、长期的职业发展规划。
职业培训:可识别求职者当前能力与目标岗位的差距,并“精准推荐”相对应的有关课程,改变传统职业培训“供需错配”、“学用脱节”的痛点。(36氪)
4、微软推出突破性实时翻译 API,支持 143 个地区 76 种语言实时交流
9 月 13 日消息,据外媒 Neowin 今晚报道,微软发布了“突破性(breakthrough)的” Live Interpreter API,将实时多语言翻译能力引入 Azure Speech Translation。用户无需设置输入语言,就能实现流畅的跨语言沟通。
该功能支持 76 种语言和 143 个地区,具备自动识别语言、低延迟、接近人工口译的实时效果,还能使用个人语音保留说话者的风格和语气。目前已开放公测。
这项 API 可用于多语言呼叫中心、在线会议、课堂教学、社交电商直播等场景,软件开发者可以借此取消语言切换菜单,让对话过程中自由切换语言。
其中的个人语音功能尤为亮眼,其能够完整保留原说话者的语调和节奏,让翻译后的声音听起来更自然,并提供企业级的隐私和同意控制。
Live Interpreter API 基于 Azure Speech Translation 打造,能够实现连续语言识别、覆盖所有支持语言、并提供低延迟的语音翻译。
微软官方的新闻稿提到,公司已与安克创新合作展示实际应用。安克创新表示:“我们很高兴能与微软合作,展示 AI 与日常科技结合的可能性。借助 Live Interpreter,我们为全球用户带来更智能、直观且沉浸的视听体验。”
微软还提供了快速入门指南,方便开发者集成该功能。普通用户无需直接操作 API,就能通过接入该能力的应用或网站体验跨语言交流。(钛媒体)
1、AI制药迎重要催化:甲骨文医疗战略再落一子 云基建成关键助攻
为甲骨文带来4000亿美元潜在收入的云基建,正成为其推进AI医疗战略的“关键一子”。
近日,人工智能药物开发商Absci宣布,与甲骨文和AMD合作,加速生成式人工智能驱动的药物发现进程。其中,AMD负责提供MI355X GPU以加强AI性能,甲骨文则负责提供云基础设施,从而强化AI制药平台从大规模分子动力学模拟到完整抗体设计的计算能力。基于此设置,可将 GPU间延迟降低至2.5微秒,并实现每秒TB级的数据传输。
甲骨文将此次合作看成云计算推动生物技术进步的体现,其医疗与生命科学部门负责人表示:“我们为Absci提供可预测的性能和紧密的工程协作,从而突破生物制剂设计的界限。”
事实上,近年来甲骨文始终将医疗视作其重要任务。早在2021年,公司便以283亿美元高价收购电子健康记录公司Cerner,并成立了专门的业务部门Oracle Health,旨在构建一个整合云技术、数据平台与AI的医疗生态系统。今年年初,创始人拉里·埃里森表示,正在利用OpenAI和软银的工具开发癌症疫苗。
无独有偶,制药巨头也积极布局AI药物研发方向。9月9日,礼来公司推出TuneLab平台,向生物技术企业开放其基于超10亿美元研发投资构建的人工智能药物发现模型。此外,默沙东、辉瑞、BMS等也均有布局AI制药相关公司。
作为可投资的AI应用分支来看,“木头姐”凯茜·伍德曾在今年初强调,从长远来看,医疗保健可能会成为最深刻的AI应用领域。国海证券近日研报指出,在AI中下游板块中,AI+医疗更具备结构性亮点。信达证券认为,随着创新药进入分化行情,需要精选α个股。回顾行业综合PE综合水平仅在历史平均水平,科创资金在医药板块有望外溢到AI医疗。( 科创板日报 )
“鉴赏力要高过AI,站巨人肩膀做1到100的精进。”
更多干货分享敬请关注我们的公众号与视频号~超多精彩对话内容等待您的解锁!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.