网易首页 > 网易号 > 正文 申请入驻

凤凰智媒与港中大推出全球首个粤语动态评测平台

0
分享至

来源:人民网

10月30日,凤凰智媒与香港中文大学宣布推出全球首个专为粤语而设的动态评测平台及生态系统CLEVA-Cantonese。凤凰卫视旗下人工智能数据服务机构——凤凰智媒为其提供了第一批高质量粤语数据。这个创新平台通过提供公平、动态且具参考价值的基准评估,揭示各类大语言模型对粤语的支持程度,并为研究人员及开发者提供具参考价值的分析,加速粤语大语言模型的优化及实际应用。


香港中文大学与InnoHK博智感知交互研究中心新闻发布会现场。香港中文大学供图

此前,港中大语言与视觉实验室研发的CLEVA(Chinese Language Models EVAluation Platform)是目前公认规模最大、涵盖最全面的中文大语言模型评估基准之一。CLEVA-Cantonese在此基础上,建立全球首个持续演进的粤语大语言模型评估生态系统。发布会上港中大计算机科学与工程学系助理教授、语言与视觉实验室负责人及CLEVA项目负责人王历伟教授介绍:此次系统平台整合了一个协作式的自动化工作流程,涵盖四个关键阶段:数据导入和筛选、语言模型理解、评估与反馈。这个持续循环的流程能实时提供洞见、推动模型创新、提升对粤语社群的服务质量,并产出可帮助其他低资源语言评测的研究成果。

粤语是香港、广东及海外华人生活地区的重要语言,但由于粤语语音语义的繁复多样、口语和文字的巨大差异、以及独特的文化背景等原因造成大模型对粤语的理解和支持能力较为欠缺。同时,粤语是低资源语言,语料库有限,所以收集更多高质量的数据,是提升大模型能力的基础条件。凤凰智媒一直致力于挖掘凤凰卫视多年积累的媒体数据资源价值,并且已经发布了一批具有香港地域特点和国际多元文化传播价值的高质量华语数据集。此次凤凰智媒发挥凤凰传媒行业对于语言理解能力和丰富多样的及时语料数据的优势,整理了各类场景具有特色的本港粤语口语数据,并进过人工标注、校验后参与投入了此评测平台的构建科研工作。随着评测平台的不断迭代和落地应用的普及,未来将在引导粤语环境下的研发与产品规划,助力粤语在教育、医疗、公共服务及文化生活等方面提供安全可信的模型,也将依托人工智能大模型的应用为粤语文化的传播起到积极帮助。(于嘉怿)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2026-02-18 05:08:49
环球网资讯 incentive-icons
环球网资讯
环球网,了解世界,融入世界
1329176文章数 2709568关注度
往期回顾 全部

教育要闻

历政生别慌!3大适配专业方向揭秘

头条要闻

加州州长纽森炮轰特朗普:把美国未来卖给中国

头条要闻

加州州长纽森炮轰特朗普:把美国未来卖给中国

体育要闻

谷爱凌:'不小心"拿到了银牌 祝大家马年大吉

娱乐要闻

春节档电影首波口碑出炉!

财经要闻

大年初一,这三件事很不寻常

科技要闻

春晚这些机器人是怎样做到的?

汽车要闻

问界M6更多信息:乾崑智驾ADS4.0+鸿蒙座舱5.0

态度原创

房产
亲子
健康
数码
军事航空

房产要闻

三亚新机场,又传出新消息!

亲子要闻

怀疑孩子被侵犯,请宝妈们务必强制报告!

转头就晕的耳石症,能开车上班吗?

数码要闻

Intel酷睿Ultra 5 338H实测:锐炫B370核显逼近RTX 4050

军事要闻

美国国务卿鲁比奥发表农历新年祝福

无障碍浏览 进入关怀版