网易首页 > 网易科技 > 网易科技 > 正文

智能驾驶疆场,海天瑞声的「数据」纵横论

0
分享至

(原标题:智能驾驶疆场,海天瑞声的「数据」纵横论)

导语:数据已经成为了一种生产要素。

上海世博中心,2021世界人工智能大会刚刚落幕。

作为人工智能的重要应用之一,自动驾驶也在这场一年一度的全球顶级会议期间大放异彩——

会议期间首次开展了面向大会观众基于开放道路的载人应用体验,体验路线总长2.8公里,共12个路口,途经世博中心。此外,特定区域自动驾驶应用展示也同步进行。

自动驾驶动态体验线路

基于这些应用体验,国内自动驾驶全产业链成就和最高技术水平得以展示,自动驾驶技术对于人们日常生活以及出行方式的改变可以窥见。

事实上,自动驾驶系统平稳运转的背后,是一个大家都耳熟能详的关键词——数据。

"数据已经成为了一种生产要素,前提是要把人类世界的信息转化为计算机可以识别的方式。"海天瑞声的副总裁李科告诉新智驾。

想要打造真正安全可靠的量产自动驾驶产品、支持成千上万辆同时交互的自动驾驶车辆,企业就必须想明白如何高效地收集以及有效利用海量数据。

那么,具体该怎么做呢?

智能驾驶的"幕后英雄"

尽管不像硬件一样看得见摸得着,但无论是自动驾驶、辅助驾驶,还是智能座舱,这些被赋予智能属性的驾驶体验都离不开数据的驱动。

在李科看来,通过训练数据生产的各个环节(设计、采集、加工、质检),可以收获很多有益于智能驾驶算法模型迭代的规律和结论。

  • 譬如关于驾驶员踩刹车的图像数据

这个动作通常代表着判断和决策的结果,那么在这个动作之前发生了什么?在这个动作之后发生了什么?有没有比较特殊的事情发生?

  • 再譬如关于舱内语音交互的数据

语音交互时,哪些功能的启动可能会对驾驶产生干扰?麦克风如何排列可以更好地满足各个座位上的交互需求?回声噪声的情况如何、该怎样解决?

于自动驾驶企业和主机厂而言,这些数据都值得重点关注,因为它们后续可能有助于强化 Corner Case 的处理能力、优化用户的乘坐体验。

而计算机视觉和智能语音训练数据正是海天瑞声从事了近二十年的领域,且已向微软、亚马逊、阿里等国内外500多家知名企业提供从方案设计、数据采集、加工处理到质检交付的全流程数据服务。

其中,海天瑞声在智能座舱的布局,最早可以追溯到2005年。这些历程无疑为其积累了足够多数据层面的 know-how,使得海天瑞声可以基于自己的技术研发实力、经验沉淀从数据角度去加速客户的算法模型训练及商业化落地,相应的也得到了越来越多智能驾驶客户的青睐。

思之深,行之远

事实上,除了数据采集、标注服务,一个实力雄厚、经验丰富的数据合作伙伴最重要的是帮助玩家们较为准确地预估投入产出比,找到与整体业务目标契合的解决方案。

对此,李科也尝试通过一个例子来帮助理解。

在训练算法模型时,玩家们希望获得某一场景中所有可能碰到的情况并以数据的形式给到机器去学习,在智能驾驶业务中,这不仅包括常规的多种路况环境(拥堵、城市街道、高速路段),天气状况诸如大雾、暴风雨雪天气,不同光线条件例如白天、黑夜、清晨傍晚,还包括交通事故、违规行为等各种突发状况。

智能驾驶舱外采集环境多样、复杂

这就要求包括海天瑞声在内的数据服务商能够深刻理解客户的业务场景,在设计方案过程中考虑到算法对样本多样性的需求,以及不同样本数据的占比应该是怎样的,同一类型场景的数据至少要达到多少才能满足机器学习的需求,数据方案如何设计才能避免出现与模型的过拟合、欠拟合等诸多问题。

帮助客户不在数据准备阶段走弯路,加速模型训练、产品落地和迭代是海天瑞声坚守的初衷。

起于砖瓦的技术壁垒

随着智能驾驶更进一步发展,在可预见的未来里,玩家们对底层数据处理能力的要求会越来越高、对长尾场景数据的需求会越来越大、对高质量训练数据的诉求会越来越强,智能驾驶的发展已成为不可逆转的大趋势,并且具备了进一步落地应用的充分条件。

然而这一领域鲜有高质量的一站式数据服务,整体的数据处理速度、精度、准度都还有待提升,尤其是3D 点云数据。

因为远见,海天瑞声早已开始思考如何将自己在数据处理方面的先发优势最大化发挥,去帮助玩家们解决痛点。据了解,目前海天瑞声的技术已经能够支持3D 点云标注、3D 点云连续帧标注、3D 连续帧与2D 联合的标注、3D 语义分割等。

譬如,针对同一物体在不同空间中的数据处理,海天瑞声前期会对其进行多个坐标系的建模和配准,然后经过校准后投影到同一个坐标系中,最终保障不同空间中的标注结果的统一。

对于3D & 2D 的联合标注,海天瑞声能够通过算法实现3D 标注结果自动投影到2D 平面,随之自动生成对应目标的空间位置。

可以看到,得益于强劲的技术实力以及在数据服务领域耕耘的经验,即便是在新兴的且难度较大的3D 点云数据处理方面,海天瑞声也已经做得游刃有余。

在舱内场景,DMS 数据因为涉及到光线、多角度同步等不同要求,大大加剧了采集的难度。海天瑞声则基于自研的多通道桌面车载录音工具,配合不同采集设备,从采集端实现多通道同步,且支持灵活参数设置和实时语音质检,在提高采集效率的同时还能够实时监控采集质量。

舱内多通道采集示例

种种这些,都是海天瑞声区别于业内其他数据服务商的根源,也是在经年累月的努力下为自己打造的深厚壁垒,使其得以领跑智能驾驶数据服务。

数据安全,立身之本

随着行业的高速发展,千差万别的需求背后,不变的是对数据合规及安全的要求。作为行业的领路人,海天瑞声稳步前行的同时也持续加码在合规及安全方面的建设。

其业内首创科学的项目管理体系,从资源的合规性、数据存储安全及流转等方面制定了详尽的措施:

比如,所有项目采集前必须获得被采集人的书面授权,否则需要重新配置资源以保障合规性;

同时,海天瑞声还专门设立了进行数据安全及合规性审核的数据保护官(以下简称"DPO");并且通过完善的制度条例充分保障被采集人的权利,曾经有一位海外被采集人在项目结束后申请删除个人数据信息并撤回相应授权,收到请求的DPO第一时间整理了相关资料后与客户联系,协商操作,最终在24小时内完成了被采集人的诉求;

2018年5月由欧盟出台的《通用数据保护条例》,被称为史上"最严数据保护法案",曾因为数据信息保护失职对英航开出了15.8亿人民币的天价罚单。值得一提的是,此法案一经出台,就被海天瑞声纳入了项目及技术研发人员的"必修课",组织学习并进行考核;

除了制度上的严格规范,一向以技术严谨而著称的海天瑞声自然也有相应的"硬实力"去保障数据安全,即一体化数据处理平台:

该平台是海天瑞声基于自身近20年数据服务经验,并融合了数十项核心技术及专利打磨而成。平台内上千个自研标注工具联合打通,不仅可以用来处理复杂的交叉业务场景数据,更重要的是保证了数据从采集到脱敏、清洗、标注、质检等全流程不出平台即可完成,与平台内严格的人员权限管理、实时监控等功能一起,充分保障了数据的安全可控。

此外,还支持私有部署、驻场标注等一系列高级别数据安全处理请求。

以上种种举措,使得海天瑞声很早就通过ISO/IEC 27001管理体系认证,并于日前获得具有"最严苛资质审核"称号的ISO/IEC 27701隐私保护标准认证。

数据的合规安全是客户的重要诉求,也是海天瑞声牢牢坚守的生命线。

行于未来之路

纵观行业的发展,智能驾驶已经成为了全球大多数国家和地区都在推进的主旋律,这个市场的规模还将呈倍数增大。

对此,李科向新智驾表示,现在一些造车新势力发展势头迅猛,这会进一步带动舱外感知的数据需求,我们今年在持续发力舱内的同时,会侧重舱外的布局。

事实上,无论舱内还是舱外,与这些场景结合的技术大多离不开智能语音、计算机视觉和自然语言理解——这些也是海天瑞声一直在耕耘、也会坚持耕耘的方向。正如李科所介绍的,从2005年开始,海天瑞声就开始在AI全核心领域进行深度的数据布局。

如今十六年过去,海天瑞声已然立于数据服务行业的高山之巅。

全球语言学家团队、 超过160语种方言服务能力、覆盖全球近1/2国家及地区的本地化项目经验、760余个自有知识产权的训练数据产品等,这些均是海天瑞声长期以来坚持创新和自主研发的果实——不仅可以助其在火热的智能驾驶赛道大展身手,加速海内外自动驾驶以及智能座舱的应用落地;也能够作为海天瑞声发展的核心代名词,成为自身多项业务延续和拓展的重要基础。

无论从何种角度来看,用户驱动、需求驱动、实战驱动都是推动海天瑞声持续稳步前进的动能。也只有通过这些方式打造出来的产品,才接地气、才具有真正的生命力。(来源:雷锋网)

相关推荐
热点推荐
原高校党委书记,任驻京办主任

原高校党委书记,任驻京办主任

麦可思研究
2026-03-11 21:44:13
武大研究发现:一旦吃上降压药,七件事就不要做了,别害了自己

武大研究发现:一旦吃上降压药,七件事就不要做了,别害了自己

岐黄传人孙大夫
2026-03-08 21:45:03
阿尔茨海默病者逐渐增多,医生提醒:55岁后,尽量改掉6个坏习惯

阿尔茨海默病者逐渐增多,医生提醒:55岁后,尽量改掉6个坏习惯

39健康网
2026-02-17 18:31:37
3年不来往的小姑子打6个电话找我,她说明来意我转身就走,她哭了

3年不来往的小姑子打6个电话找我,她说明来意我转身就走,她哭了

人间百态大全
2026-03-01 06:40:03
中央定调,延退继续,70后出生延迟退休3年,养老金能差20%吗?

中央定调,延退继续,70后出生延迟退休3年,养老金能差20%吗?

另子维爱读史
2026-03-11 18:04:24
56岁大妈心梗离世,医生:吃他汀时除了牛奶,这6种食物尽量少碰

56岁大妈心梗离世,医生:吃他汀时除了牛奶,这6种食物尽量少碰

岐黄传人孙大夫
2026-02-28 22:15:03
第一批“养虾人”后悔了!300元请人卸载,有平台封杀OpenClaw

第一批“养虾人”后悔了!300元请人卸载,有平台封杀OpenClaw

上观新闻
2026-03-11 21:02:20
狂卖1.06亿假“港药”!5年暴利生意被曝光,百年老字号竟是骗局

狂卖1.06亿假“港药”!5年暴利生意被曝光,百年老字号竟是骗局

素衣读史
2026-03-10 16:56:25
尼克松晚年坦言:他很后悔当初访华,只因毛主席识破的访华计谋!

尼克松晚年坦言:他很后悔当初访华,只因毛主席识破的访华计谋!

冰语历史
2026-03-07 06:23:39
伊朗第37轮反击!导弹轰炸3个小时,150名美军伤亡,损失藏不住了

伊朗第37轮反击!导弹轰炸3个小时,150名美军伤亡,损失藏不住了

沧海旅行家
2026-03-11 18:05:43
出大事了,以军调转枪口空袭俄设施,普京立即表态,中东要变天了

出大事了,以军调转枪口空袭俄设施,普京立即表态,中东要变天了

肖兹探秘说
2026-03-11 13:27:40
独家调查:消失在 08:10 —穆杰塔巴的“生存奇迹”与暗黑交易

独家调查:消失在 08:10 —穆杰塔巴的“生存奇迹”与暗黑交易

卷卷百事通
2026-03-07 09:20:44
39岁网红直播意外疾病,10分钟内从头痛到离世留下5岁女儿

39岁网红直播意外疾病,10分钟内从头痛到离世留下5岁女儿

笑饮孤鸿非
2026-03-12 00:12:06
山姆宣布:北京一15年老店停业调整,时长一年

山姆宣布:北京一15年老店停业调整,时长一年

中国零售信息
2026-03-11 10:06:03
伊朗外交部发言人称美以袭击损坏又一处世界遗产四十柱宫

伊朗外交部发言人称美以袭击损坏又一处世界遗产四十柱宫

闪电新闻
2026-03-10 22:12:17
卓荣泰赴日,三人是元凶,国民党两人暴露,大陆摊牌了,不简单

卓荣泰赴日,三人是元凶,国民党两人暴露,大陆摊牌了,不简单

浪子阿邴聊体育
2026-03-09 18:51:13
雷军回应登上《新闻联播》

雷军回应登上《新闻联播》

大象新闻
2026-03-11 13:45:06
实测腾讯版OpenClaw,这就是目前最适合小白的养虾版本

实测腾讯版OpenClaw,这就是目前最适合小白的养虾版本

卡尔的AI沃茨
2026-03-10 21:16:33
默多克过95岁大寿!妻子埃琳娜穿黑色礼服美翻,前任邓文迪也来了

默多克过95岁大寿!妻子埃琳娜穿黑色礼服美翻,前任邓文迪也来了

八八尚语
2026-03-11 10:28:27
万万没想到!两会最火提案不是医疗和就业,而是霍启刚的这一举动

万万没想到!两会最火提案不是医疗和就业,而是霍启刚的这一举动

小舟谈历史
2026-03-07 01:06:10
2026-03-12 04:56:49

科技要闻

腾讯"养虾"暴涨后,百度急得在门口"装虾"

头条要闻

特朗普再次威胁将切断与西班牙贸易往来:非常糟糕

头条要闻

特朗普再次威胁将切断与西班牙贸易往来:非常糟糕

体育要闻

郭艾伦重伤,CBA下半赛季还能期待些什么

娱乐要闻

蔡少芬晒全家福照,两女儿成最大亮点

财经要闻

唤醒10万亿存量资金 公积金改革大潮来了

汽车要闻

莲花纠偏, 冯擎峰的“收”与“守”

态度原创

教育
健康
艺术
手机
军事航空

教育要闻

今日出版丨《教育文摘周报》2026年第10期转载稿源目录

转头就晕的耳石症,能开车上班吗?

艺术要闻

砸10亿,张家界奇观建筑,空中有一个巨型“门洞”

手机要闻

第一台龙虾手机来了:小米「养虾」,意在何处?

军事要闻

朝鲜"崔贤"号驱逐舰进行战略巡航导弹试射

无障碍浏览 进入关怀版
×