国家知识产权局信息显示,山东鲁软数字科技有限公司申请一项名为“一种实时视频流中分离音频并进行文字转换的方法及系统”的专利,公开号CN121789684A,申请日期为2025年12月。
专利摘要显示,本申请提供一种实时视频流中分离音频并进行文字转换的方法及系统,属于音视频处理技术领域,所述方法:获取实时视频流,并进行解封装,分离出音频流;所述音频流为AAC或PCM格式;对音频流进行实时预处理,得到标准化PCM音频帧,所述实时预处理包括降噪、回声消除、自动增益控制、重采样和静音检测;将标准化PCM音频帧按时间顺序输入至预训练的流式语音识别模型,进行逐帧识别,输出增量文本token序列;对增量文本token序列进行文本后处理,生成带时间信息的结构化文本并进行输出;所述文本后处理包括语言模型纠错、标点恢复和时间戳对齐。本申请集成音视频处理与流式语音识别,低延迟、高准确率,满足实时性需求。
天眼查资料显示,山东鲁软数字科技有限公司,成立于1998年,位于济南市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本49221.616658万人民币。通过天眼查大数据分析,山东鲁软数字科技有限公司参与招投标项目4838次,财产线索方面有商标信息132条,专利信息670条,此外企业还拥有行政许可15个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.