网易首页 > 网易号 > 正文 申请入驻

用文本智能助力AGI落地,合合信息推出多模态文本智能技术落地方案

0
分享至


打开百度APP畅享高清图片


随着人工智能深入各行各业,多模态大模型正在成为AI发展的重要方向之一。近日,由中国图象图形学学会、中国人工智能学会、中国计算机学会和中国自动化学会联合主办,上海交通大学承办的第八届中国模式识别与计算机视觉学术会议(PRCV 2025)顺利举行。大会期间,“多模态文本智能大模型前沿技术与应用”论坛获得了广泛关注。论坛汇集了来自华南理工大学、哈尔滨工业大学、南开大学、华中科技大学、小红书及合合信息技术团队的顶尖专家与学者,深入探讨多模态文本智能领域的最新技术突破与场景应用案例。

如同人类需要同时调用视觉、听觉、触觉等多感官来全面地理解外部世界,大模型也需要综合处理文字、图片、表格等文本信息后做出判断。“实战”应用标准对大模型的多模态内容深度整合能力提出了新的要求,语义割裂、场景理解局限、决策失误等常见的模型缺陷制约了其在行业中的应用发展。合合信息在论坛期间推出“多模态文本智能技术”方案,该方案可通过文本相关空间位置理解深层语义逻辑,实现对多模态信息的“立体化综合化理解”,赋予模型真正的文本“阅读理解”能力。

文本智能技术助力解决多模态AI应用难题

多模态指利用多种不同形式或感知渠道的信息进行表达、交流和理解的方式,数据模态包括文本、图像、音频、视频等。2025年Gartner人工智能技术成熟度曲线显示,多模态AI将在未来五年成为各行业提升所有应用和软件产品功能的核心技术。围绕多模态大模型性能优化及行业应用等问题,论坛嘉宾开展了一场深刻的讨论。

为了助力大模型实现跨越模态的推理能力,哈尔滨工业大学计算学部长聘教授、博士生导师车万翔重点分享了“多模态思维链”技术,该技术将推理逻辑分解为一系列可解释的跨模态推理步骤,最终生成更为精准和可靠的结论。除了帮助大模型理清逻辑,解决“胡编乱造”问题,也是提升AI能力的重要方向。南开大学教授周宇介绍了一种系统化的OCR幻觉缓解方案,为多模态大模型的可视文本感知能力提升提供了有效路径。

真实的应用场景是技术不断迭代更新的动力。论坛现场,合合信息图像算法研发总监郭丰俊重点分享了文本智能技术的创新应用,帮助用户解决复杂场景下的文档图像问题。小红书hi lab团队算法工程师燕青结合行业实践,分享了一款基于单视觉语言模型的多语言文档布局解析工具“dots.ocr”。

除了商业应用,在文保领域,多模态大模型也发挥出了巨大价值。华中科技大学教授刘禹良在主题演讲中介绍了首个覆盖甲骨文专家破译全流程的辅助考释框架AlphaOracle,通过人类工作流程启发的音形义理破译流程,实现字形分析、拓片用法总结和传世文献做证的思路,成功在“劳”等字的辅助破译上取得突破。

多模态文本智能技术构建“感知-认知-决策”技术新范式

从文字、图像到视频,无论模态如何演变,其所承载的文本信息始终是AI理解世界的基座。实现具备自主感知、认知与决策能力的通用人工智能(AGI),首要前提是让机器充分理解作为知识载体的“文本”。基于此,合合信息推出了“多模态文本智能技术”方案,将技术处理对象从传统的文档(如PDF、Word等格式文件)延伸至多种承载文本信息的媒介,无论是论文、财报还是视频、自然场景,都能成为系统的理解对象。

在传统的文档处理技术中,“如何准确地提取信息”是重点关注方向。然而在真实业务场景中,信息往往以多模态组合形态存在,例如财报的数据需对照表格验证,国家标准文件中的插图依赖图例说明。为了解决多模态信息的协同解读需求,方案建立了从复杂场景文本感知到深层语义理解的技术闭环,让AI不仅能够“看清”文本,更能够理解其布局关联,解决不同模态间的信息割裂问题。

目前,“多模态文本智能技术”方案已将文本智能认知程度从语义理解拓展到类人推理及自主机器决策,形成了从感知到认知再到决策的技术实现路径。相较于传统的文档解析、识别系统,该方案让系统具备了更接近人类判断逻辑的自主决策能力,在完成对多模态信息的感知和理解后,能够根据用户意图,做出正确的决策。

随着多模态大模型融入产业进程,行业对AI系统的需求正从“功能实现”向“业务赋能”深化。合合信息“多模态文本智能技术”方案旨在推动AI系统从辅助工具进化为具备自主决策能力的业务伙伴,提升其在复杂场景中展现出的问题分析、决策思维及端到端解决问题的能力。方案已在金融、医药、教育等专业领域开展应用,通过对复杂文本的精准感知、综合理解和可靠决策,实现对业务流程的智能重构。

原标题:《用文本智能助力AGI落地,合合信息推出多模态文本智能技术落地方案》

栏目编辑:杨玉红

本文作者:新民晚报 金志刚

题图来源:采访对象提供

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
燃气表为啥不认南孚?原来不是电池差,这些门道让你少花冤枉钱

燃气表为啥不认南孚?原来不是电池差,这些门道让你少花冤枉钱

阿离家居
2026-01-31 14:18:56
60岁后存款达到这个数就够了,没必要太多,子女孝与不孝无所谓!

60岁后存款达到这个数就够了,没必要太多,子女孝与不孝无所谓!

千秋文化
2026-02-01 20:33:33
库里核磁结果出炉!确诊髌股关节综合症 再缺阵7场将无缘评奖

库里核磁结果出炉!确诊髌股关节综合症 再缺阵7场将无缘评奖

罗说NBA
2026-02-01 09:40:36
成了?刘维伟:我们看上的外援不愿意来,麦基还被首钢签了

成了?刘维伟:我们看上的外援不愿意来,麦基还被首钢签了

懂球帝
2026-02-01 14:34:14
1月20日起,60周岁以上老人可拨打12306购票:可选择线上或线下方式支付票款

1月20日起,60周岁以上老人可拨打12306购票:可选择线上或线下方式支付票款

环球网资讯
2026-01-21 09:48:23
普京会见伊朗最高领袖放了什么信号?

普京会见伊朗最高领袖放了什么信号?

陆弃
2026-02-01 08:35:03
丈夫半年收集妻子掉发,细心熨烫保存,“被子枕头上全是头发,他就收集起来,想看看我到底能掉多少根头发”

丈夫半年收集妻子掉发,细心熨烫保存,“被子枕头上全是头发,他就收集起来,想看看我到底能掉多少根头发”

观威海
2026-02-01 21:30:20
日本乒乓球名将水谷隼说:中国队之所以强大,根本不是技术优势

日本乒乓球名将水谷隼说:中国队之所以强大,根本不是技术优势

涵豆说娱
2026-01-31 19:34:33
唐嫣在国外很豪放!穿连体衣下面不系扣,难道不好好穿衣就时髦?

唐嫣在国外很豪放!穿连体衣下面不系扣,难道不好好穿衣就时髦?

章眽八卦
2026-01-05 12:27:07
2000 万捡漏!曼联瞄准卡塞米罗接班人,性价比完爆 1 亿标王

2000 万捡漏!曼联瞄准卡塞米罗接班人,性价比完爆 1 亿标王

奶盖熊本熊
2026-02-01 08:08:22
苏联历史惨痛一页:事后当局立马清洗现场,匆匆掩埋遇难者遗体

苏联历史惨痛一页:事后当局立马清洗现场,匆匆掩埋遇难者遗体

云霄纪史观
2026-01-30 01:47:42
美军连夜后撤,伊朗传巨大爆炸声,58国救兵到齐,俄防长通电中国

美军连夜后撤,伊朗传巨大爆炸声,58国救兵到齐,俄防长通电中国

流史岁月
2026-01-31 11:34:46
“继承权”无需再争!2026新规落地:父母房产按“这些规则”处理

“继承权”无需再争!2026新规落地:父母房产按“这些规则”处理

复转这些年
2026-01-27 03:00:03
今日!NBA开拓者VS骑士 中国男篮国手杨瀚森主场出场?央视无直播

今日!NBA开拓者VS骑士 中国男篮国手杨瀚森主场出场?央视无直播

晚池
2026-02-02 03:35:46
某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

戗词夺理
2026-01-24 16:05:41
鞑靼人:作为俄罗斯第二大族群,和蒙古族有何联系?

鞑靼人:作为俄罗斯第二大族群,和蒙古族有何联系?

掠影后有感
2026-01-09 11:04:45
讲一个“娱圈大姐大”凶狠报复“小三”的瓜!

讲一个“娱圈大姐大”凶狠报复“小三”的瓜!

涵豆说娱
2026-01-31 14:30:35
45岁富哥“北京肖哥”去世,前一天还晒老婆,死因曝光仇人都惋惜

45岁富哥“北京肖哥”去世,前一天还晒老婆,死因曝光仇人都惋惜

嫹笔牂牂
2025-12-31 07:07:52
号称“第一把刀”!许多上海人冲他来南京路!每天能卖500斤!

号称“第一把刀”!许多上海人冲他来南京路!每天能卖500斤!

上海黄浦
2026-02-01 21:50:02
刚刚!白银基金,紧急辟谣!

刚刚!白银基金,紧急辟谣!

中国基金报
2026-02-01 17:41:40
2026-02-02 09:20:49
上观新闻 incentive-icons
上观新闻
站上海,观天下
428578文章数 759135关注度
往期回顾 全部

科技要闻

10亿元宝红包突袭 复刻微信支付还是微视?

头条要闻

媒体:莫迪也上了爱泼斯坦文件 情节有点尴尬

头条要闻

媒体:莫迪也上了爱泼斯坦文件 情节有点尴尬

体育要闻

德约大度祝贺阿卡 幽默互动逗笑纳达尔

娱乐要闻

春晚第三次联排阵容曝光:全是实力派

财经要闻

国六货车被迫"换头" 每次收费超200元

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

手机
本地
时尚
教育
数码

手机要闻

传苹果正研发小型翻盖式折叠 iPhone

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

普通人衣服没必要买太多,准备好这些单品,简单实用又耐看

教育要闻

现在看易中天大师的金句,感觉买德云社的门票太亏了(三)

数码要闻

联想YOGA Air 14新增英特尔酷睿Ultra 5 228V版本,7999元

无障碍浏览 进入关怀版