网易首页 > 网易号 > 正文 申请入驻

百川智能发布Baichuan2—Turbo系列API 增加搜索增强知识库能力

0
分享至

雷递网 乐天 12月19日

百川智能今日宣布开放基于搜索增强的Baichuan2-Turbo系列API,包含Baichuan2-Turbo-192K 及Baichuan2-Turbo。在支持192K超长上下文窗口的基础上,还增加了搜索增强知识库的能力。

百川智能称,即日起,API用户可上传文本资料来创建自身专属知识库,从而根据自身业务需求打造更完整、高效的智能解决方案。

此外,百川智能还升级了官网模型体验,目前其官网大模型已支持PDF、Word等多种文本上传以及URL网址输入,用户可通过官网入口体验搜索增强和长窗口加持后的通用智能。

百川智能认为,搜索增强是大模型落地应用的关键,能够有效解决幻觉、时效性差、专业领域知识不足等阻碍大模型应用的核心问题。一方面,搜索增强技术能有效提升模型性能,并且使大模型能“外挂硬盘”,实现互联网实时信息+企业完整知识库的“全知”;另一方面,搜索增强技术还能让大模型精准理解用户意图,在互联网和专业/企业知识库海量的文档中找到与用户意图最相关的知识,然后将足够多的知识加载到上下文窗口,借助长窗口模型对搜索结果做进一步的总结和提炼,更充分地发挥上下文窗口能力,帮助模型生成最优结果,从而实现各技术模块之间的联动,形成一个闭环的强大能力网络。

大模型+搜索构成完整技术栈

尽管大模型是划时代的技术突破,但现阶段大模型并不完美,幻觉、时效性差、缺乏专业领域知识等问题,是其落地千行百业必须要面对的挑战。

对此,业界探索了多种解决方案,包括扩大参数规模、扩展上下文窗口长度、为大模型接入外部数据库,使用特定数据训练或微调垂直行业大模型等。这些路线各有优势,但也都存在自身的局限。

例如,持续扩大模型参数虽然能够不断提升模型智能,但是需要海量数据和算力的支撑,巨额的成本对中小企业非常不友好,而且完全依靠预训练也很难解决模型的幻觉、时效性等问题。

业界亟需找到一条集诸多优势于一体的路径,将大模型的智能切实转化为产业价值。在百川智能的技术思考中,大模型+搜索增强是大模型时代的新计算机,大模型类似于计算机的CPU,通过预训练将知识内化在模型内部,然后根据用户的Prompt生成结果;上下文窗口可以看做计算机的内存,存储了当下正在处理的文本;互联网实时信息与企业完整知识库共同构成了大模型时代的硬盘。

基于这一技术理念,百川智能称,以Baichuan2大模型为核心,将搜索增强技术与大模型深度融合,结合此前推出的超长上下文窗口,构建了一套大模型+搜索增强的完整技术栈,实现了大模型和领域知识、全网知识的全新链接。

大模型+搜索增强可解决99%企业知识库的定制化需求

企业自有数据/知识库,是企业的核心竞争力。大模型如果不能结合企业自有数据/知识库,对企业没有价值。对此,业界的传统做法是做行业大模型,通过预训练或者微调训练大模型。

但是基于特定数据预训练或微调垂直行业大模型需要高密度的技术人才团队、大量的算力支持,并且每更新一次数据都要重新训练或微调模型,不仅成本高昂、灵活性差,更关键的是不能保证训练的可靠性和应用的稳定性,多次训练后仍会出现问题。此外,大部分企业数据,都是结构化的数据,也不适合SFT,模型无法准确记忆结构化信息,会带来幻觉。

为解决传统方法的缺陷,业内探索了长上下文窗口和向量数据库两种较好的路径。

在此基础上,百川智能称,将向量数据库升级为搜索增强知识库,提升了大模型获取外部知识的能力,并且把搜索增强知识库和超长上下文窗口结合,让模型可以连接全部企业知识库以及全网信息,能够替代绝大部分的企业个性化微调,解决99%企业知识库的定制化需求,不仅为企业节省巨大成本,还能够更好地实现垂直领域知识的沉淀,让专有知识库能够真正成为企业不断增值的资产。

百川智能构建的大模型+搜索增强解决方案解决掉幻觉和时效性问题后,有效提升了大模型的可用性,拓展了大模型能够覆盖的领域,例如金融、政务、司法、教育等行业的智能客服、知识问答、合规风控、营销顾问等场景。而搜索增强相比微调,在提升可用性的同时还显著降低了应用成本,让更多中小企业也能够享受到大模型带来的变革,特别是在电商行业可帮助广大店家提升营销效率乃至转化率。

此外,这种应用方式还可以帮助提升企业各种场景应用创新的效率,加速大模型在千行百业创造实际价值。

稀疏检索与向量检索并行召回率提升至 95%

虽然搜索增强能够有效解决大模型落地应用的诸多问题,但在技术层面构建这样一套系统却并不容易,需要深厚的搜索和模型研发经验来发现并解决各个环节的技术难点与挑战。

在大语言模型时代,用户的需求表达不仅口语化、多元化,并且还与上下文强相关,因此用户需求(Prompt)与搜索的对齐成为了大模型获取外部知识过程中最为核心的问题。为了更精准地理解用户意图,百川智能使用自研大语言模型对用户意图理解进行微调,能够将用户连续多轮、口语化的Prompt信息转换为更符合传统搜索引擎理解的关键词或语义结构。

百川智能还参考Meta的CoVe(Chain-of-Verification Reduces Hallucination in Large Language Models)技术,将真实场景的用户复杂问题拆分成多个独立可并行检索的子结构问题,从而让大模型可以针对每个子问题进行定向的知识库搜索,提供更加准确和详尽的答案。

同时通过自研的TSF(Think Step-Further)技术,百川智能的知识库可以推断出用户输入背后深层的问题,更精准的理解用户的意图,进而引导模型回答出更有价值的答案,为用户提供全面和满意的输出结果。

在精确理解用户需求的基础上,想要进一步提升知识获取的效率和准确性,还需要借助向量模型解决用户需求和知识库的语义匹配问题。

为实现更好的向量检索效果,百川智能自研的向量模型使用了超过 1.5T token 的高质量中文数据进行预训练,通过自研的损失函数解决了对比学习对于 batchsize 的依赖,在C-MTEB评测集 6 个任务(分类、聚类、文本推理、排序、检索、文本相似度) 中的 5 个任务上都取得了效果的大幅领先,综合分数登上榜首。

虽然当下构建大模型知识库的主流方法是向量检索,但是向量模型的效果过于依赖训练数据的覆盖,在训练数据未覆盖的领域泛化能力会有明显折扣,并且用户 prompt 和知识库中文档长度的差距也给向量检索带来了很大挑战。

对此,百川智能称,在向量检索的基础上融合了稀疏检索和 rerank模型。通过稀疏检索与向量检索并行的混合检索方式,将目标文档的召回率提升到了 95%。

对于大模型在回答过程中由于引用资料不准确以及与大模型不匹配,导致模型的“幻觉”加重的现象。百川智能还在通用RAG(检索增强生成)的技术基础上首创了Self-Critique大模型自省技术,该技术能够让大模型基于Prompt对检索回来的内容从相关性、可用性等角度进行自省,筛选出最优质、最匹配的候选内容,有效提升材料的知识密度和广度,并降低检索结果中的知识噪声。

长窗口+搜索实现“真·大海捞针”

长上下文窗口虽然可以接收更长的文本信息,但扩展上下文窗口长度会影响模型性能,在当前技术下存在上限。并且长窗口每次回答问题都要将文档全部重读一遍,推理效率低、成本高。

百川智能称,通过长窗口+搜索增强的方式,在192K长上下文窗口的基础上,将大模型能够获取的原本文本规模提升了两个数量级,达到5000万tokens。通过搜索增强,模型可以先根据用户的Prompt在海量的文档中检索出最相关的内容,再将这些文档与Prompt一起放到长窗口中,有效节省了推理费用和时间成本。

“大海捞针”测试(Needle in the Heystack)是由海外知名AI创业者兼开发者 Greg Kamradt 设计的,业内公认最权威的大模型长文本准确度测试方法。

对于192k token以内的请求,百川智能称,可以实现100%回答精度。

而对于192k token以上的文档数据,百川智能结合搜索系统,将测试集上下文长度扩展到 5000w tokens,分别评测了纯向量检索和稀疏检索+向量检索的检索的效果。测试结果显示,稀疏检索+向量检索的方式可以实现95%的回答精度,即使在 5000万tokens的数据集中也可以做到接近全域满分,而单纯的向量检索只能实现 80%的回答精度。

雷递由媒体人雷建平创办,若转载请写明来源。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
部长王祥喜,被查

部长王祥喜,被查

新京报政事儿
2026-01-31 16:08:13
澳网夺冠后,张帅名利双收!大满贯+1,分享392万奖金,排名上升

澳网夺冠后,张帅名利双收!大满贯+1,分享392万奖金,排名上升

刘姚尧的文字城堡
2026-01-31 11:53:02
古特雷斯:联合国面临财政崩溃 资金可能在7月前耗尽

古特雷斯:联合国面临财政崩溃 资金可能在7月前耗尽

每日经济新闻
2026-01-31 07:38:32
火车新规2026正式执行!禁带品、实名制升级,这些坑千万别踩

火车新规2026正式执行!禁带品、实名制升级,这些坑千万别踩

复转这些年
2026-01-30 23:33:48
浙江卫视炸了!7000万网红怒怼评委:你15年没歌凭啥说我?

浙江卫视炸了!7000万网红怒怼评委:你15年没歌凭啥说我?

不写散文诗
2026-01-30 12:16:42
爸妈!真的不要再往马桶里倒水了!

爸妈!真的不要再往马桶里倒水了!

果壳
2026-01-31 12:15:41
全是假的!检测结果触目惊心!很多老人都在吃

全是假的!检测结果触目惊心!很多老人都在吃

华人星光
2026-01-30 11:40:47
阿富汗塔利班恢复奴隶制,全世界必须坚决地说:不!

阿富汗塔利班恢复奴隶制,全世界必须坚决地说:不!

廖保平
2026-01-31 09:31:13
震惊!武汉名校毕业当保安,母校约谈后被开除,3800元工资也没了

震惊!武汉名校毕业当保安,母校约谈后被开除,3800元工资也没了

火山诗话
2026-01-28 18:57:12
抗癌百年,我们全搞错了,揭秘:癌症不是基因叛变,而是代谢绝望

抗癌百年,我们全搞错了,揭秘:癌症不是基因叛变,而是代谢绝望

健康之光
2026-01-27 12:35:03
又是热卖第一!李亚鹏直播间人气30万+,1600多的普洱茶一抢而空

又是热卖第一!李亚鹏直播间人气30万+,1600多的普洱茶一抢而空

火山诗话
2026-01-31 06:15:08
临沧市公安局临翔分局原副局长梅某为走私、赌场等提供庇护,入股色情场所参与分红,受贿174万元一审获刑6年

临沧市公安局临翔分局原副局长梅某为走私、赌场等提供庇护,入股色情场所参与分红,受贿174万元一审获刑6年

黄河新闻网吕梁频道
2026-01-31 14:08:45
国际金价银价继续大幅下跌

国际金价银价继续大幅下跌

澎湃新闻
2026-01-31 03:58:08
万科年报亏820亿!深圳拼死守它,真相远比你想的更吓人

万科年报亏820亿!深圳拼死守它,真相远比你想的更吓人

贩财局
2026-01-31 12:38:38
“价格屠夫”:河北电商,正在“血洗”全国批发市场

“价格屠夫”:河北电商,正在“血洗”全国批发市场

苏格拉高
2026-01-31 07:50:47
钱再多有什么用?52岁刘强东上千亿身家,儿子却是他一生的遗憾

钱再多有什么用?52岁刘强东上千亿身家,儿子却是他一生的遗憾

华史谈
2026-01-31 06:14:22
发一张教室女生走光图!

发一张教室女生走光图!

果粉之家
2026-01-30 12:23:03
韩国公布具俊晔祭拜大S画面,首回应陪伴大S原因,几个行为遭质疑

韩国公布具俊晔祭拜大S画面,首回应陪伴大S原因,几个行为遭质疑

古希腊掌管月桂的神
2026-01-31 10:44:36
金晨事件后续,内部聊天曝光,太抠门没谈拢,多段绯闻记者放实锤

金晨事件后续,内部聊天曝光,太抠门没谈拢,多段绯闻记者放实锤

李健政观察
2026-01-29 20:20:56
全球唯一一只不属于中国的熊猫,叫欣欣,吃不到竹子吃的是仙人掌

全球唯一一只不属于中国的熊猫,叫欣欣,吃不到竹子吃的是仙人掌

西楼知趣杂谈
2026-01-31 13:18:43
2026-01-31 17:32:49
雷递 incentive-icons
雷递
关注互联网大产业
25583文章数 72948关注度
往期回顾 全部

科技要闻

中国车企和特斯拉的下一战,战场已定

头条要闻

市公安局原副局长获刑:私放走私车辆 入股色情场所

头条要闻

市公安局原副局长获刑:私放走私车辆 入股色情场所

体育要闻

新时代得分王!东皇37+三双刷7纪录怒吼释放

娱乐要闻

成龙入驻小红书,怼脸近照没有老年斑

财经要闻

白银,暴跌!黄金,40年最大跌幅!

汽车要闻

新款宾利欧陆GT S/GTC S官图发布 V8混动加持

态度原创

家居
教育
时尚
本地
亲子

家居要闻

蓝调空舍 自由与个性

教育要闻

新加坡国立大学化学生物工程系张亚敏课题组招聘【生物电子、医疗器件、电化学】博士后

2026巴黎高定时装周|全世界最美的衣服都在这了

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

亲子要闻

白百何终于晒儿子正脸!元宝帅气模样公开,网友:比爸爸还好看

无障碍浏览 进入关怀版