网易首页 > 网易科技 > 网易科技 > 正文

百川智能推出Baichuan2-192K大模型,一次可输入35万个汉字

0
分享至

10月30日消息,百川智能发布Baichuan2-192K大模型。其上下文窗口长度高达192K,能够处理约35万个汉字,是目前支持长上下文窗口最优秀大模型Claude2(支持100K上下文窗口,实测约8万字)的4.4倍,更是GPT-4(支持32K上下文窗口,实测约2.5万字)的14倍。

据悉,今年9月25日,百川智能已开放了Baichuan2的API接口,正式进军企业级市场,开启商业化进程。此次Baichuan2-192K将以API调用和私有化部署的方式提供给企业用户,目前百川智能已经启动Baichuan2-192K的API内测,开放给法律、媒体、金融等行业的核心合作伙伴。


上下文窗口长度是大模型的核心技术之一,通过更大的上下文窗口,模型能够结合更多上下文内容获得更丰富的语义信息,更好的捕捉上下文的相关性、消除歧义,进而更加准确、流畅的生成内容,提升模型能力。

百川智能称,Baichuan2-192K在Dureader、NarrativeQA、LSHT、TriviaQA等10项中英文长文本问答、摘要的评测集上表现优异,有7项取得SOTA,显著超过其他长窗口模型。

此外,LongEval的评测结果显示,在窗口长度超过100K后Baichuan2-192K依然能够保持非常强劲的性能,而其他开源或者商用模型在窗口增长后效果都出现了近乎直线下降的情况。

本次百川发布的Baichuan2-192K通过算法和工程的极致优化,实现了窗口长度和模型性能之间的平衡,做到了窗口长度和模型性能的同步提升。

算法方面,百川智能提出了一种针对RoPE和ALiBi动态位置编码的外推方案,该方案能够对不同长度的ALiBi位置编码进行不同程度的Attention-mask动态内插,在保证分辨率的同时增强了模型对长序列依赖的建模能力。在长文本困惑度标准评测数据PG-19上,当窗口长度扩大,Baichuan2-192K的序列建模能力持续增强。

工程方面,在自主开发的分布式训练框架基础上,百川智能整合目前市场上所有先进的优化技术,包括张量并行、流水并行、序列并行、重计算以及Offload功能等,独创了一套全面的4D并行分布式方案。该方案能够根据模型具体的负载情况,自动寻找最适合的分布式策略,极大降低了长窗口训练和推理过程中的显存占用。

百川智能在算法和工程上针对长上下文窗口的创新,不仅是大模型技术层面的突破,对于学术领域同样有着重要意义。Baichuan2-192K验证了长上下文窗口的可行性,为大模型性能提升开拓出了新的科研路径。

Baichuan2-192K现已正式开启内测,以API调用的方式开放给百川智能的核心合作伙伴,已经与财经类媒体及律师事务所等机构达成了合作,将Baichuan2-192K全球领先的长上下文能力应用到了传媒、金融、法律等具体场景当中,不久后将全面开放。

值得注意的是,Baichuan2-192K能够一次性处理和分析数百页的材料,对于长篇文档关键信息提取与分析,长文档摘要、长文档审核、长篇文章或报告编写、复杂编程辅助等真实场景都有助力作用。

据介绍,它可以帮助基金经理总结和解释财务报表,分析公司的风险和机遇;帮助律师识别多个法律文件中的风险,审核合同和法律文件;帮助技术人员阅读数百页的开发文档,并回答技术问题;还能帮助科员人员快速浏览大量论文,总结最新的前沿进展。(一橙)

延伸阅读
相关推荐
热点推荐
杠上了!京辽战被驱逐后,杨鸣深夜发视频回应裁判:必须学会回击

杠上了!京辽战被驱逐后,杨鸣深夜发视频回应裁判:必须学会回击

后仰大风车
2025-12-18 06:33:50
福建舰、山东舰的两个相同点

福建舰、山东舰的两个相同点

新民周刊
2025-12-18 09:13:33
孟晚舟也没想到,央剧《老舅》播出仅2天,姚安娜竟实现口碑逆转

孟晚舟也没想到,央剧《老舅》播出仅2天,姚安娜竟实现口碑逆转

观察鉴娱
2025-12-18 09:47:35
曝曼联队友怀疑B费已想离队,正与拉爵博弈!高层不满其公开抱怨

曝曼联队友怀疑B费已想离队,正与拉爵博弈!高层不满其公开抱怨

罗米的曼联博客
2025-12-19 09:36:06
谁说屁股大就不能穿瑜伽裤?黄色T恤搭薄荷绿瑜伽裤,成熟有活力

谁说屁股大就不能穿瑜伽裤?黄色T恤搭薄荷绿瑜伽裤,成熟有活力

小乔古装汉服
2025-11-12 11:46:01
谢振轩,一边帮明星妈妈处理律师函,

谢振轩,一边帮明星妈妈处理律师函,

小光侃娱乐
2025-12-19 07:25:03
全美第一个州!白卡受益人须满足工作要求,否则失去资格

全美第一个州!白卡受益人须满足工作要求,否则失去资格

华人生活网
2025-12-19 05:43:06
欧阳娜娜海边一张照冲上热搜:女孩最好的状态,藏在这三个字里!

欧阳娜娜海边一张照冲上热搜:女孩最好的状态,藏在这三个字里!

动物奇奇怪怪
2025-12-18 12:58:32
海南免税苹果iPhone17来了!最高比官方便宜2140元,但值得买吗?

海南免税苹果iPhone17来了!最高比官方便宜2140元,但值得买吗?

数评时代
2025-12-18 22:34:33
他一生6次海战全胜,收复众多领土,58岁被安排提前退休,为何

他一生6次海战全胜,收复众多领土,58岁被安排提前退休,为何

南书房
2025-12-01 16:55:05
他曾官至公安部副部长,却被关入秦城监狱,76年立大功任上海书记

他曾官至公安部副部长,却被关入秦城监狱,76年立大功任上海书记

顾史
2025-12-17 20:25:05
拒春晚、解散公司,和沈腾“决裂”,43岁的贾玲把自己作没了?

拒春晚、解散公司,和沈腾“决裂”,43岁的贾玲把自己作没了?

查尔菲的笔记
2025-12-17 13:22:25
A股股票回购一览:今日10家公司披露回购进展

A股股票回购一览:今日10家公司披露回购进展

每日经济新闻
2025-12-19 07:34:04
王雷李小萌露馅!出席活动冷脸互不理睬 原来恩爱只是“遮羞布”

王雷李小萌露馅!出席活动冷脸互不理睬 原来恩爱只是“遮羞布”

好贤观史记
2025-12-18 12:44:59
张凯毅凤冠事件后续:3D打印假冒手工,保险已赔付,更多黑幕被扒

张凯毅凤冠事件后续:3D打印假冒手工,保险已赔付,更多黑幕被扒

通鉴史智
2025-12-18 07:11:50
特斯拉称汽车宁少十马力不多一公斤 过大电池是负担

特斯拉称汽车宁少十马力不多一公斤 过大电池是负担

手机中国
2025-12-19 10:06:06
魏建军再开炮!推出购车防忽悠指南,有些车企瑟瑟发抖

魏建军再开炮!推出购车防忽悠指南,有些车企瑟瑟发抖

象视汽车
2025-12-19 07:00:05
美少妇晚上睡觉不关门,陌生小伙偷偷遛进,女子:隐约感到太小!

美少妇晚上睡觉不关门,陌生小伙偷偷遛进,女子:隐约感到太小!

趣味萌宠的日常
2025-10-22 10:16:29
六十年难遇的特殊冬至,今年我们该提前准备了吗?

六十年难遇的特殊冬至,今年我们该提前准备了吗?

眼界看视野
2025-12-18 21:27:28
1.8万,这可是史上最贵iPhone啊

1.8万,这可是史上最贵iPhone啊

放毒
2025-12-18 19:22:37
2025-12-19 10:52:49

科技要闻

2025新一代人工智能创业大赛总决赛收官

头条要闻

媒体:南博受赠名画被鉴伪后拨给文物店 以6800元售出

头条要闻

媒体:南博受赠名画被鉴伪后拨给文物店 以6800元售出

体育要闻

没有塔图姆,还有塔秃姆

娱乐要闻

演员任敏生理期南极跳海,回船喝酒

财经要闻

尹艳林:呼吁加快2.5亿新市民落户进程

汽车要闻

轴距加长配置升级 广汽丰田雷凌L官图发布

态度原创

时尚
健康
亲子
旅游
数码

“烟管裤”今年冬天爆火,怎么搭都时髦!

这些新疗法,让化疗不再那么痛苦

亲子要闻

驼奶粉品牌排名,2025骆驼奶粉终极评测品牌排行榜,覆盖多种人群需求

旅游要闻

冰雪童话世界盛大启幕,哈尔滨冰雪大世界迎客

数码要闻

ECS精英预热CES 2026:将展出H810迷你主机与多款轻薄本

无障碍浏览 进入关怀版
×