网易首页 > 网易号 > 正文 申请入驻

对于领域任务:大语言模型、NLP建模、Agents适用场景探讨

0
分享至


大数据文摘受权转载自 FIN AI 探索

作者:袁峻峰

在国内大语言模型领域应用如火如荼,笔者这些日子有几点感受:

  • 更小规模参数模型有可能在特定任务效果更好.

通常当然是模型参数越大效果越好,但具体场景,还是要多个模型测测.所以对领域NLP问题,准备好验证测试集尤为重要.‍‍‍‍‍‍‍‍‍‍‍‍

  • NLP建模仍然是重要的方案之一

即使大模型越来越强,在实时性、准确性更高的场景,构建特定问题的NLP模型,并用特定数据训练还是不可或缺的方案.就如量化投资中的舆情因子,用大模型当然能做,可要更实时、更准确还是要单独建模.

  • Agents是最终方案吗?

1月5日有消息称OpenAI即将推出GPT Store用于开发者定制基于ChatGPT不同用途的Agents. 想象下,各行各业都是Agents,以后Agents得到个用户授权就自己找其他Agents去解决问题了.基于长链路问题,大模型并没有有效的方案,笔者认为,短期内,Agents还是提效为主.‍‍‍‍

接下来是以上观点的相关论述.

一、即使大语言模型是人类知识的概要,也不能独立解决领域问题.

ChatGPT是在构建全部人类知识的概要.博尔赫斯的《通天塔图书馆》,伟大的博尔赫斯具有天才的想象力,在他1941年发表的短篇小说描述这样一个图书馆:

宇宙(别的人把它叫做图书馆)是由一个数目不明确的,也许是无限数的六面体回廊所构成,每一个六面体的每一边墙,排列着书架......所有书籍不论怎么千变万化,都由同样的因素组成,即空格、句号、逗号和二十二个字母。他还引证了所有旅人已经确认的一个事实:在那庞大的图书馆里没有两本书是完全相同的。根据这些不容置疑的前提,他推断说这个图书馆是完全的,它的书架上收藏着二十多个书写符号的(数目尽管很多,却并不是无限的)全部可能实现的组合,或者全部可能表现的一切,包括所有文字可能表现的一切。

在某个六面体的某个书架上(人们都这样认为),一定存在着一本书,它是其他所有一切书的完整缩本或概要。有一个图书馆员看见过它,说它是一个神的类似物。


那本全宇宙知识的概要不正是ChatGPT等大模型的训练想要的结果吗?通天塔可不是一天建成,现在的技术还远达不生成全人类知道的概要.让我们设想下,在通天塔图书馆中找到那本神之书,就不再需要其他书了吗?

如同人生不是轨道,是旷野,所以不需要机器去指唯一明路。

所谓概要就如同统计一样,会抹灭了多样性.就如同有了数据、算法,还需要市场问题一样,市场不只是一个涉及收益、风险、资源有效配置,它也是关于选择、关于未来的解决方案。这也是通天塔图书馆中那本概要神之书也不能完全代替其他书的原因.如米兰·昆德拉说的“向前走,就是不管往哪儿走都行。”笔一划,就此打住,继续讨论行业领域方案.

二、数据+Finetuning的领域大模型还具备通用大模型的优点吗?‍‍‍‍‍

理想中的领域大模型是在ChatGPT基础上对领域问题进行数据+Finetuning处理,模型即能有效解决领域问题有具备大模型的通用知识.


Mata公司的研究人员发现,只使用1000个高质量的样本数据进行微调,在没有任何强化学习或人类偏好建模情况下。65B的LLaMA模型表现出非常优异的性能。论文认为模型的知识和能力几乎完全是在预训练期间学习的,而有监督微调(SFT)则教会它在与用户互动时应该使用哪种子分布的格式,少量高质量数据就能达到预期效果。这对我们做大模型应用的人当然是福音,在领域中使用少量高质量数据就可以解决问题。

领域问题,还行怎么行。

通常少量的高质量样本数据Finetuning只能达到更大参数一般性效果,但你想用更多高质量数据优化时就碰到问题了.更多高质量数据Finetuning也很难取得线性的提升. 看到篇论文,Mistral 7B (https://arxiv.org/abs/2310.06825)在各种 benchmark测试中,表现优于更大的同类模型,比如它的表现超过了13B Llama 2 模型。Mistral中使用的The sliding window attention mechanism,它只允许当前标记关注特定数量的前一个Token.但你完全无法确认是否模型性能提升是来自于模型优化,因为很可能和其训练数据强相关.‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

给人感觉又回到NLP炼丹的时代,对于一个问题,需要找最合适、相关的数据,在基础预训练模型上用个样参数、技巧、模型调优.论文Self-Instruct: Aligning Language Model with Self Generated Instructions就给出了系统性的方案,从 GPT-4 提炼数据,创建一个合成数据集来训练大模型。自然就让人想到借鸡生蛋的方案,基于GPT4等大参数模型,结合生成预训练数据的指令集,生成指令、输入和输出样本,然后对它们进行循环修剪,再用它们来微调自有大模型。这也是很多领域大模型的训练方案.


看起来这是自学习的过程.但本来大模型就用生成模型生产数据,这样的数据加工套娃方案的效果上限可想而之.

人类的原典还是你大爷

陈寅恪被誉为三百年学问第一人,一人担任了清华大学历史、中文、哲学三系教授,精通二十多门外语。上课号称“前人讲过的,我不讲;近日讲过的,我不讲;外国人讲过的,我不讲;我自己过去讲过的,我不讲。”他对读书的建议是读原典,“中国真正的原籍经典(原典)也只不过一百多部,其余的书都是在这些书的基础上互为引述参照而已。” 2023年诺贝尔生理学或医学奖得主卡塔林·考里科在访谈中也说:我的爱好之一是阅读经典的科学论文。当我意识到RNA中的尿苷会引爆免疫细胞,导致炎症和干扰素的产生时,我想知道以前是否有人注意到这一点。果不其然,在1963年的一篇论文中发现,从哺乳动物细胞中分离的核糖核酸不会诱导干扰素的产生。


人类原典还是不可替代的作用,不是套娃的机器教机器就能代替. 当然,如果大模型有能力预测一个并不存在的、理想中的、全能的“神”的下一个词,新的原典将诞生?可以想见ChatGPT5也远达不到能猜到全能神的下一个词。

‍‍‍

三、Agents领域方案‍‍‍‍

之前OpenAI Assistant API提供了持久线程和代码解析器,调用第三方函数等功能.将领域流程系统化也能工作.但不够通用智能,期待Agents能有进一步的解决方案.基于Agents的领域方案是重要方向之一,值得期待.

作者简介:

袁峻峰,《人工智能为金融投资带来了什么》作者,复旦大学金融学硕士,FRM金融风险管理师,目前就职于国内某大型券商,本文仅代表个人观点,不可作为投资上的建议。

租!GPU云资源

新上线一批A100/A800

运营商机房,服务有保障

扫码了解详情☝


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
浙江又一厅级干部被查:帅气的皮囊之下藏污纳垢,违纪违法

浙江又一厅级干部被查:帅气的皮囊之下藏污纳垢,违纪违法

故衣谈历史
2024-05-31 17:48:32
有人捐30万美元,筹款网站一度崩溃:特朗普被判有罪却得到支持者疯狂捐赠

有人捐30万美元,筹款网站一度崩溃:特朗普被判有罪却得到支持者疯狂捐赠

红星新闻
2024-05-31 11:16:12
离谱!女子应聘董事长秘书,月薪45000,被要求解决老板生理需求

离谱!女子应聘董事长秘书,月薪45000,被要求解决老板生理需求

看晓天下事
2024-05-30 18:29:45
周琦家庭内景曝光!客厅不小 已有二胎 专心辅导儿子作业

周琦家庭内景曝光!客厅不小 已有二胎 专心辅导儿子作业

胖子喷球
2024-05-31 16:37:01
成都这所三甲医院今日开诊,未来一个月挂号免费

成都这所三甲医院今日开诊,未来一个月挂号免费

红星新闻
2024-05-31 21:25:12
法网最新战报:王欣瑜张帅出局 贾巴尔万卓索娃晋级 郑钦文请跟上!

法网最新战报:王欣瑜张帅出局 贾巴尔万卓索娃晋级 郑钦文请跟上!

小豆豆赛事
2024-06-01 05:56:58
不要抢我的崽 崩溃妈妈抱着孩子尸体不放手 背后原因令人唏嘘不已

不要抢我的崽 崩溃妈妈抱着孩子尸体不放手 背后原因令人唏嘘不已

阿SIR观察
2024-05-31 10:27:32
“爱丽眼”配F-16:克里姆林宫不怎么说话,俄罗斯专家们很担忧

“爱丽眼”配F-16:克里姆林宫不怎么说话,俄罗斯专家们很担忧

鹰眼Defence
2024-05-31 17:23:22
中国最后一位太监孙耀庭自述:晚上伺候娘娘时,鞋底必须藏苍耳

中国最后一位太监孙耀庭自述:晚上伺候娘娘时,鞋底必须藏苍耳

历史1949
2024-05-27 01:19:33
新型卖淫方式,让人预想不到,但却真实存在!

新型卖淫方式,让人预想不到,但却真实存在!

雪影的情感
2023-11-18 11:51:16
明起!国内航班截载时间缩短至起飞前40分钟......

明起!国内航班截载时间缩短至起飞前40分钟......

骑行圣湖2018
2024-05-31 20:43:59
范冰冰晒过亿半山豪宅震撼景观 屋内有这款饮品存货证已融入香港

范冰冰晒过亿半山豪宅震撼景观 屋内有这款饮品存货证已融入香港

达达哥
2024-05-31 22:32:51
米尔斯海默:TikTok是以色列的灾难!

米尔斯海默:TikTok是以色列的灾难!

芯怡飞
2024-05-31 00:05:58
记者扮男客潜入采耳店,偷拍服务全过程:女技师、柔式按摩别有洞天

记者扮男客潜入采耳店,偷拍服务全过程:女技师、柔式按摩别有洞天

古今档案
2024-05-07 13:04:58
黄春梅回应汪小菲再婚,论智商论手段,大S小S远不及母亲

黄春梅回应汪小菲再婚,论智商论手段,大S小S远不及母亲

米椒娱乐
2024-05-31 11:09:05
真正的恐怖,就要到来,乌克兰将用无人机在俄罗斯本土布雷?

真正的恐怖,就要到来,乌克兰将用无人机在俄罗斯本土布雷?

青年的背包
2024-05-30 20:50:01
“胖东来式爆改”开启!永辉超市七成商品被淘汰,于东来:日均营收可涨5倍,明年要让永辉所有门店不亏钱【附零售行业现状分析】

“胖东来式爆改”开启!永辉超市七成商品被淘汰,于东来:日均营收可涨5倍,明年要让永辉所有门店不亏钱【附零售行业现状分析】

前瞻网
2024-05-31 17:30:12
中东4国高层访华,伊朗突然“变脸”,要求中国“选边站”?

中东4国高层访华,伊朗突然“变脸”,要求中国“选边站”?

朗威游戏说
2024-05-31 18:43:52
第一次看到出现在西藏的歼20,以一挡五的阵风怕不怕?

第一次看到出现在西藏的歼20,以一挡五的阵风怕不怕?

三叔的装备空间
2024-05-31 14:27:32
胖东来的陈列太魔幻!活鱼排排站、烧鸡站军姿,员工码货用尺量

胖东来的陈列太魔幻!活鱼排排站、烧鸡站军姿,员工码货用尺量

六毛朵朵
2024-05-25 12:16:19
2024-06-01 10:40:49
大数据文摘
大数据文摘
专注大数据,每日有分享!
6253文章数 94264关注度
往期回顾 全部

科技要闻

华为上新!余承东:问界6月销量将超4万辆

头条要闻

中方确认不参加6月的乌克兰和平峰会 俄方回应:支持

头条要闻

中方确认不参加6月的乌克兰和平峰会 俄方回应:支持

体育要闻

欧文:当老二怎么了?硬就行了!

娱乐要闻

白玉兰提名:胡歌、范伟争视帝

财经要闻

实锤!普华永道,危!

汽车要闻

吉利银河E5 Flyme Auto智能座舱首发

态度原创

教育
艺术
房产
本地
公开课

教育要闻

2024年高考人数公布 比去年增长51万人

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

房产要闻

重磅!琼海出台楼市新政:住房出租、挂牌计划出售,都可减套数!

本地新闻

食味印象|歙县限定!枇杷味儿的清甜初夏

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版