网易首页 > 网易号 > 正文 申请入驻

超越 GPT-4!能在手机上跑的大模型,移动的内容输出堡垒!

0
分享至

随着科技的飞速发展,人工智能(AI)已经从科幻小说的幻想变成了现实世界中不可或缺的一部分。最近,斯坦福大学研究人员推出的Octopus v2模型,不仅在性能上超越了GPT-4,而且能够在智能手机等移动设备上运行,这标志着我们向移动生产力工具的新时代迈出了重要一步。


在智能手机普及的今天,人们越来越依赖这些小巧的设备来完成日常工作和生活中的各种任务。然而,传统的云环境下的大型语言模型虽然性能高,但存在隐私和成本方面的担忧。

Octopus v2的出现,解决了这些痛点,它能够在保持高准确性的同时,显著降低延迟,为用户提供快速且安全的智能服务。

Octopus v2的革命性突破:1. 20亿参数的设备上语言模型

Octopus v2是一个具有20亿参数的设备上语言模型,专为提升自动工作流程中的API调用性能而设计。它通过优化模型结构和训练方法,实现了在设备上的高效运行,减少了对云服务的依赖。

2. 显著降低延迟

Octopus v2模型在延迟上减少了约35倍,这意味着用户即使在没有网络连接的情况下,也能够享受到快速的智能服务。

3. 高准确性

实验结果显示,Octopus v2在准确性上达到了99.524%,这在移动设备上的AI模型中是前所未有的。

4. 功能令牌的引入

研究人员通过引入特殊的功能令牌,使得模型能够更直接地映射功能描述到特定的令牌,从而减少了理解上下文所需的数据量。

5. 能耗降低

这项技术的核心在于提高了模型的运行效率,同时降低了能耗,使得智能助手能够在各种边缘设备上运行。


Octopus v2的应用场景:

Octopus v2模型的应用场景非常广泛,包括但不限于:

1.智能手机

在智能手机上,Octopus v2可以作为一个全功能的智能助手,帮助用户管理日程、发送邮件、获取天气信息等。

2.汽车

在汽车上,Octopus v2可以用于导航、播放音乐、控制车内温度等,提升驾驶体验。

3.VR头盔

在虚拟现实(VR)领域,Octopus v2可以提供更加沉浸式的交互体验,如虚拟导游、游戏角色互动等。

4.个人电脑

在个人电脑上,Octopus v2可以作为一个强大的生产力工具,帮助用户自动化文档编辑、数据分析等工作。

研究亮点与技术细节:研究亮点

  • 提出一种新的方法,使得设备上的模型准确性和延迟上超越了GPT-4。

  • 通过引入新的特殊的令牌和微调方法,显著提高了功能调用的性能。

技术细节
  • 设备上模型(On-device model):直接在用户的设备上运行的人工智能模型。

  • API调用(API calling):模型通过编程接口(API)来执行特定的任务或功能。

  • 延迟(Latency):从发出请求到收到响应所经历的时间。

  • 功能令牌(Functional tokens):在模型训练中引入的特殊标记,用于表示特定的功能或操作。


数据集与模型开发:

为了训练、验证和测试阶段采用高质量数据集,研究团队用三个关键阶段创建数据集:

  1. 生成相关的查询及其关联的函数调用参数;

  2. 由适当的函数组件生成不相关的查询;

  3. 通过Google Gemini实现二进制验证支持。

研究团队编写了20个Android API描述,用于训练模型。例如,一个用于获取趋势新闻的API描述如下:

def get_trending_news (category=None, region='US', language='en', max_results=5):

"""

Fetches trending news articles based on category, region, and language.

Parameters:

- category (str, optional): News category to filter by, by default use None for all categories. Optional to provide.

- region (str, optional): ISO 3166-1 alpha-2 country code for region-specific news, by default, uses 'US'. Optional to provide.

- language (str, optional): ISO 639-1 language code for article language, by default uses 'en'. Optional to provide.

- max_results (int, optional): Maximum number of articles to return, by default, uses 5. Optional to provide.

Returns:

- list [str]: A list of strings, each representing an article. Each string contains the article's heading and URL.

"""


模型训练与评估

该研究采用Google Gemma-2B模型作为框架中的预训练模型,并采用两种不同的训练方法:完整模型训练和LoRA模型训练。

在完整模型训练中,使用AdamW优化器,学习率设置为5e-5,warm-up的step数设置为10,采用线性学习率调度器。

LoRA模型训练采用与完整模型训练相同的优化器和学习率配置,LoRA rank设置为16,并将LoRA应用于以下模块:q_proj、k_proj、v_proj、o_proj、up_proj、down_proj。其中,LoRA alpha参数设置为32。

对于两种训练方法,epoch数均设置为3。使用以下代码,就可以在单个GPU上运行

Octopus-V2-2B模型:

from transformers import AutoTokenizer, GemmaForCausalLMimport torchimport time

def inference (input_text):

start_time = time.time ()

input_ids = tokenizer (input_text, return_tensors="pt").to (model.device)

input_length = input_ids ["input_ids"].shape [1]

outputs = model.generate (

input_ids=input_ids ["input_ids"],

max_length=1024,

do_sample=False)

generated_sequence = outputs [:, input_length:].tolist ()

res = tokenizer.decode (generated_sequence [0])

end_time = time.time ()

return {"output": res, "latency": end_time - start_time}

model_id = "NexaAIDev/Octopus-v2"

tokenizer = AutoTokenizer.from_pretrained (model_id)

model = GemmaForCausalLM.from_pretrained (

model_id, torch_dtype=torch.bfloat16, device_map="auto"

)

input_text = "Take a selfie for me with front camera"

nexa_query = f"Below is the query from the users, please call the correct function and generate the parameters to call the function.\n\nQuery: {input_text} \n\nResponse:"

start_time = time.time () print ("nexa model result:\n", inference (nexa_query)) print ("latency:", time.time () - start_time,"s")

Octopus v2模型的推出,不仅为智能助手的发展打开了新的大门,也为未来的人工智能技术提供了新的可能性。

它在准确性和延迟上超越GPT-4,并且能够在各种边缘设备上部署,这无疑将极大地推动AI技术的普及和应用。

随着技术的不断进步,我们可以预见,未来每个人的智能手机都将成为一个强大的生产力工具,帮助我们更高效地完成工作,享受更加智能化的生活。

论文地址:https://arxiv.org/abs/2404.01744

模型主页:https://huggingface.co/NexaAIDev/Octopus-v2

欢迎加入星球一起讨论学习!

都看到这里了感觉得还不错,随手点个赞、在看、转发三连支持一下吧。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刘汉承包绵阳机场,地头蛇王永成从中作梗,第二天就被灭门

刘汉承包绵阳机场,地头蛇王永成从中作梗,第二天就被灭门

纸鸢奇谭
2024-05-15 12:21:33
美将对东南亚四国太阳能产品恢复征收关税

美将对东南亚四国太阳能产品恢复征收关税

财联社
2024-05-16 18:27:14
亚洲货币保卫战,越南第一个倒下了,曾经被吹上天如今跌落神坛

亚洲货币保卫战,越南第一个倒下了,曾经被吹上天如今跌落神坛

担扑
2024-05-16 18:07:04
能认出来是谁吗?瘦得前胸贴后背了,腿还没旁边人的胳膊粗2

能认出来是谁吗?瘦得前胸贴后背了,腿还没旁边人的胳膊粗2

石辰搞笑日常
2024-05-16 13:19:56
上海黄浦豪宅开盘即售罄,75套房源45分钟收金31亿元

上海黄浦豪宅开盘即售罄,75套房源45分钟收金31亿元

澎湃新闻
2024-05-16 19:54:27
海警喊话黄岩岛附近中国渔民,我却笑死在评论区!网友:等新华社电

海警喊话黄岩岛附近中国渔民,我却笑死在评论区!网友:等新华社电

毒舌说历史1
2024-05-16 17:51:36
外媒:俄乌冲突将是对F-16战机的“最严酷考验”

外媒:俄乌冲突将是对F-16战机的“最严酷考验”

中国青年报
2024-05-13 15:39:13
德国公布欧洲杯27人名单:带4门将!1.1亿天才入选,10大名将无缘

德国公布欧洲杯27人名单:带4门将!1.1亿天才入选,10大名将无缘

我爱英超
2024-05-16 19:25:49
社区书记与访民通话录音曝光,颠覆了我对法律的认知!

社区书记与访民通话录音曝光,颠覆了我对法律的认知!

兵叔评说
2024-05-15 10:20:49
自爆身分!多田有花:我老公是东京证交所上市的董事长!

自爆身分!多田有花:我老公是东京证交所上市的董事长!

孤独的独角兽影视
2024-05-15 11:25:02
炸裂!汽车女主播擦边直播,多次展露隐私部位,直播间录屏被曝光

炸裂!汽车女主播擦边直播,多次展露隐私部位,直播间录屏被曝光

阿芒娱乐说
2024-05-15 19:38:35
脑子里有虫?这其实是个全球性的问题

脑子里有虫?这其实是个全球性的问题

利维坦
2024-05-16 09:00:46
《我的阿勒泰》周依然:别整容,演艺圈不缺美女,缺这样的剧抛脸

《我的阿勒泰》周依然:别整容,演艺圈不缺美女,缺这样的剧抛脸

凌晨一点的猫
2024-05-15 10:23:33
中国15个副省级市或将调整?3市恐遭撤销,苏州长沙有望加入?

中国15个副省级市或将调整?3市恐遭撤销,苏州长沙有望加入?

开心体育站
2024-05-16 19:40:43
康师傅方便面即将全线涨价

康师傅方便面即将全线涨价

南方都市报
2024-05-16 09:48:13
降薪850万,重签快船!距离伟大越来越远,你已经无力改变结局

降薪850万,重签快船!距离伟大越来越远,你已经无力改变结局

呆哥聊球
2024-05-16 22:18:54
重庆男子吊脖子死亡现场画面曝光,血迹惹猜测,当地回应震惊全网

重庆男子吊脖子死亡现场画面曝光,血迹惹猜测,当地回应震惊全网

小毅讲历史
2024-05-16 19:19:16
痛悼!大师在上海逝世,享年100岁

痛悼!大师在上海逝世,享年100岁

上观新闻
2024-05-16 11:32:10
中央纪委“女将”作报告!应勇出席,现场重申这些铁规禁令

中央纪委“女将”作报告!应勇出席,现场重申这些铁规禁令

政知新媒体
2024-05-16 19:12:14
男子称新买宝马车未到首保就自燃被毁,鉴定机构称系电路故障 宝马:很可能为外来火源导致

男子称新买宝马车未到首保就自燃被毁,鉴定机构称系电路故障 宝马:很可能为外来火源导致

红星新闻
2024-05-15 17:51:00
2024-05-17 08:48:49
李飞笔记
李飞笔记
始于AI,不止AI!
47文章数 1关注度
往期回顾 全部

科技要闻

京东加大营销减少研发,逐渐回归零售公司

头条要闻

普京在华致辞:在中国我感觉就像在家里一样

头条要闻

普京在华致辞:在中国我感觉就像在家里一样

体育要闻

生命最后一年,他决定完成自己的“遗愿清单”

娱乐要闻

街头打代驾?李溪芮想翻红那真挺难的

财经要闻

魅族造车,黄章这次不会再输雷军?

汽车要闻

内饰改款/功能升级 新博越L将于5月19日上市

态度原创

艺术
亲子
本地
时尚
公开课

艺术要闻

湖山放怀——牛朝山水画作品展 呈现10年间160余幅山水佳作

亲子要闻

为什么不能碰滑滑梯和木马啊...

本地新闻

吃火锅减肥?还得是宁夏人敢想

别总是穿牛仔裤了!见过世面的女人这么搭,通勤休闲都美翻了

公开课

父亲年龄越大孩子越不聪明?

无障碍浏览 进入关怀版