网易首页 > 网易号 > 正文 申请入驻

OpenAI 发布 o1 及开发者新工具:模型升级、实时 API 优化、偏好微调等重磅更新

0
分享至

OpenAI 12天发布会Day9, 今日宣布推出一系列针对开发者的强大模型、全新定制工具以及性能、灵活性和成本效益的升级,旨在助力开发者构建更智能、更强大的 AI 应用。本次更新涵盖以下关键内容:

1. API 中的 OpenAI o1:

OpenAI o1 模型正式在 API 中向 5 级使用用户开放。作为 OpenAI o1-preview 的继任者,o1 模型旨在处理复杂的、多步骤任务,并提供更高的准确性。该模型具备以下关键特性:

  • 函数调用:无缝连接 o1 模型与外部数据和 API。

  • 结构化输出:生成可靠地遵循自定义 JSON Schema 的响应。

  • 开发者消息:允许开发者指定模型的指令或上下文,例如定义语气、风格和其他行为指导。

  • 视觉能力:能够理解图像,为科学、制造或编码等需要视觉输入的领域解锁更多应用。

  • 更低延迟:针对给定请求,o1 模型平均使用的推理 Token 比 o1-preview 少 60%。

  • 推理力度参数:新增reasoning_effortAPI 参数,允许开发者控制模型在回答问题前的思考时间

本次发布的 o1-2024-12-17 版本是两周前在 ChatGPT 中发布的模型的全新后训练版本。它在基于用户反馈的模型行为方面进行了改进,同时保持了在 o1 系统卡片中评估的前沿能力。此外,ChatGPT 中的 o1 模型也同步更新至此版本。

在多个基准测试中,o1-2024-12-17 取得了最新的技术水平,显著提高了成本效益和性能。具体数据如下:


类别评估指标o1-2024-12-17o1-preview通用GPQA diamond 75.7 73.3
MMLU (pass @1) 91.8 90.8编码SWE-bench Verified 48.9 41.3
LiveCodeBench 76.6 52.3数学MATH (pass @1) 96.4 85.5
AIME 2024 (pass @1) 79.2 42.0
MGSM (pass @1) 89.3 90.8视觉MMMU (pass @1) 77.3 —
MathVista (pass @1) 71.0 —事实性SimpleQA 42.6 42.4代理TAU-bench (零售) 73.5 —
TAU-bench (航空) 54.2 —

此外,测试表明,o1-2024-12-17 在函数调用和结构化输出方面显著优于 gpt-4o

OpenAI 将逐步增加模型的访问权限,同时努力扩展访问范围至其他使用级别并提高速率限制。

2. 实时 API 改进:

实时 API 旨在帮助开发者创建低延迟、自然的对话体验,适用于语音助手、实时翻译工具、虚拟导师等应用场景。本次更新重点包括:

WebRTC 支持:引入 WebRTC 支持,简化跨平台实时语音产品的构建和扩展。WebRTC 负责处理音频编码、流式传输、噪声抑制和拥塞控制。以下是一个使用 JavaScript 集成 WebRTC 的示例代码:

   async function createRealtimeSession(localStream, remoteAudioEl, token) {        const pc = new RTCPeerConnection();        pc.ontrack = e => remoteAudioEl.srcObject = e.streams[0];        pc.addTrack(localStream.getTracks()[0]);        const offer = await pc.createOffer();        await pc.setLocalDescription(offer);        const headers = { Authorization: `Bearer ${token}`, 'Content-Type': 'application/sdp' };        const opts = { method: 'POST', body: offer.sdp, headers };        const resp = await fetch('https://api.openai.com/v1/realtime', opts);        await pc.setRemoteDescription({ type: 'answer', sdp: await resp.text() });        return pc;    }

降低 GPT-4o 和 GPT-4o mini 的实时快照成本:发布 gpt-4o-realtime-preview-2024-12-17,语音质量更高,输入更可靠,成本降低 60%。同时,推出 GPT-4o mini 的实时版本 gpt-4o-mini-realtime-preview-2024-12-17,以更低的成本提供相同的语音体验

更强大的响应控制:

  • 并发带外响应:支持后台任务,例如内容审核或分类,而不会中断用户的语音交互

  • 自定义输入上下文:允许开发者指定哪些会话项作为模型输入

  • 受控响应时序:支持使用服务器端语音活动检测(VAD),并手动触发语音回复,从而更好地控制时序和准确性

  • 最大会话时长:从 15 分钟增加到 30 分钟

3. 偏好微调:

微调 API 现在支持偏好微调,使开发者可以根据用户和开发者的偏好定制模型。该方法使用直接偏好优化(DPO)来比较模型响应对,教会模型区分偏好和非偏好输出。偏好微调在语气、风格和创造性等主观任务上尤为有效。

与监督微调相比,偏好微调具有以下差异:

监督微调 (SFT)偏好微调 (PFT)目标鼓励模型生成正确的输出 优化模型以倾向期望的行为
通过复制标记的输出 通过加强偏好响应并降低非偏好响应的可能性训练数据确切的输入和输出对 通过人工注释、A/B 测试或合成数据生成的偏好和非偏好模型输出对用例易于准备理想输出的任务,例如自定义代码格式和严格的正确性 对于“更好”的响应是主观的,例如创意写作或总结的任务更有效

偏好微调已开始与合作伙伴进行测试,并已取得令人鼓舞的成果。偏好微调将首先应用于 gpt-4o-2024-08-06,并将很快支持 gpt-4o-mini-2024-07-18。

4. Go 和 Java SDK:

OpenAI 还推出了两个新的官方 SDK,分别针对 Go 和 Java,以完善现有的 Python、Node.js 和 .NET 库。

Go SDK:适用于构建可扩展的 API 和后端系统。以下是 Go SDK 的示例代码:

    client := openai.NewClient()     ctx := context.Background()     prompt := "Write me a haiku about Golang."     completion, err := client.Chat.Completions.New(       ctx,        openai.ChatCompletionNewParams{         Messages: openai.F(           []openai.ChatCompletionMessageParamUnion{             openai.UserMessage(prompt),           },         ),         Model: openai.F(openai.ChatModelGPT4o),       },     )

Java SDK:则适用于企业软件开发,提供类型化的请求和响应对象,以及管理 API 请求的实用工具。以下是 Java SDK 的示例代码:

    OpenAIClient client = OpenAIOkHttpClient.fromEnv();     ChatCompletionCreateParams params = ChatCompletionCreateParams         .builder()         .message(List.of(             ChatCompletionMessageParam.ofChatCompletionUserMessageParam(                 ChatCompletionUserMessageParam                 .builder()                 .role(ChatCompletionUserMessageParam.Role.USER)                 .content(                     ChatCompletionUserMessageParam.Content.ofTextContent(                         "What is the origin of Java's Duke mascot?"                     )                 )                 .build()             )         ))         .model(ChatModel.O1_PREVIEW)         .build();     ChatCompletion chatCompletion = client.chat().completions().create(params);

总结:

OpenAI 的此次更新为开发者带来了强大的工具和模型,旨在推动 AI 应用的创新和发展。无论你是构建新的语音应用、微调模型还是开发前沿的代理应用,这些更新都将为你带来更大的灵活性和效率。建议开发者查阅 API 文档,开始探索和实验这些新功能

参考:

https://openai.com/index/o1-and-new-tools-for-developers/

⭐星标AI寒武纪,好内容不错过

用你的在看告诉我~

求赞

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
新血压标准已公布,高血压不再是120/80mmHg,愿你的血压在它之下

新血压标准已公布,高血压不再是120/80mmHg,愿你的血压在它之下

熊猫医学社
2026-02-06 11:35:03
陈赫前妻许婧和匈牙利老公在沙特庆生,39 岁身材超棒,太吸睛

陈赫前妻许婧和匈牙利老公在沙特庆生,39 岁身材超棒,太吸睛

陈意小可爱
2026-02-07 09:53:51
小仙女圣母,是如何被洗脑成“三通一达”的工具人?

小仙女圣母,是如何被洗脑成“三通一达”的工具人?

北山浮生
2026-02-07 16:02:08
“仨儿子打光棍”视频走红,网友调侃:长成这样,撸网贷都费劲!

“仨儿子打光棍”视频走红,网友调侃:长成这样,撸网贷都费劲!

妍妍教育日记
2026-02-04 19:09:07
中国科学家首次发现青藏高原有天然氢气重要来源

中国科学家首次发现青藏高原有天然氢气重要来源

新京报
2026-02-07 11:48:11
豪门皆赢球 阿森纳3-0 亚马尔世界波巴萨3-0 帕尔默戴帽切尔西3-1

豪门皆赢球 阿森纳3-0 亚马尔世界波巴萨3-0 帕尔默戴帽切尔西3-1

狍子歪解体坛
2026-02-08 01:24:03
近10年评分最高的10部古装历史剧,《太平年》第6,第一无争议

近10年评分最高的10部古装历史剧,《太平年》第6,第一无争议

小丸子的娱乐圈
2026-02-07 21:31:44
塔克48分广厦逆转吉林,广厦让球迷见识中国篮球的丑陋

塔克48分广厦逆转吉林,广厦让球迷见识中国篮球的丑陋

李广专业体育评论
2026-02-07 17:44:02
严格要求俄罗斯归还北方领土

严格要求俄罗斯归还北方领土

杨兴文
2026-02-07 22:01:16
扎卡晒重回酋长球场:在这度过的7年美好时光,我永远铭记在心

扎卡晒重回酋长球场:在这度过的7年美好时光,我永远铭记在心

懂球帝
2026-02-08 04:49:08
中国在拉美布了十年的局,美国说拆就拆,特朗普下手比想象中更狠

中国在拉美布了十年的局,美国说拆就拆,特朗普下手比想象中更狠

娱乐的宅急便
2026-02-08 05:36:44
首次发现!青藏高原地下可能存在→

首次发现!青藏高原地下可能存在→

环球时报国际
2026-02-07 20:20:18
有幸去了趟越南,实话实说,越南人的生活,简直让我叹为观止!

有幸去了趟越南,实话实说,越南人的生活,简直让我叹为观止!

王二哥老搞笑
2026-02-06 15:54:51
他做到了,罗塞尼尔成为英超第2位执教前4场全胜的英格兰教练

他做到了,罗塞尼尔成为英超第2位执教前4场全胜的英格兰教练

懂球帝
2026-02-08 01:15:20
赖特:阿森纳需要更快地终结比赛,这样能让一些球员休息一下

赖特:阿森纳需要更快地终结比赛,这样能让一些球员休息一下

懂球帝
2026-02-08 05:42:12
伊朗获中国反隐身雷达,可锁定F-35,美国忌惮不敢动武

伊朗获中国反隐身雷达,可锁定F-35,美国忌惮不敢动武

爱情毕业了
2026-02-08 05:01:00
看了一圈,我发现:还是董洁直播间的秋装最值得买,每套都好高级

看了一圈,我发现:还是董洁直播间的秋装最值得买,每套都好高级

可乐谈情感
2026-02-08 06:59:11
中车、阿尔斯通、西门子、日立四大巨头同场竞逐

中车、阿尔斯通、西门子、日立四大巨头同场竞逐

轨道世界
2026-02-07 22:21:04
现在的上海,已经是到了没外地人都无法生存下去的地步啦

现在的上海,已经是到了没外地人都无法生存下去的地步啦

上海云河
2026-02-07 18:07:12
“立场转变”,加拿大对华最新表态

“立场转变”,加拿大对华最新表态

参考消息
2026-02-07 13:56:06
2026-02-08 07:27:00
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1032文章数 396关注度
往期回顾 全部

科技要闻

小米千匹马力新车亮相!问界M6双动力齐报

头条要闻

印度飞饼师傅被认定"外籍专家"领千元慰问费 多方发声

头条要闻

印度飞饼师傅被认定"外籍专家"领千元慰问费 多方发声

体育要闻

铜牌与苏翊鸣的这四年,他说:我对得起自己

娱乐要闻

金晨处罚结果曝光!肇事逃逸被罚款

财经要闻

金价高波动时代来了

汽车要闻

工信部公告落地 全新腾势Z9GT焕新升级

态度原创

数码
本地
手机
艺术
公开课

数码要闻

冠捷推出26.5英寸AOC G4白色显示器:LGD四代WOLED,2919元

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

手机要闻

vivo X300 Ultra顶配版通过认证,支持北斗卫星短信

艺术要闻

100张极为罕见的过年老照片,看完泪目了!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版