网易首页 > 网易号 > 正文 申请入驻

乌鸦AI日报:OpenAI o3/o4-mini「幻觉」情况更严重;首个人形机器人半马完赛

0
分享至

据 The Crunch 报道,OpenAI 近日推出的o3/o4-mini虽然在多方面有了不小的进步,然而新模型在「幻觉」内容(虚构的内容)方面,相较于旧模型会产生更多。

全球首届人形机器人半程马拉松昨日在北京开跑。北京人形机器人创新中心研发的天工 Ultra凭借 2 时 40 分 42 秒的成绩获得冠军,松延动力 N2 机器人夺得亚军,上海卓益得机器人有限公司旗下行者二号机器人获得季军。

过去一天,国内外AI行业还有更多热点可以关注,乌鸦君带你一起看看。

大模型

1)消息称OpenAIo3/o4-mini「幻觉」情况更严重

据TheCrunch报道,OpenAI近日推出的o3/o4-mini虽然在多方面有了不小的进步,然而新模型在「幻觉」内容(虚构的内容)方面,相较于旧模型会产生更多。

报道指出,据OpenAI的内部测试,o3和o4-mini两款新模型比OpenAI此前的推理模型(o1、o1-mini、o3-mini)以及传统的非推理模型,都更容易产生幻觉。

报道还表示,更令人担忧的是连ChatGPT的开发人员都不知道为何会这样:OpenAI在o3/o4-mini的技术报告中表示,需要更多的研究内容来了解为什么随着推理模型的发展,反而幻觉情况反而更糟糕这一问题。

2)昆仑万维开源SkyReels-V2:无限时长电影生成模型

昆仑万维的SkyReels团队推出了SkyReels-V2,这是全球首个基于扩散强迫框架的无限时长电影生成模型。该模型通过结合多模态大语言模型、强化学习等技术,显著提升了视频生成的质量和效率。SkyReels-V2不仅在技术上取得突破,还拓展了应用场景,包括故事生成和图生视频等,展现了其在创意内容制作领域的广泛潜力。

3)讯飞星火X1全新升级:在AI领域力争与OpenAI对抗

科大讯飞于4月21日推出了其最新的人工智能模型——讯飞星火X1,旨在与OpenAI的o1和DeepSeek R1竞争。该模型在多个领域表现出色,尤其是在教育、医疗和司法等行业。尽管其模型参数较小,但整体效果与行业领先者相当。此外,讯飞星火X1的“快思考、慢思考”统一模型为用户提供了灵活的思考方式,降低了企业使用AI的门槛。

4)谷歌发布 Gemma3QAT 模型:一张3090显卡也能轻松驾驭

谷歌近期推出了Gemma3系列的新版本,特别是经过量化感知训练(QAT)优化的Gemma327B模型,显著降低了内存需求,使得用户能够在消费级GPU上本地运行大型模型。QAT技术通过在训练过程中融入量化操作,减少了性能损失,提升了模型在小型设备上的运行效果。

5)字节跳动研究开源 ChatTS-14B:原生理解并随着时间的推移进行推理

字节跳动研究团队推出了ChatTS-14B,这是一款专为时间序列数据设计的140亿参数大型语言模型,旨在通过自然语言接口降低时间序列分析的使用门槛。该模型的开源引发了广泛关注,标志着时间序列分析与生成式AI结合的重大进展。ChatTS-14B不仅提供了模型权重,还包括详细的使用文档和代码库,助力开发者在金融、医疗等领域的应用。

AI应用

1)首个人形机器人半马完赛,宇树科技回应

全球首届人形机器人半程马拉松昨日在北京开跑。北京人形机器人创新中心研发的天工 Ultra凭借 2 时 40 分 42 秒的成绩获得冠军,松延动力 N2 机器人夺得亚军,上海卓益得机器人有限公司旗下行者二号机器人获得季军。

但根据网络流传的视频,宇树科技 G1 人形机器人在跑步过程中摔倒,此后站起继续比赛。随后,宇树科技对此发布声明回应:最近完全没有参与任何比赛,主要忙着准备人形机器人的格斗直播。

2)宇树科技宣布全球首场人形机器人格斗大赛将于2025年开战

宇树科技将在2025年举办全球首场人形机器人格斗大赛,展示尖端技术与机器人格斗的魅力。参赛的G1人形机器人经过高强度训练,展现出卓越的灵活性和强大的战斗能力,尤其是在被击倒后能迅速恢复战斗,令人印象深刻。这场赛事不仅是技术的盛会,更将推动人工智能和机器人技术的发展,吸引全球科技爱好者的关注。

3)Reachy2机器人发布:互动自然,售价7万美元

Hugging Face通过收购Pollen Robotics推出开源人形机器人Reachy2,标志着人形机器人与生成式AI结合的重要里程碑。Reachy2以其友好的外观、先进的传感器和开源特性,迅速成为全球顶尖实验室的关注焦点。该机器人不仅推动了机器人技术的主流化,也为AI和机器人研究提供了低成本的创新机会,展现了未来人形机器人市场的巨大潜力。

4)扣子空间Coze Space正式开启内测

字节跳动的全新AI协同办公平台“扣子空间”已进入内测阶段,旨在提升用户与AI Agent的协作效率。该平台具备自动分析用户需求、拆解任务、调用工具等多项创新功能,能够生成完整的结果报告。此外,平台引入了专家Agent生态,用户可选择不同领域的专家进行深度分析,帮助获取更多洞察。

5)Intel 开源 AI Playground,可用intel Arc 显卡使用各种AI模型

Intel 宣布将其生成式 AI 软件 AI Playground 正式开源,标志着在推动生成式 AI 技术普及和社区协作方面的重要一步。AI Playground 是一款专为 Intel Arc GPU 和集成显卡优化的工具,支持多种生成式 AI 模型,允许用户在本地生成 AI 图像并确保数据隐私。

6)Figma 推 AI 革命:开发智能应用制作器与网站创建工具

Figma正积极布局人工智能领域,计划推出一款AI应用程序制作器和Figma Sites网站创建工具。这些新工具旨在通过自然语言和现有设计资源快速生成应用程序和网站,降低开发门槛,使非技术背景的设计师也能轻松构建功能性应用。Figma的这一系列创新不仅提升了设计与开发的智能化水平,还可能重新定义行业协作模式,尽管面临来自Webflow和Wix等平台的竞争。

7)聊天机器人测评平台 Chatbot Arena 正式转型为商业公司

据彭博社报道,大模型竞技场 Chatbot Arena 正式宣布转型为商业公司 LMArena。Chatbot Arena 创立于 2023 年初,最初是加州大学伯克利分校天空计算实验室(Sky Computing Lab)的一个学术研究项目,如今每月吸引超过一百万访客,已发展成为 AI 基准测试领域的权威指标。

LMArena 目前发布了新网站的早期版本,但尚未确定具体的商业模式。一种可能性是向希望通过该网站测试 AI 模型的公司收费。创始人 Ion Stoica 表示,公司计划筹集资金支持未来发展,但拒绝透露更多融资细节。

整理/宇霁

PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
王月眉,被驱逐出中国!

王月眉,被驱逐出中国!

新动察
2026-06-03 14:10:21
两位院士候选人接连被查

两位院士候选人接连被查

中国新闻周刊
2026-06-03 20:03:49
10大“微塑料”日用品排名,矿泉水第5,茶包第3,看看谁排第一名

10大“微塑料”日用品排名,矿泉水第5,茶包第3,看看谁排第一名

阿龙美食记
2026-06-03 10:54:58
这回,轮到烟草员工开始没心情上班了?金铁饭碗咋就不香了?

这回,轮到烟草员工开始没心情上班了?金铁饭碗咋就不香了?

复转这些年
2026-06-03 22:07:34
“宿迁阿斗”,国补都扶不起京东?

“宿迁阿斗”,国补都扶不起京东?

七使2022
2026-06-02 16:21:50
晚节碎一地!这5位老艺术家,贪财好色德不配位,根本不值得同情

晚节碎一地!这5位老艺术家,贪财好色德不配位,根本不值得同情

大鱼简科
2026-06-03 11:38:09
总决赛G1裁判出炉:福斯特担任主裁 三人执哨两队胜率曝光

总决赛G1裁判出炉:福斯特担任主裁 三人执哨两队胜率曝光

罗说NBA
2026-06-03 21:13:08
穆里尼奥疯了!皇马首签不要金球奖罗德里,要 8000 万降级队中场

穆里尼奥疯了!皇马首签不要金球奖罗德里,要 8000 万降级队中场

奶盖熊本熊
2026-06-04 04:52:22
多国强烈反对美国新关税提案,中方:中国不存在所谓的强迫劳动,反对以此为借口搞政治操弄

多国强烈反对美国新关税提案,中方:中国不存在所谓的强迫劳动,反对以此为借口搞政治操弄

环球网资讯
2026-06-04 07:03:11
闹大了!中方驱逐美国记者后,不到24小时,美吊销新华社记者许可

闹大了!中方驱逐美国记者后,不到24小时,美吊销新华社记者许可

面包夹知识
2026-06-03 16:05:15
王俊杰正负值+16!中国男篮82-78赢球,4人不及格,难入选世预赛

王俊杰正负值+16!中国男篮82-78赢球,4人不及格,难入选世预赛

小火箭爱体育
2026-06-03 21:30:39
男篮终于有国际化后卫!运球串联顶级,出球速度本土球员无人能及

男篮终于有国际化后卫!运球串联顶级,出球速度本土球员无人能及

弄月公子
2026-06-03 23:26:11
一名强奸犯即被枪决他大声喊话:我知道20年前6名红军惨死的真相

一名强奸犯即被枪决他大声喊话:我知道20年前6名红军惨死的真相

磊子讲史
2026-06-01 19:20:49
白天辉受贿被判死刑已执行,案件入选人民法院案例库,法院释明裁判理由:有重大立功表现,但属于罪行极其严重的犯罪分子,不足以从宽处罚

白天辉受贿被判死刑已执行,案件入选人民法院案例库,法院释明裁判理由:有重大立功表现,但属于罪行极其严重的犯罪分子,不足以从宽处罚

大风新闻
2026-06-03 16:50:43
官方严厉表态,痛批综艺乱象,刘涛郑恺等8位艺人遭点名批评

官方严厉表态,痛批综艺乱象,刘涛郑恺等8位艺人遭点名批评

一盅情怀
2026-06-03 15:30:26
彭博亿万富豪指数公布:字节跳动张一鸣以928亿美元身家跃升亚洲第二大富豪,全世界排名第21位

彭博亿万富豪指数公布:字节跳动张一鸣以928亿美元身家跃升亚洲第二大富豪,全世界排名第21位

台州交通广播
2026-06-03 21:22:38
海军少将亲口承认:拆开就是废铁,美国核航母永无博物馆之命

海军少将亲口承认:拆开就是废铁,美国核航母永无博物馆之命

字节漫游指南
2026-06-03 01:33:15
社死现场:孟良崮的岩台上摆满“贡品”,那群人的脸还好吗?

社死现场:孟良崮的岩台上摆满“贡品”,那群人的脸还好吗?

浪子说
2026-06-03 00:05:03
美国女子去世75年,癌细胞却活了下来,如今已分裂超过5000万吨!

美国女子去世75年,癌细胞却活了下来,如今已分裂超过5000万吨!

探谜未知世界
2026-06-03 12:58:55
31条中日航线5月取消全部航班

31条中日航线5月取消全部航班

财联社
2026-06-03 15:56:05
2026-06-04 07:52:49
硅基观察Pro incentive-icons
硅基观察Pro
人工智能新时代的商业智库和价值灯塔
909文章数 65关注度
往期回顾 全部

科技要闻

传DeepSeek融资意向500亿:腾讯投100亿

头条要闻

纠结的欧洲人:边说"不能关起大门" 边说"不能怕中国"

头条要闻

纠结的欧洲人:边说"不能关起大门" 边说"不能怕中国"

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

官方痛批乱象 刘涛郑恺等艺人遭点名

财经要闻

AI,开始偷懒了?

汽车要闻

专访蒋平:安全不做高低配 长安要让安全技术普惠

态度原创

房产
游戏
健康
亲子
军事航空

房产要闻

突发!254亩调规,海口江东的超级学校真的快来了!

《乐高蝙蝠侠:黑暗骑士遗产》NS2版9月18日发售

违规干细胞抗衰美容,为何肆无忌惮

亲子要闻

9岁孩童竟患上冠心病!医生说明原因,父母后悔不已……

军事要闻

媒体:美伊和谈以方却从中作梗 内塔尼亚胡有私人算计

无障碍浏览 进入关怀版