网易首页 > 网易号 > 正文 申请入驻

OpenAI、DeepMind夺得国际大学生程序设计决赛金牌

0
分享至

在本月初于阿塞拜疆举行的国际大学生程序设计竞赛(ICPC)世界决赛中,OpenAI、谷歌DeepMind两家公司的人工智能模型获得了金牌级别的成绩,顺利解出人类参赛者无法完成的问题。DeepMind称之为“朝着通用人工智能(AGI)迈进的历史性时刻”。

ICPC世界总决赛汇集了来自全球103个国家、近3000所大学的139支顶尖队伍。在一共12道题目中,排名第一的是OpenAI,成功解决全部12道题目。Gemini 2.5 Deep Think模型最终解决10道题目,达到金牌水准,位列第二。

OpenAI参赛系统由多个通用模型组成,包括GPT-5和一个实验性推理模型。其中,GPT-5解决了11题,实验性推理模型解决了最难的第12题,并负责最终提交决策。所有模型均未针对ICPC进行专门训练。OpenAI技术团队在赛后表示,“我记得刚加入OpenAI时,我们最好的AI模型甚至连Codeforces的简单问题都解决不了。看到过去两年的进步速度,真是令人难以置信。”

谷歌方面介绍,参赛的Gemini2.5并非专门为ICPC训练,而是用户在Gemini应用中可直接使用的版本。模型在比赛开始10分钟后启动,前45分钟便解出8题,三小时内又完成两题。DeepMind称,这一表现是人工智能在“解决抽象问题能力上的飞跃”。例如,Gemini在不到半小时内解出了“问题C”——一项关于管道网络向储液器分配液体的复杂优化问题,而这一题目无人类队伍成功解答。

“对我来说,这是一个相当于国际象棋的‘深蓝’和围棋的AlphaGo的时刻。”DeepMind副总裁Quoc Le进一步解释说,“更重要的是,它更接近现实世界,而不仅仅是像国际象棋和围棋这样受限的环境。正因如此,我认为这一进步有可能改变许多科学和工程学科,”比如设计新药或芯片。

谷歌表示,Gemini 2.5 Deep Think是一款经过专门训练的通用人工智能模型,可以解决非常困难的编码、数学和推理问题,其表现“与世界前20名的程序员一样好”。在这些竞赛中解决复杂的任务需要深度抽象推理、创造力、综合新解决方案的能力,以及真正的创造力火花。

不少网友在社交平台庆祝这一历史性时刻。AI在ICPC上斩获金牌可能意味着人工智能可以成为程序员真正的问题解决伙伴。但同时也引发了未来人类的编程能力可能会永远落后于AI的担忧。

加州大学伯克利分校的计算机科学教授斯图尔特·拉塞尔(Stuart Russell)在细节公布之前表示,“具有划时代意义的说法似乎有些夸大其词。”他认为,人工智能系统在编程任务上表现优秀已经有一段时间了,而“人工智能公司一直声称取得突破要面临巨大的压力。”

同时他也承认,“要正确回答ICPC的问题,代码实际上必须能够正常工作(至少在有限数量的测试用例上),所以这种性能可能表明,人工智能编码系统在足够准确地生成高质量代码方面取得了进步。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
被双开的胡继勇:在四川工作十四年,当年的上级曾任中石油副总裁

被双开的胡继勇:在四川工作十四年,当年的上级曾任中石油副总裁

叹为观止易
2026-01-21 10:21:06
陈毅报告透露的一件事:粟裕在华东的孤独程度,远超我们想象!

陈毅报告透露的一件事:粟裕在华东的孤独程度,远超我们想象!

兴趣知识
2026-01-30 01:46:13
李世民霸占杨妃后,当晚逼她做一件事,门外的史官记录得面红耳赤

李世民霸占杨妃后,当晚逼她做一件事,门外的史官记录得面红耳赤

铭记历史呀
2026-01-27 15:16:33
姑姑寄来12斤腌鸭蛋,我都送邻居,3天后警察敲门:你邻居4口身亡

姑姑寄来12斤腌鸭蛋,我都送邻居,3天后警察敲门:你邻居4口身亡

衍月
2026-01-29 18:34:17
窦靖童:我妈钱多到用不完,但穷苦潦倒的爸爸,成了我如今的心病

窦靖童:我妈钱多到用不完,但穷苦潦倒的爸爸,成了我如今的心病

璀璨幻行者
2026-01-20 04:29:30
美国也没想到,转为中国籍仅6年,谷爱凌竟已成美国头号劲敌

美国也没想到,转为中国籍仅6年,谷爱凌竟已成美国头号劲敌

阿废冷眼观察所
2026-01-30 02:29:58
伊朗大变天!哈梅内伊时代即将落幕,最高领袖接班人浮出水面

伊朗大变天!哈梅内伊时代即将落幕,最高领袖接班人浮出水面

像梦一场a
2026-01-29 17:49:57
欧冠统计榜昭示国米最大进步:挨踢新星另一个亮点 蓝黑大提速

欧冠统计榜昭示国米最大进步:挨踢新星另一个亮点 蓝黑大提速

国际足球冷雪
2026-01-30 07:05:07
曼联暂缓新帝星加薪续约,仍在考虑冬窗压哨签!试训基恩母队小妖

曼联暂缓新帝星加薪续约,仍在考虑冬窗压哨签!试训基恩母队小妖

罗米的曼联博客
2026-01-29 09:45:23
反差,昔日身价8000万,如今一个赛季踢13分钟,29岁提前养老

反差,昔日身价8000万,如今一个赛季踢13分钟,29岁提前养老

95帕尔马
2026-01-30 08:31:29
所有发达国家都有一个共性:人工很贵,劳动很值钱。

所有发达国家都有一个共性:人工很贵,劳动很值钱。

流苏晚晴
2026-01-27 18:18:22
我今年65岁了,半夜醒来去客厅倒水,发现50岁的保姆竟然还没睡!

我今年65岁了,半夜醒来去客厅倒水,发现50岁的保姆竟然还没睡!

游戏收藏指南
2026-01-29 12:44:59
山东男篮不敌卫冕冠军凸显两点:邱彪没想赢,裁判发挥比广厦还好

山东男篮不敌卫冕冠军凸显两点:邱彪没想赢,裁判发挥比广厦还好

姜大叔侃球
2026-01-29 21:49:52
活了30年才知道,这些“反人类”生活物品的正确用法!以前可真傻

活了30年才知道,这些“反人类”生活物品的正确用法!以前可真傻

抠搜侠
2026-01-28 15:18:39
渐行渐远!一个疯狂的时代。

渐行渐远!一个疯狂的时代。

老照片故事汇
2026-01-29 23:20:11
真子公主瘦了!出嫁5年生子复工自力更生,从不像哈里一样翻旧账

真子公主瘦了!出嫁5年生子复工自力更生,从不像哈里一样翻旧账

星星没有你亮
2026-01-30 03:03:36
我妈来住9天,丈夫挂脸了9天,等婆婆住进来,我1句话他脸色惨白

我妈来住9天,丈夫挂脸了9天,等婆婆住进来,我1句话他脸色惨白

大熊欢乐坊
2026-01-30 08:13:41
不得了:天文学家发现一种全新天体,之前从未见过

不得了:天文学家发现一种全新天体,之前从未见过

窥探宇宙1
2026-01-29 13:00:03
婚姻里的“哄”,是最高级的浪漫

婚姻里的“哄”,是最高级的浪漫

青苹果sht
2025-12-27 05:12:18
笑喷!霖霖童言无忌喊张兰千年老妖,奶奶乐到满脸通红太暖心

笑喷!霖霖童言无忌喊张兰千年老妖,奶奶乐到满脸通红太暖心

点燃好奇心
2026-01-30 01:29:58
2026-01-30 09:44:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
874014文章数 5087630关注度
往期回顾 全部

科技要闻

单季狂赚3000亿;iPhone 17 全球卖疯了!

头条要闻

英国首相斯塔默到访故宫 看到中国游客微笑挥手打招呼

头条要闻

英国首相斯塔默到访故宫 看到中国游客微笑挥手打招呼

体育要闻

敢揍多尔特,此子必成大器?

娱乐要闻

曝金晨涉嫌交通肇事逃逸 本人尚未回应

财经要闻

黄金"发疯"众生相:投资端"大口吃肉"

汽车要闻

车长超5米还带后轮转向 比亚迪海豹08/海狮08将亮相

态度原创

亲子
家居
本地
公开课
军事航空

亲子要闻

严格婴幼儿配方液态乳生产许可条件 市场监管总局发布审查细则

家居要闻

极简轻奢 家的无限可能

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

中方被指支持俄生产武器 外交部回应

无障碍浏览 进入关怀版