网易首页 > 网易号 > 正文 申请入驻

当AI拥有“自我进化”能力,我们该防范什么风险?

0
分享至

近日,OpenAI发布了名为MLE-bench的基准测试,此项测试主要是测试AI Agent的机器学习工程能力,而在OpenAI公布的测试结果中,o1-preview在测试中取得7枚金牌。o1模型不仅实现了推理能力的飞跃,还开启了新的Scaling Law(缩放定律)阶段,这是迈向AGI(人工通用智能)路上关键的一步。当AI拥有了推理能力,将带来什么样的变化,又将会面临哪些潜在的问题?

AI思维链魅力何在?

OpenAI于9月13日推出的新模型o1,主要包含o1-preview(预览版)和o1-mini(迷你版)。o1模型最令人关注的一大特点便是其拥有更接近人类思维的推理能力,它能在接收在用户的指令之后,先进行问题拆解,再思考出能提供的最佳答案。以往的大多数AI模型并不具备这样的推理能力,极其依赖训练时提供的知识,因此会出现“越训练越傻”的现象。o1-preview所具备的推理能力则有利于AI实现自我提升,因此自然显得更聪明。

数据来源:OpenAI

o1模型的思考推理能力,主要源于通过强化学习(RL)利用思维链(CoT)技术来处理问题。思维链的核心是将复杂问题分解为一系列逻辑步骤,从而提升AI在处理科学、编程、数学等高难度任务时的准确性。与传统AI快速给出单一答案的模式不同,思维链技术模拟了人类的深度思考过程。AI在解答问题时,生成一个包含多个中间步骤的思维链,逐步推理并验证每个步骤是否合理,从而提高答案的准确度。

AI在应用思维链技术时,不仅通过数据学习,更注重思维过程本身。通过强化学习,AI在实际环境中进行决策,不断验证、纠错,优化思考过程。这样,AI的推理能力得到了显著提升,并能更好地解释其推理逻辑。

思维链技术有利于极大提升AI在科学、编程等复杂领域中的表现,使它在医疗、气候科学等需要深度分析的领域中拥有广阔的应用前景。AI可以通过反复推理和学习,发现新的解决方案,加速这些领域的进展。思维链不仅让AI变得更加“聪明”,还展示了AI自我进化和学习的潜力,使其有望逐渐接近AGI。

强化学习指的是,AI学习在根据行动结果获得反馈,然后不断优化策略,从而学会完善自己的思考过程。通过强化学习的方式,o1模型可以进行自主探索和连续决策,这能让AI大模型学会生成思维链,与之前的大模型仅仅学习数据不同。

在此训练方式下之下,o1模型拥有了自我提升的能力,意味着实现了从预训练到后训练的进步。预训练需要通过不断读取大量数据来学习和提升,容易使AI依赖于有限的资料集,反复使用这些资料,导致逐渐变得“僵化”,缺乏创新。而当AI增加了推理和思考的过程,就能在现有知识基础上主动推演,推测出新的观点或解决方案,表现出更“类人”的灵活性和创造性。

浙江大学计算机学院教授、博士生导师,浙江大学人工智能研究所副所长郑小林在2024全球数字生态大会上谈到o1模型时表示,“o1发布挺让人兴奋的。AI开始有了思维链,具备了复杂推理的能力,而且随着更多强化学习和更多思考时间,o1的性能会持续提升。”

Meta的研究团队近期推出了一款AI评估工具,使用了类似“思维链”的技术,让AI来评估AI的能力。

“我们希望,随着AI的发展,它能超越人类,逐渐具备自行检查工作的能力,并在准确性上超过普通人类水平,”项目研究员之一Jason Weston说,“自我训练和评估的能力是实现超人级AI的关键因素之一。”

未来潜力与应用风险

OpenAI的CEO Sam Altman曾将AI技术的发展划分为五个阶段,分别是:

L1 聊天机器人(ChatBot),具有对话能力的AI;

L2 我们刚刚达到的推理者(Reasoner),像人类一样能够解决问题的AI;

L3 智能体(Agent),不仅能思考,还可以采取行动的AI系统;

L4 创新(Innovator),能够协助发明创造的AI;

L5 组织者(Organization),可以完成组织工作的AI。

OpenAI的五级AGI路线图

Altman表示从L1到L2花了一段时间,但他认为L2最令人兴奋的事情之一是它能够相对快速地实现L3,预计这种技术最终将带来的智能体将非常强大。

o1模型通过思维链技术,将线性、单线程的AI思维转向多线程的推理,突破了此前训练方式的瓶颈,正如其命名的含义一般,作为推理模型中的第一个有着里程碑的意义。

随着AI技术的不断进步,推理技术有着广阔的应用潜力。OpenAI在最新的论文中指出:如果人工智能智能体能够自主进行机器学习研究,它们可能会带来许多积极的影响,例如加速医疗保健、气候科学等领域的科学进步,加速模型的安全和对齐研究,并通过开发新产品促进经济增长。智能体进行高质量研究的能力可能标志着经济中的一个转折。

AI推理技术能够处理海量数据,并从中提取有价值的信息,使决策过程更加科学、高效。例如,在医疗领域,AI可以帮助医生分析患者数据,做出更准确的诊断,而在金融领域,AI推理可以预测市场走势,帮助投资者做出明智的选择。

在制造业,智能机器人可以通过实时数据分析优化生产流程,提高效率;在物流行业,AI可以预测需求波动,优化运输路线和库存管理,从而降低成本。未来,AI推理的跨学科应用潜力也将不断显现,无论是气候变化预测、生物医学研究,还是城市交通管理,AI都能够通过数据分析提供新的解决方案,促进各领域的创新和进步。

郑小林指出:“从全球范围来看,我国在AI最新成果与场景结合的应用创新方面有较大的优势。”他还表示,“AI+制造”将大大推动制造业的智能化发展,像金融、教育、医疗等领域,“AI+”也在加速落地。

今年7月底举办的ISC 2024大会上,360集团创始人周鸿祎宣布,360将“用基于智能体的框架打造慢思考系统,从而增强大模型的慢思考能力”,并强调,将“利用智能体框架,让大模型从快思考转成慢思考模式,把多个大模型组合起来解决业务问题”。

据了解,近期有国内技术团队通过将思维链优化为CoE(专家协同)协同工作模式,使用任意三个模型协同工作达到了和OpenAI o1-preview类似的反思决策效果。经过21道复杂逻辑推理题测试结果显示,其效果与OpenAI o1-preview相当,完全超越GPT-4o,有时还能超越o1-preview。

不过,尽管推理技术为AI带来了巨大的进步,但它也带来了潜在的风险。随着AI在决策和推理上的自主性提高,AI行为的不可预测性可能增加,尤其是当AI系统在没有足够人类监督的情况下自行操作时。此外,AI在处理复杂任务时,如果出现了错误推理链,可能导致错误决策,对现实中的应用(如医疗、交通)产生严重影响。

近期,Anthropic发表的名为《前沿模型破坏能力风险评估》的报告指出,目前AI安全研究主要聚焦限制恶意用途,而随着未来AI能力将超过人类,也要提前研究AI主动破坏风险。

FDA(美国食品药品监督管理局)的Haider J. Warraich、Troy Tazbaz和Robert M. Califf在JAMA(国际四大医学期刊之一)上发表的文章中提到,生成式AI在诊断和治疗等领域虽然能带来显著创新,但也面临潜在的错误和偏见风险。例如,AI医疗记录助手可能会错误生成未经讨论的诊断。因此,有必要为这些复杂的AI模型开发专门工具,以评估其输出的可靠性和安全性。

需从多角度降低应用风险

随着AI推理技术的不断进步,其应用也将逐渐普及,在向着更接近AGI的目标迈进的同时,AI推理技术的应用也带来了诸多风险,特别是错误和偏见的可能性,这些风险可能会对决策和社会产生深远影响。因此,针对这些风险,需要采取有效的应对策略,以确保AI技术的健康发展。

建立健全的监管框架是应对AI推理技术应用风险的重要基础。这需要政府和行业组织制定明确的法规和标准,以规范AI系统的开发和应用。特别是在医疗、金融和法律等关键领域,相关政策应确保AI系统的透明性和可解释性,使用户能够理解其决策过程。这不仅能增强用户的信任,还能降低因模型错误或偏见带来的潜在风险。

FDA的Haider J. Warraich、Troy Tazbaz和Robert M. Califf在JAMA上发表的文章截图

数据治理在AI推理的应用中也至关重要。AI系统的性能往往依赖于其训练数据的质量和多样性。因此,确保数据来源的可靠性、代表性和公正性是防止偏见和错误的重要措施。此外,数据治理还应包括定期审查和更新数据,以适应不断变化的社会和市场需求,从而提升AI系统的准确性和有效性。

在技术层面,研发更为先进的算法和模型也能有效降低风险。研究人员应注重提升AI推理系统的可解释性和可控性,使其决策过程更加透明,便于人类进行干预和调整。例如,采用集成学习或对抗训练等方法,可以提升模型对异常数据和极端情况的抵抗能力,减少因输入数据问题导致的错误。

展望未来,随着AI技术的不断演进,尤其是接近AGI的发展,AI推理的应用将愈加广泛。然而,AGI的实现也将带来全新的挑战。首先,AGI的决策能力和自我学习能力将更加复杂,如何确保其在多变环境中的安全性和可靠性将成为一项艰巨任务。此外,AGI的伦理问题和社会影响也需要认真考量,确保其发展不会造成不平等或损害人类利益。

总之,应对AI推理技术的应用风险需要从监管、数据治理、技术研发等多个层面入手,形成合力,确保AI技术的健康、可持续发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
多地湿度堪比“亚马孙级”!江苏7~9级雷暴大风来袭

多地湿度堪比“亚马孙级”!江苏7~9级雷暴大风来袭

现代快报
2026-05-25 22:45:33
1990年,作家三毛到新疆和76岁的王洛宾同居,王洛宾说:“可以同居,不可以发生关系!

1990年,作家三毛到新疆和76岁的王洛宾同居,王洛宾说:“可以同居,不可以发生关系!

犀利辣椒
2026-05-20 06:23:07
11岁男孩顶替退伍军人领国家俸禄15年,被揭穿后:敢告我就弄死你

11岁男孩顶替退伍军人领国家俸禄15年,被揭穿后:敢告我就弄死你

莫地方
2026-05-25 01:15:03
泰森VS梅威瑟大战再出意外!

泰森VS梅威瑟大战再出意外!

格斗迷
2026-05-25 11:44:37
杜特尔特女儿突然改口!拉拢军方站台后,要和“亲华”彻底切割?

杜特尔特女儿突然改口!拉拢军方站台后,要和“亲华”彻底切割?

素衣读史
2026-05-25 17:59:37
景美人也美

景美人也美

蓝色海洋009
2026-05-23 07:48:04
立讯精密2025年度股东会:存储涨价未带来额外成本压力;持续学习并谨慎投入机器人领域

立讯精密2025年度股东会:存储涨价未带来额外成本压力;持续学习并谨慎投入机器人领域

每日经济新闻
2026-05-25 22:00:17
郑钦文首秀吞蛋出局网友点出输球原因,一轮游致排名跌出TOP100

郑钦文首秀吞蛋出局网友点出输球原因,一轮游致排名跌出TOP100

网球之家
2026-05-25 22:50:51
布伦特原油日内跌幅扩大至6.2%

布伦特原油日内跌幅扩大至6.2%

每日经济新闻
2026-05-25 11:38:29
名记宣判:骑士这套阵容走到头了!哈登灾难、薪资锁死、必须拆队

名记宣判:骑士这套阵容走到头了!哈登灾难、薪资锁死、必须拆队

酷侃体坛
2026-05-25 16:42:19
回看景甜境遇,读懂张继科沉默背后深意

回看景甜境遇,读懂张继科沉默背后深意

搞笑娱乐笑话
2026-05-25 13:58:24
这3种鱼中老年人要常吃,不是鲈鱼、不是鲫鱼,刺少、低脂高蛋白

这3种鱼中老年人要常吃,不是鲈鱼、不是鲫鱼,刺少、低脂高蛋白

江江食研社
2026-05-24 14:30:07
女同事天天白嫖我的午饭,我索性天天带2份,35天后,她妈拿着户口本找上门:小伙子,我女儿非你不嫁

女同事天天白嫖我的午饭,我索性天天带2份,35天后,她妈拿着户口本找上门:小伙子,我女儿非你不嫁

大爱三湘
2026-05-21 20:08:49
宇宙大将军的前世今生

宇宙大将军的前世今生

奥卡姆剃历史
2026-05-23 11:29:08
女大学生吐槽“普信男”视频火了,却因长相被嘲:你也照照镜子吧

女大学生吐槽“普信男”视频火了,却因长相被嘲:你也照照镜子吧

世界圈
2026-04-12 00:10:16
好莱坞,DEI价值观输出的大本营

好莱坞,DEI价值观输出的大本营

南文视界
2026-05-25 07:20:12
是巧合,还是冥冥中自有天意?3位航天员连“名字”都这么巧

是巧合,还是冥冥中自有天意?3位航天员连“名字”都这么巧

快看张同学
2026-03-13 10:37:40
1955年授衔时,即使再增加三位元帅,也轮不到粟裕

1955年授衔时,即使再增加三位元帅,也轮不到粟裕

【历史客栈】
2026-05-22 09:00:25
大S年轻时房间曝光,太过诡异引人不适,难怪有人曾说活不过50岁

大S年轻时房间曝光,太过诡异引人不适,难怪有人曾说活不过50岁

草莓解说体育
2026-05-11 20:49:33
昨晚跟闺蜜去洗澡,一脱衣服我才明白,女人和女人,真的不一样

昨晚跟闺蜜去洗澡,一脱衣服我才明白,女人和女人,真的不一样

皓皓情感说
2026-04-12 12:12:09
2026-05-26 04:44:49
电脑报 incentive-icons
电脑报
创刊于1992年的计算机报
26960文章数 211729关注度
往期回顾 全部

科技要闻

华为:没有先进光刻机也能造出高端芯片

头条要闻

伊朗媒体披露最高领袖就医情况

头条要闻

伊朗媒体披露最高领袖就医情况

体育要闻

如果不好好守门,他可能早就继承家业了

娱乐要闻

李晨郑恺跑男停宣:12年元老被边缘化

财经要闻

起底煤矿“暗面”:假整改、假数据

汽车要闻

启境GT7定档5月29日预售 提供三电机版本

态度原创

艺术
手机
数码
本地
公开课

艺术要闻

于东来计划建小区,建筑设计用材都公开,地产界震动?

手机要闻

iQOO 16再次被确认,规格信息都已清晰,REDMI能招架住吗?

数码要闻

荣耀600系列发布:国补后2294.15元起 续航影像全升级

本地新闻

用云锦的方式,打开江苏南京

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版