网易首页 > 网易号 > 正文 申请入驻

找到催生新奇事物“踏脚石”孕育新一代科技创新中心

0
分享至

原标题:找到催生新奇事物“踏脚石”孕育新一代科技创新中心

创造力是一种“搜索”。科研就是在人类未知领域中深入搜索,找到看似与最终目标不相关的“踏脚石”——新奇事物的重要性在于,它们往往可以成为“踏脚石”探测器。正确的结果,是从超多错误中得出来的;没有超多错误作台阶,也就登不上最后的高座

一般认为,当一个国家的科研成果超过全世界总数的25%,就可称之为世界科学中心。公元1000年,世界科技创新的中心在中国。之后,包括文艺复兴时期的意大利(14世纪—16世纪)、工业革命时期的英国(18世纪)与法国(19世纪)、第二次工业革命时期的德国(19世纪)、信息革命时期的美国(20世纪—21世纪),陆续成为新的世界科学中心。每个国家的科学兴盛期大致为60年至110年,平均约80年。而且,伴随科学、技术、经济、文化一体化融合的历史趋势,世界科学中心有较大概率成长为世界经济中心、世界金融中心、世界贸易中心、世界航运中心。

人才第一

投资界将估值超过10亿美元的科创公司称为“独角兽”。报告显示,全球40%的科创独角兽位于美国的三个区域:旧金山湾区(26%),纽约(8%),洛杉矶(6%)。最近三年,欧洲独角兽数量提升很快。其中,伦敦的独角兽数量翻了一番,并继续成为欧洲的主要科技产业城市;巴黎和柏林是欧洲新一代独角兽的两大孵化土壤。从独角兽总市值的角度来比较,美国第一,中国第二,欧洲第三。其中,北京和上海约占中国独角兽总市值的三分之二(64%)。

当前,生成式人工智能(GenAI)尚处于产业变革的初期阶段。但旧金山湾区的GenAI独角兽市值已占到全美的81%,这与当地科创产业密度正相关,犹如纽约是金融科技(FinTech)与加密货币(Crypto)独角兽的沃土那样。作为中国科创中心发展的比较研究对象,旧金山湾区乃至纽约有以下几点经验值得借鉴:

第一,人工智能的跃升、科创中心的发展依赖当地高校输送人才,需要创立更多的科技公司,构建多层次、丰富的人才供给与需求市场。

在旧金山湾区,涉及人工智能专业的顶尖高校和名师是源源不断输送人才的“发动机”。其中,斯坦福大学、加州大学伯克利分校、加州理工学院、圣何塞州立大学、圣克拉拉大学、旧金山大学、卡内基梅隆大学硅谷校区、加州大学旧金山分校、加州州立大学东湾分校、加州州立大学圣马特奥分校等,拥有全球一流的人工智能专家和科技企业家校友网络。

据《旧金山纪事报》报道,仅在2023年7月至10月就有579家公司发布了1958个人工智能岗位。其中,59%的招聘职位来自旧金山湾区的科技公司,既有谷歌、苹果、英伟达等大型公司,也包括Adept AI、Notion等创业组织。而且,旧金山湾区的人工智能工程师招聘岗位平均工资比其他地区高出21%。

比如,OpenAI人均年薪86万美元,新人起薪即为Google Research的1.6倍;另一家创业公司Anthropic的招聘起薪相当于微软实验室的近2倍,且避免使用短期绩效目标来干扰基础科研创新。以科技人员时薪为标准,美国排名前十位的城市都在加州(旧金山湾区范围内)。所以,这一区域吸引到了来自亚洲、欧洲的大批科研人才。

第二,通过法律保障人才在科技巨头、科研团队、初创企业之间流动。

比如,雇主不得设立“竞业协议”这一举措在促进人才流动的基础上,有力地加速了科研经验知识的扩散传播,激发创新创业潜能,增强市场竞争活力,避免形成垄断,进而提高行业整体效率,减少法律纠纷与运营成本,建立健康的行业生态,促进前沿技术组合式创新。

加州大学伯克利分校教授安纳李·萨克森尼安在《区域优势:硅谷与128号公路的文化和竞争》一书中提出,波士顿地区的科技产业逐渐消亡,原因之一就是工程师一生只在一家企业工作;硅谷之所以蓬勃发展,一个重要因素是湾区员工常常跳槽到另一家公司甚至创办新公司来跟老东家竞争。

加州是美国最早立法禁止“竞业协议”的地方(1872年),所以才从肖克利半导体诞生了“仙童八叛逆”和英特尔等,通过“Paypal帮”创立了Tesla、SpaceX、LinkedIn、YouTube等知名科技企业。2023年1月,美国联邦贸易委员会进一步发布声明,拟在全国范围内禁止用人单位与雇员签订竞业禁止性条款。

第三,基础科研人才与应用型开发人才比例均衡。

数据显示,在人工智能领域,美国23%的人才从事基础科研,40%的人才从事应用产品开发;而在中国,只有3%的人才从事基础科研,65%的人才从事应用开发。同时,中国是全球最大的人工智能人才培养和输出国,有两个“1/3”的数字来证明:世界顶级人工智能会议发表论文的作者中,中国人占1/3;中国人工智能科研人才,有1/3在美国工作。

培育、吸引和储备基础科研人才,是新一代人工智能科技取得突破的前提条件。中国人很擅长做人工智能科研,实施人才“归巢”计划刻不容缓。可从现在开始,以特殊津贴吸引、保障、安置相关的科学家、工程师归国或来华。

第四,依靠“精英领军”配套工程化小团队,助力新一代人工智能突飞猛进。

以OpenAI为例,Sora团队仅有15人,领军人物有2人(其中一人博士毕业才一年),平均年龄约30岁,华人科研人员占比20%;Dall-E团队共14人,华人科研人员占比57%;ChatGPT团队共87人,平均年龄32岁,华人科研人员占比10%。

OpenAI科学家出版的《为什么伟大不能被计划》一书提出,创造力是一种“搜索”。科研就是在人类未知领域中深入搜索,找到看似与最终目标不相关的“踏脚石”,进而离正确答案越来越近——新奇事物的重要性在于,它们往往可以成为“踏脚石”探测器。因为任何新奇的东西,都是催生更新奇事物的“踏脚石”。

实践反复证明,鼓励科研人员大胆去探索“踏脚石”,才可能开辟全新的可能性。钱学森很早就提出,正确的结果,是从超多错误中得出来的;没有超多错误作台阶,也就登不上最后正确结果的高座。如何让人工智能基础科研人才“不害怕失败”“敢于质疑、敢于挑战权威、不断探索未知”,是构建新一代人工智能科研机制不应回避的命题。

未来之路

1956年,钱学森在《从飞机、导弹说到生产过程的自动化》中写道:“用机器代替人的体力劳动,是第一次工业革命,即机械化;用机械系统来替人作非创造性的脑力劳动,是第二次工业革命,即自动化。”之后,他在20世纪80年代又多次强调,“21世纪,一定要攻下人工智能、第五代计算机的关,我们的做法要有中国特色”,要更加重视独立自主,“就像原子弹、氢弹、洲际导弹一样,在智能机方面,一定要下苦功夫建立自己的基础”。

立足新时代新征程,习近平总书记深刻指出,人工智能是引领这一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的“头雁”效应。加快发展新一代人工智能是我们赢得全球科技竞争主动权的重要战略抓手,是推动科技跨越发展、产业优化升级、生产力整体跃升的重要战略资源。西方国家通过前几次工业革命赢得了300年的经济红利。如果中国能够抓住人工智能这个新一代科技的“牛鼻子”,打造具有国际竞争力的数字产业集群,就能为14亿多人赢得未来300年的经济与产业战略机遇。

科技是第一生产力,人才是第一资源,创新是第一动力。上海在人工智能人才培养上投入巨大,呈现供需两旺特征:从供给侧来看,如旧金山湾区一样,上海交通大学、同济大学等至少9所高校开设了人工智能学科专业,其中有6所单独设立了人工智能研究院所;从需求侧来看,根据《上海市“十四五”产业人才需求调研报告》预测,人工智能应用类人才(13.8万至15万)、人工智能基础类人才(10.2万至13.1万)需求最大。

未来几年,上海人工智能产业的人才需求总规模应在34.3万至41.4万人之间。特别是,在传感器与智能芯片人才、知识图谱与自然语言处理人才、服务机器人人才、智能网联汽车类人才子类上,还面临较大的人才缺口。建议借鉴相关经验,深化拓展学术界、工业界与全球伙伴的联系网络等,以“实现更好的公私合作协同增效”“扩大与更多不同利益相关者的合作伙伴关系”“完善、扩大和创建研发伙伴关系机制”。

Sora是OpenAI信仰的“尺度定律”的又一次成功验证。2020年,OpenAI正式提出“随着训练数据集、训练算力、模型参数量持续增加,语言模型性能持续提高,为了获得最佳性能,所有三个因素必须同时放大”。这一科学规律已被逐步验证,世界各国的人工智能发展应该都会沿着这条路径走下去。

从算力发展策略来看,应加速国产化人工智能芯片的研发进程,以补贴型芯片、补贴型能源供给推动超大规模智算中心扩容,以跟上国际领先的大模型所需的算力规模。

美国按照“算力常胜”战略,即充分发挥GPU芯片算力优势与全球互联网数据规模,不断训练更大参数量的大模型,从千亿、万亿向数十万亿参数规模发展。近日,英伟达又发布了新一代GPU芯片GB200,是H100算力的6倍,而H100算力是A100算力的3倍。以目前国产GPU对标A100的现状来看,美国在人工智能的算力方面已取得长足进展。中国的科研工作者必须摸索出一条独特的人工智能发展路径,即在人工智能算力只有美国1/20的条件下实现更好的科研目标与模型效果突破。

到2025年,中国芯片自给率计划要达到70%的发展目标。上海具有良好的芯片与算力产业基础,浦东新区的智能芯片产品设计、闵行区的芯片生产制造、临港新片区的超级智算中心正在加速满足快速增长的国产化需求。下一步,有必要降低国产芯片采购成本,以临港超大规模智算中心等为基础,参考光伏、新能源车等产业扶持政策,对建设方、使用方实施长期补贴,以用促研,推动普惠算力,释放应用开发者、科技初创团队的创新潜力。

在人工智能领域,还有一个趋势值得密切关注。2023年,中国以训练算力为主(58.7%),推理算力为辅(41.3%);但有预测显示,中国在2024年的推理算力将达到67.7%,反超AI训练算力(32.3%)。这一信号表明,中国的“AI2.0版”商业应用将大量涌现。更便宜的算力价格,对应用开发、应用运营将有更显著的帮助。

从训练数据发展策略来看,中国数据资源潜力巨大,要“让数据供得出、流得动、用得好”,有力支撑新一代人工智能技术的可持续发展。

比较而言,中国拥有比美国更大规模的数据产生“源头”,14亿多人口、106亿终端设备每天都在源源不断产生增量数据;而美国3.3亿人口、35亿终端设备略逊一筹。如果能够持续降低传感器成本、数据收集与标注成本,在上海率先落地数据开放、共享、流通、交易模式,可以让长三角乃至全国的数据真正成为人工智能的催化剂和生产要素。

但也要看到,据OpenAI预判,“从长远来看,人类产生的数据可能会变得不足”。因此,中美两国都在积极支持合成数据研发,以逐步形成新的高质量数据源。何为合成数据研发?举个例子,假设地球上所有人每天产生100万亿个词,而OpenAI每天产生超过1000亿个词,即已达到1%的内容产出。凭借人工智能技术和算力的指数级发展,到2030年合成数据将取代真实数据用于人工智能训练。

从模型发展策略来看,大模型科研是长期重资本投入,且有庞大的未知领域需要探索,多模态大模型、端侧大模型、模型安全技术已成为人工智能发展的三大趋势。

Sora之后,“集成了文本、语音和视频等各种形式的多模态AI,结合广泛可用的视频等数据集,不断生成新颖的视频内容,预计将出现重大飞跃”。任何“创造性”都是对过去发生的事情加上一个“误差项”的一种重新组合,乘以“反馈循环的质量”和“迭代次数”。有人提出应该最大化“误差项”,其实诀窍在于最大化其他两个因素。

这在实践中都有好的案例。比如,基于上海人工智能实验室与众多高校合作开展的科学研究,新一代人工智能基础理论、基础软件、基础硬件、核心技术、开放平台和应用均得到了不同程度的进展。在最新发布的开源大模型排行榜上,上海的“书生·浦语2.0”取得第一名,在综合能力、推理能力、数学能力、编程能力等方面超过了三个国外领先的开源大模型。又如,基于上海的基础设施和技术积淀,从开源和闭源两条路径快速迭代升级基础模型能力,推出语言大模型、绘画大模型、数字人视频生成大模型、3D空间建模大模型、3D小物体建模大模型、辅助医疗大模型、辅助编程大模型等。

总之,人工智能作为上海三大先导产业之一,具有人才、算力、模型研发、数据四大先发优势。凭借智慧城市、智慧产业、智慧科研场景中海量设备采集的超模态数据,国产大模型正在驱动千行百业加快形成新质生产力。尤其是“人工智能+”制造业、服务业、科研、基建四大板块,是我们独有的全工业品类、大服务市场、广谱基础科研、重投入基建优势领域,是新一代人工智能高质量发展的主攻方向。未来之路上,人工智能计算什么不是最重要的,控制什么可能更为重要。能解决实际问题的科研,就是“国之重器”。

(田丰,作者为商汤科技智能产业研究院院长)

来源:解放日报

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

中工网
中工网
亿万职工的网上精神家园
133137文章数 10964关注度
往期回顾 全部

专题推荐

永远跟党走

无障碍浏览 进入关怀版