ChatGPT火爆,带火了生成式大模型。在国内,也有多家互联网公司纷纷发布了自己的生成式大模型产品,如百度的文心一言等。这些产品都声称可以为用户提供高质量的内容生成、人机对话、用户意图理解等服务,涉及零售、金融、教育等多个领域。
在知识产权领域,大模型又是如何落地赋能产业发展呢?在9月15日,2023智慧芽创新赋能大会上,给了我们答案。
“从知识产权信息服务迈向科技创新信息服务,从通用研发信息到垂直行业研发赋能,从开创性应用机器学习到率先落地大模型,”智慧芽联合创始人关典道出了智慧芽转型迭代的进程。她表示,智慧芽基于全球超过1.2万家合作客户来自50多个细分高科技行业,为这些行业客户的服务经验,夯实了我们面向更多行业需求提供定制化服务的能力底座。
关典表示,未来,智慧芽将面向更多战略性新兴产业,深入产业研发的场景和需求,提供定制化的解决方案,助力全球科技创新者在充满机遇和挑战的时代中脱颖而出。
1、深耕行业,重塑知识产权价值
数据显示,2022年中国研发经费总投入超过3万亿元。然而,当前企业端却有50%以上的专利未能实现产业化应用,仍有巨大的提升空间。
放眼全球,虽然我国科技创新能力显著提升,科技研发投入日益攀升,但我们应当清醒地意识到,我国在关键领域核心技术受制于人的局面仍旧没能完全扭转,如何提升企业的科研落地应用能力成为当下中国经济发展的重点方向。
对此,智慧芽中国区总经理朱亚立表示,虽然科技创新企业在提升科创基础能力、全面保护创新成果、加强商业风险防范以及提升研发创新效率的需求方面有一定通用性,但是不同行业建设重点各有侧重。
那么,如何帮助不同产业提出有针对性的一站式解决方案呢?
面向新能源汽车、半导体、通信、生物医药以及能源化工等战略性新兴产业,智慧芽推出定制化解决方案,旨在融合智慧芽在数据服务、平台建设、专业服务赋能等方面的优势,推动不同行业的科创体系建设,助力科技企业加速实现创新突破,高效应对技术挑战与市场竞争,进而推动产业转型升级。
比如,面对汽车企业在创新业务引领、海外市场扩张、数字化业务转型、SEP许可挑战等场景,智慧芽提供行业定制的研发情报库新能源汽车专业版、专利风险情报平台、企业一体化协同平台、通信标准数据库等综合解决方案。
面对半导体企业实现“卡脖子”技术预研、国产化替代加速以及风险管控等目标。智慧芽通过产品专利库、专利风险库、技术路线图、过期专利库等定制化产品和服务组合,助力半导体企业延伸利用专家资源、补齐行业认知短板、高效把握研发方向。
面对光伏企业产品出海、全球化运营的需求和挑战。智慧芽通过专利情报平台建设、产品出海风险防控机制、提升创新人员专业能力等定制化解决方案,以创新价值升级为目标,助力光伏企业打造创新价值模型,提升创新能力、质量和影响力。
此外,对于科研企业来说,最大的挑战之一莫过于高精尖人才的匮乏。如何支持这些企业的规模化大量高效的研发的推动?
通过智慧芽的大模型,能够帮助这些解决人才“卡脖子”的难题。比如,面对某一个技术领域的上千篇的论文,如何把它解读出来?仅靠一两个专家在短期内很难深度地理解它内部的技术创新要点。
“我们会做一个采样在论文里面挑出20篇论文让一两个技术专家深度的解读做标注,标注完了让我们的人工智能去学习,学习了专家对20多篇论文、专利的解读和标注以后,机器会沉淀出它的知识架构和知识认知能力,会通过机器的方式自动化地对其他的上千篇论文进行同样的逻辑的处理包括解读,打标。”朱亚立表示。
2、拥抱大模型,赋能客户进化为AI First
智慧芽始终坚持投入AI技术研发,并且在行业内率先实现AI大模型在专利、生物医药等垂直领域的应用,正在逐步覆盖全产品。
智慧芽技术副总裁屠昶旸强调,AI大模型赋能业务是一个曲折但需要坚持的路径。当前,智慧芽在大模型应用方面已构建了算法、数据、算力3大核心优势。
在算法方面,智慧芽拥有业内最大的算法团队,积累了丰富的垂直行业AI算法经验,已在过去十余年间成功采用计算机视觉、机器学习、自然语言处理、神经网络、OCR识别、知识图谱、大模型技术等处理和分析各类数据,辅助用户进行创新决策。
以技术调研模块为例,迈瑞医疗知识产权经理李晓菲表示,“我们采用的是专利数据库+研发情报库两个工具作为搭档,首先通过分析报告帮助研发把握研发方向,避免重复研发,提升研发效率。”他表示,有时候研发可能面临两条技术路线,成本、难度差不多,可以从事前置的调研提前判断哪条技术路线可能存在更大的知识产权风险,有利于判断我可能会选择相对来说较低风险的路走。
在数据方面,智慧芽积累了海量的高质量数据,包括专利、生物医药、科创三大类140余项,如覆盖全球170个受理局的超1.8亿专利数据、超1.1亿企业数据、超7万的全球新药数据等。
在算力方面,智慧芽已成功建立了专属的AI训练到推理的基础平台,可以为不同的AI应用提供高效、灵活、可扩展的计算资源,从而提高AI模型的性能和效率。
举例来说,智慧芽生物医药大模型包含330亿参数,整合了专利、论文、书籍、临床试验等100B+tokens的行业数据,支持用户进行多轮对话,集成了专家检索、语义检索等功能。据介绍,该大模型的应用能力已达到高分通过全国专利代理师资格考试的水平。临床结果大模型可实现数十倍提升信息处理效率,且准确率达到85%以上。在AI大模型的帮助下,原20名医药专家需耗费2年的时间才能完成的从30万+文献解析出5万+临床试验结果的工作,现只需5名专家耗时3个月就能完成。
此外,专利检索专家、技术交底书助手、技术研发助理等AI大模型赋能的功能已在智慧芽各产品中进行内测。智慧芽技术副总裁屠昶旸表示,希望明年把我们的模型为客户提供赋能的方式提供出来,每个企业利用大模型可以作为内部的提效的工具,同时,各个岗位都能用或者跟现有的业务场景结合或者是作为某一个重点的方向。
未来,智慧芽对内将全面应用AI大模型赋能自身所有产品线,对外将面向科技企业输出大模型解决方案,通过可落地的垂直模型结合企业内部数据,通过AI算法结合专家模型,对齐领域专家知识库能力帮助更多企业真正进化为“AI First”,从而实现创新生产力的提升。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.