【网易智能讯 1月6日消息】国外媒体TechCrunch发布文章称,相比在实验室开发算法,将机器学习研究成果真正应用到现实世界,将产品真正商业化往往要更加困难。不少公司都面临这种“跨越AI鸿沟”的挑战,它们该如何去克服呢?
近期,每天都会有媒体报道人工智能如何如何改善我们的生活和业务运营。AI已经被应用于各行各业,如分析X光片,驱动物联网的运作,为销售营销团队提供最好的行动建议。该技术似乎有着无穷无尽的可能性。
然而,每诞生一个成功的AI故事,就有不计其数的项目没能走出实验室。那是因为比起开发听上去合乎科学的算法,将机器学习研究成果投入生产,并利用其向客户带来实质性的价值往往要更加困难。过去几年我接触的很多公司都面临这种挑战,我将它称之为“跨越AI鸿沟”。
我最近在ApacheCon发表了那些知识,在这篇文章中我将会分享跨越前进道路上的技术和产品鸿沟方面的四个主要教训。
配图-AI鸿沟在哪里?
AI技术鸿沟 新数据
数据对于AI来说至关重要。例如,如果你想要聊天机器人学习,你就得给它的算法提供客户请求和相应的恰当回应的案例。这种数据往往会以结构良好但静态的格式呈现,如CSV文件。
虽然你能够利用静态的数据集来打造很酷的AI,但现实生活中运行机器学习算法的AI将需要持续不断地获得新数据,进而变得越来越智能。正因为此,企业应当早点投资机器学习基础设施,从而能够持续不断地收集新数据,并将它用于定期升级更新AI模型。
实时数据的使用会带来大量的工程挑战,其中包括调度、零停机模型升级、稳定性和性能监控。此外,你需要一个机制来恢复到之前的状态,应对新数据出现问题的意外状况。
针对收集回来的训练数据的质量控制
企业应当从一开始就思考数据质量问题——尤其是用户生成数据。机器学习技术能够自动化固然令人兴奋,但它也有可能会产生出乎意料及事与愿违的结果。最近在Twitter上出问题的那个聊天机器人就是自动化技术出状况的一个典型例子。
在那个聊天机器人被允许自由地与人进行对话之前,它是使用经过模式化、净化和过滤的公开数据来训练的。但在聊天机器人开始从真人学到不恰当的对话用语后,其推文的语气很快就完全变味了。输入垃圾,输出的也是垃圾,这是机器学习技术的基本规律。因此,良好的AI系统需要能够检测潜在的问题,能够在需要人工干预的时候向管理员发出提醒。
AI产品鸿沟 为正确的目标进行优化
AI的成功取决于准确定义你的预测问题。从一开始,你就需要明确确定输入的询问,预测输出,以及什么才是好的预测,什么是不好的预测。数据科学家将利用这些评估指标来判断AI模型的准确性。
开始定义你的目标。你想要最大化营收,创造更好的用户体验,自动化手动任务,还是达到别的目标?要取得成功,现实世界的AI产品必须使用准确反映业务目标的评估指标。
热门流媒体视频服务Netflix的算法竞赛便是前车之鉴。在向新电影评分算法的创造者奖励100万美元后,Netflix无法将该算法大范围应用于现实世界,因为从DVD转向流媒体视频的消费趋势让它最初的目标变得过时了。
在设定你的指标时,要谨记三点重要要求。确保自己能够做到:1)估量真正重要的事情;2)同时使用实时数据和新数据来评估结果;3)以利益相关者理解和看重的方式向他们解释结果。最后一点要求涉及人与AI交互这一重要问题。
人与AI的交互
人很复杂。因此,当他们与AI进行互动时,它会带来在实验室处理数据集时不会出现的新挑战。要记住,消费者不会使用他们不信任的AI产品。你可以尝试通过展示预测性模型有多准确来建立信任,但大多数的消费者都不懂科学计量。
因此,你需要利用你的产品的用户体验(UX)或者用户界面(UI)来克服建立信任的挑战。举例来说,苹果虚拟助手Siri最初推出的时候,它是根据用户所在国家来默认选择男声还是女声。谷歌的无人驾驶汽车采用可爱友好的外观设计,以此来让担心安全问题的乘客平静下来。要记住,人们访问你的算法的方式,不仅仅会带来挑战,还会带来解决方案。
事实上,跨越AI鸿沟并不一定很吓人。确保自己制定了周详完好的计划就好,这样你在跨越鸿沟时就会一直向前看,而不是往下看。另外,在奉行AI至上的原则的同时,你也必须要做到客户至上。(乐邦)
关注网易智能菌(微信公众号:smartman163),获取专业人工智能资讯与AI报告。
