人工智能有望在智能手机体验中发挥比以往任何时候都更大的作用。
今天的智能手机可以做很多事情。但完成大多数任务的过程通常是相同的:解锁手机并打开应用程序。通常情况下,完成工作需要在多个应用程序之间跳来跳去。
例如,计划度假?您可能正在消息传递应用程序和 Airbnb 之间切换。分享演唱会的图片?这可能涉及打开默认的相机应用程序来拍摄照片,在不同的应用程序中编辑它,并在第三个应用程序的社交媒体上分享它。
但随着生成式人工智能的出现,大大小小的科技公司都看到了这种变化。生成式人工智能是指在大量数据上训练的人工智能模型,当您提供提示时,这些数据会创建内容(想想ChatGPT,Microsoft Copilot或Google Gemini)。它与其他形式的人工智能不同,这些形式的人工智能多年来一直在我们的手机中发挥着至关重要的作用,它巧妙地模糊了我们人像照片中的背景,并在我们向Siri和Alexa等虚拟助手发出命令时识别我们的语音。
现在,技术领导者、初创公司和分析师都认为,生成式人工智能有可能在更基础的层面上影响移动设备,而不仅仅是在幕后做繁重的工作。三星和谷歌分别通过 Galaxy S24 和 Pixel 8 提供了这种感觉,它们都有软件,可以在您按下快门按钮后在图像中生成新内容。我们应该很快就会听到苹果公司关于其对iPhone的AI计划的消息。而像Rabbit、Humane和 Brain.AI 这样的新兴科技公司正在超越我们所知道的智能手机。
“我们正在迈向智能手机时代,”国际数据公司(International Data Corporation)追踪手机市场的研究主管纳比拉·波帕尔(Nabila Popal)说。“因此,我们正在从智能转向智能。
三星和谷歌的新手机提供了对生成式人工智能的一瞥
三星的实时翻译功能可以实时翻译通话。
三星的 Galaxy S24 和谷歌的 Pixel 8 是生成式 AI 如何开始出现在当今手机中的最有力例子。人工智能是这家韩国科技巨头 1 月份 Unpacked 活动的最前沿,可以说是其今年最大的产品发布会。
“人工智能将给移动行业和我们的生活方式带来巨大变化,”三星移动体验业务总裁兼负责人T.M. Roh在活动期间在台上表示。“我们相信三星Galaxy将使这一变化民主化。
Galaxy S24 的头条新闻是 Galaxy AI,这是一套 AI 驱动的功能,涵盖照片编辑、语言翻译、记笔记、发短信甚至谷歌搜索等领域——换句话说,几乎所有你可能使用手机的事情。Galaxy AI 在 Galaxy S24 上推出,最近开始通过软件更新向 Galaxy S23 系列、Galaxy Z Fold 5、Galaxy Z Flip 5 和 Galaxy Tab S9 推出,这突显了三星认为它对其移动设备的重要性。
“我们正在迈向智能手机时代。因此,我们正在从智慧转向智能。
Nabila Popal, research director with the International Data Corporation纳比拉·波帕尔(Nabila Popal),国际数据公司(International Data Corporation)研究主任
Galaxy AI 最有趣的功能之一是实时翻译,它使三星能够在电话中通过实时翻译语音来充当您的个人口译员。当我打电话给一位会说韩语的同事时,只需点击一个按钮,就可以告诉三星的翻译人员介入并帮助引导对话。
Circle to Search 是另一个亮点。顾名思义,它允许您通过在手机屏幕上盘旋或涂鸦来启动 Google 搜索手机屏幕上的几乎所有内容。该功能最初仅在 Galaxy S24 系列上可用,但后来出现在谷歌的 Pixel 7 和 8 设备上。它最近扩展到上述其他三星设备以及 Pixel 6 系列和 Pixel 7A。
谷歌Android工程副总裁戴夫·伯克(Dave Burke)告诉我,在今年的世界移动通信大会上,Circle to Search是该公司合作伙伴最感兴趣的话题,这是一年一度的技术大会,设备制造商齐聚一堂,为未来一年的移动技术制定议程。
虽然他无法详细说明将 Circle to Search 引入其他 Android 手机的具体计划,但他表示预计今年会有更新。
“我认为今年你肯定会看到它的扩展,”他在讨论Circle to Search时说。
三星 Galaxy S24 Ultra 具有一项名为 Circle to Search 的 AI 驱动功能。您可以在屏幕上圈出任何内容以了解更多信息。
照片编辑是生成式人工智能如何对手机产生直接影响的另一个例子。Galaxy S24 和 Pixel 8 包括用于擦除不需要的对象以及调整图像中对象大小或移动对象的工具。谷歌的魔术编辑器和三星的生成编辑与现有基本编辑工具的不同之处在于,它们能够生成内容来填充照片中剩余的空白区域或更改天空颜色等元素。
“它正在创造东西,”波帕尔说。“这是以前没有做过的事情。”
但是,让复杂的照片编辑工具更容易获得也引发了对在线真实性的质疑,在威尔士王妃凯特·米德尔顿(Kate Middleton)的篡改照片引发强烈反对后,这个问题在上个月成为人们关注的焦点。米德尔顿在社交媒体上表示,她自己编辑了这张图片,没有迹象表明涉及生成式人工智能。
尽管如此,这一事件还是凸显了人们对互联网上真实和虚假的持续担忧,随着生成式人工智能在创建令人信服的图像方面做得更好,这种担忧可能会升级。三星在图像的元数据中添加了水印和注释,以表明它是使用生成编辑修改的。但根据我的经验,该元数据注释仅在三星的图库应用程序中可见,而不是 Google Drive 或 Google Photos,尽管将照片共享到不同的应用程序时会出现水印。谷歌表示,照片元数据中的信息将表明它是否被魔术编辑器更改。
算法也不是万无一失的。生成式 AI 模型可能会产生幻觉,或者产生看似令人信服但不准确的答案。即使他们没有产生幻觉,他们有时也会产生有偏见的反应,这些反应可能是令人反感的,或者根本没有意义。例如,谷歌的Gemini AI模型在3月份受到抨击,因为它创建了历史上不准确的人物图像。
Creative Strategies首席执行官兼首席分析师Ben Bajarin表示,随着越来越多的智能手机配备能够在设备上本地运行AI模型而不是通过云端运行的处理器,幻觉可能会变得不那么重要。
“这是一个控制更严格、更小的语言模型,”他说。“因此,他们可以更容易地安装护栏。
谷歌的Gemini Nano型号可以在某些智能手机上运行,高通和谷歌的最新芯片旨在处理设备上的人工智能处理。据CNBC报道,谷歌目前需要互联网连接的更强大的大型语言模型最早可能在明年出现在智能手机上,这表明该技术的发展速度有多快。
伯克表示,该公司收到了很多关于将其设备上的AI模型引入其他Android手机的“入站兴奋和请求”。
“我们得到了很多需求,并尽最大努力实现这一目标,”他说。
谷歌的 Gemini Nano 型号可以在某些手机上运行。
但也许最大的未知数涉及苹果的生成式人工智能计划。除了首席执行官蒂姆·库克(Tim Cook)在最近的财报电话会议上嘲笑今年晚些时候与人工智能相关的公告外,该公司一直对这项技术保持沉默。彭博社还报道称,苹果的下一个 iPhone 更新(可能称为 iOS 18)将配备 AI 功能。
根据彭博社、《纽约时报》和《华尔街日报》的报道,苹果甚至可能与谷歌合作,让谷歌的机型在我们的手机上站稳脚跟。(伯克说,当被问及Gemini是否会扩展到非Android设备时,他只知道该公司的Android计划。
如果苹果正在为iPhone开发新的人工智能技巧和工具,我们可能会在6月10日看到它们,这是该公司年度全球开发者大会的第一天。
从智慧手机转向智能手机
Brain AI 的界面乍一看可能与典型的手机应用程序相同。但该公司的创始人说,它使用人工智能来即时生成应用程序。
与我们手机上的许多新功能一样,目前可用的大多数基于人工智能的新智能手机工具都是为特定的个人任务而设计的,例如编辑照片或翻译短信。更大的问题是,这项技术是否可以以更全面的方式改变我们的智能手机,超越我们今天所知道的基于应用程序的操作系统。
Circle to Search 暗示了这种未来。与用于总结笔记、翻译对话和编辑照片的新工具不同,Circle to Search 引入了一种使用手机的新方式。您无需退出 Instagram 手动搜索附近的餐厅,这些餐厅提供您刚刚在 Feed 中遇到的开胃菜肴,只需将它们圈起来,让 Google 完成剩下的工作。Burke 说,这个想法是在 2022 年产生的,因为该公司意识到大多数搜索都是在用户使用其他应用程序时产生的。
他认为,在改变我们每天浏览手机的方式方面,人工智能有很多机会可以发挥更大的作用。
“我们只是在大门口,”他说。“因此,你会看到Circle to Search和Gemini应用程序的更多演变,因为它与日常使用模式有关。
谷歌并不孤单;初创公司已经充满了关于人工智能如何为软件体验提供动力的想法,这些体验比今天的智能手机应用程序更有效。例如,Rabbit AI 和 Brain.AI 正在开发利用 AI 完成任务的软件,而不是要求您打开应用程序。
我在 3 月份的 Zoom 电话会议中目睹了 Brain.AI 的一个演示,我的同事 Katie Collins 在世界移动通信大会上亲身体验了这个演示,涉及在线购物。找到所需的产品后,只需按住该搜索结果即可调出其他信息,例如开箱视频。目前,此类任务需要您从亚马逊应用切换到 YouTube 应用以手动搜索相关视频。你可以看到这只是一个桥梁,超越了Circle to Search今天已经提供的功能。
Brain.AI的创始人兼首席执行官Jerry Yue表示,该公司的软件会根据上下文和用户的意图来预测和生成界面。
“这就像在每一步都为你创建一个自定义应用程序,”他说。
这与Rabbit AI的目标相似,该公司在1月份的消费电子展上凭借其AI驱动的R1手持设备引起了轰动。您无需使用应用程序,只需按下按钮并背诵请求,让 AI 模型处理其余工作。与Siri或Alexa等传统语音助手不同,Rabbit表示,它的系统可以学习如何使用软件,以便可以代表您完成某些任务。Rabbit首席执行官兼联合创始人杰西·吕(Jesse Lyu)将其比作将手机交给朋友点外卖,而不是自己动手。
Humane的方法有点不同,尽管它同样涉及使用人工智能来支持应用程序。Humane 的 AI Pin 是一款微型可穿戴计算机,可以在您需要视觉答案时回答问题、翻译语言,甚至可以使用激光将图像投射到您的手上。Humane 联合创始人 Bethany Bongiorno 并不认为 AI Pin 会取代你的手机,而是与它共存。
“我们的想法是,你可以与其他设备建立更专注的关系,就像你拿到iPhone时一样,你没有摆脱你的笔记本电脑,”Bongiorno说。
人性化的 AI 引脚。
在可预见的未来,应用程序可能不会消失。在过去的 15 年里,我们习惯于通过点击、滑动和滚动应用程序来完成工作,而破坏该系统可能会让我们觉得我们正在重新开始。似乎更有可能的是,我们手机上的底层软件将逐渐变得更加智能,也许更加自动化,可能会执行Siri,Google Assistant和亚马逊Alexa等虚拟助手的最初愿景。
这实际上会带来多大的转变取决于你问谁。但对于那些致力于升级智能手机的人来说,比如 Brain.AI 的 Yue,应用程序总有一天会感觉像是过去的遗物。
虽然Yue说他并不认为AI界面会完全取代应用程序,但他将应用程序比作MS-DOS,这是1980年代的命令行界面,在Windows问世之前在计算机上使用。
“当你想要的时候,你会得到你想要的东西,”他在描述人工智能界面相对于使用应用程序的好处时说,“它不是拿出应用程序。它将应用程序拆分为更精细的部分,以便在用户需要时提供给用户。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.