淖涝网 > 社会 > 正文

​AI Phone的起跑线上,站满了平庸的手机厂商_ZAKER新闻

2024-08-18 13:36 来源:网络 点击:

AI Phone的起跑线上,站满了平庸的手机厂商_ZAKER新闻

图片来源 google 官网

8 月 14 日,谷歌在其硬件大会上发布了旗下第一款真正意义上的 AI Phone —— Pixel 9 系列新品。这颠覆了谷歌在硬件发布方面的一项惯例,即 Pixel 系列智能手机历来都是在下半年发布。然而,此次谷歌却选择提前行动,抢在了新款 iPhone 发布之前。

" 谈到人工智能,已经有太多的承诺,太多的即将推出的功能,但在现实世界中却没有足够的帮助,这就是为什么今天我们要实事求是。" 谷歌设备和服务高级副总裁里克 · 奥斯特洛  ( Rick Osterloh )  表示。

从新发布的 Pixel 9 系列来看,此次谷歌主要进行了软件方面的升级,核心就是将 AI 融入进来,构建新的手机功能。但这些功能并没有超出市场的预期,大多都是苹果和其他手机厂商已经公开的方向,只不过谷歌提前了一步。

AI Phone,是智能手机陷入创新瓶颈之后的一个新物种。现在,这个新物种正陷入到另一种雷同的平庸之中。

万变不离其宗的 " 手机助手 "

也许是从苹果那里得到的启发,谷歌在新的 Pixel 9 系列上,也在试图进行手机助手的 AI 改造。

谷歌最新的进展是,通过 Gemini 访问手机屏幕,来实现更个性化的功能。比如,用户召唤 Gemini 后,可以点击 " 询问此屏幕 " 或 " 询问此视频 ",让模型指向你正在查看的内容,从而给出上下文回复。谷歌表示,这意味着 Gemini 可以执行一些操作,例如将 YouTube 旅游视频中的餐厅列表添加到谷歌地图中。

同时,谷歌正在推出自己的 ChatGPT 语音聊天版本,名为 Gemini Live。其表示,该功能可实现自然对话,因此用户可以在 Gemini 中途打断或暂停对话,稍后再继续。谷歌表示,即使屏幕锁定,Gemini Live 也可以使用。不过,该功能仅适用于 Gemini Advanced 订阅者。

此外,谷歌还称得益于 Gemini 1.5 Flash 等新模型,Gemini 作为语音助手的速度将更快,并且不会像以前的助手版本那样经常出错。谷歌还为 Gemini 添加了更多扩展,因此它将能够从 Keep、Tasks、Utilities 和 Google 日历等应用程序中提取信息或在应用程序内执行操作。

需要注意的是,以上这些都不是任何意义上新的发明,而是一些乏味的重复。

在 WWDC 上,苹果首次推出了 Apple Intelligence,核心之一就是 Siri 的改造。按照苹果的说法,苹果正计划用生成式 AI 技术彻底改造 Siri 虚拟助手,新系统将首次允许 Siri 控制应用程序内的所有功能。Siri 的这一变化,需要使用大语言模型进行 iOS 的系统底层改造,OpenAI 则会帮助苹果实现这一切。

图片来源苹果官网

比如,新系统将允许 Siri 更精确地控制 iPhone 或 iPad,包括利用 Siri 能够打开单个文档、将笔记移动到另一个文件夹、发送或删除电子邮件、打开 Apple News 中的特定出版物、通过电子邮件发送网络链接,以及要求设备提供文章摘要。

无独有偶,华为也计划在原生的鸿蒙系统里干同样的事情。

华为试图将 AI 大模型的能力植入鸿蒙系统底层,以此来同时调用多个 APP 的功能,让终端设备可以完成复杂度更高的人机交互方式。不同的是,鸿蒙所使用的 AI 大模型为华为自研,而苹果则选择与 OpenAI 这样的第三方公司合作。

利用华为自研的盘古大模型,华为手机的语音助手 " 小艺 ",可以化身为一个 AI agent,帮助用户自动调取日历信息、输入法、通讯录、文件,并生成文本并发送短信或是邮件。在第三方 APP 中,小艺可以识别位置信息、图片,自动导航或是购物。当然,前提是这些 APP 同意 AI 调用这些信息。

更多的个性化,更多的重复

除了对于手机助手的改造,谷歌此次还披露更多新的个性化 AI 功能,但依然还是重复着已有的技术路线。

谷歌新推出的 Pixel 截图功能,这是一个集截图管理、‌智能分析和自然语言搜索于一体的应用。‌ 基于该功能,手机可以保存整理截图中的重要信息,将其转变为一个更便于搜索的数据库。用户查找之前的截图信息时,可以变得更容易。谷歌表示,这是 Pixel 设备独有的。

但是,这并不是 Pixel 独创的。早在今年 5 月,微软就宣布为 Windows 11 推出回顾功能  ( Recall ) ,该功能可以记忆用户打开过的各种窗口或文件,然后在必要的时候可以快速回到当时使用的时刻。

在具体的操作过程中,当用户启用该功能后,电脑每隔几秒会对屏幕内容进行截图,截取的内容将通过加密保存在设备本地,接下来这些数据将交给 AI 在本地完成分析。之后,用户可以通过时间轴浏览最近的各种活动,例如查看过的网页等,而 AI 则会在本地完成分析,用户可以搜索特定关键词回到某个时刻。

回顾功能还允许用户直接打开当时保存的原始截图,后续该功能被完善后,它还可以以屏幕截图的形式打开实际的源文档、网站或电子邮件等。

此外,谷歌还在添加一项叫作 Circle 的 AI 功能。当用户使用该功能时,可以分享图片或屏幕的部分内容。比如,用户可以圈出图片的文字信息,按住分享按钮通过发送文本信息。

巧合的是,类似的功能此前荣耀已经推出过。在荣耀手机的任意门功能中,用户通过长按所在界面的文字、图片、文件、视频等元素,将其拖至左右两侧屏幕边缘处,即可触发 " 任意门 " 功能,快速流转至其他应用服务。更早之前,类似的交互逻辑也在锤子手机的 "onestep" 功能上出现。

总的来看,将 "AI Phone" 视为智能手机重新崛起新机会的手机厂商们,至今还未推出一款真正意义上的新产品。在 AI Phone 的起跑线上,手机厂商推出的新功能,大多都是沿着类似的技术路线和交互逻辑而展开。(本文首发于钛媒体 APP,作者 | 饶翔宇 编辑 | 钟毅)