昨天凌晨,苹果宣布将个人智能系统“Apple Intelligence”应用于新版本的 iPhone 手机。这套系统包括创建电子邮件摘要、生成图像和表情符号等免费 AI 驱动功能,并可以通过 Siri 代表用户执行任务。
“为我们其他人提供人工智能”,苹果高级副总裁 Craig Federighi 在总结 Apple Intelligence 功能时用了这句口号。翻译过来就是:其他公司的人工智能产品太复杂了,而他们的 Apple Intelligence 是面向大众的、安全、简单、有效的人工智能。
这话似乎是冲着国内的手机厂商来的。毕竟,从 2023 年起,各大国产手机厂商就接连发布了自研的大模型,华为完全面向行业服务的盘古大模型、小米在手机上跑通的 13 亿参数大模型、vivo 包含三个参数级别的蓝心大模型、OPPO 最新的安第斯大模型......
并且,苹果 CEO 蒂姆·库克(Tim Cook)似乎对于“苹果在实施人工智能战略方面进展缓慢”的说法也感到不快。他在预先录制的 Apple Intelligence 介绍中说:“我们已经使用人工智能和机器学习多年了。”
那么,苹果此次基于大模型推出的 AI 功能,与华为、小米、OPPO 、vivo 等早已布局落地的国内手机厂商相比在应用实现上有何区别?
开放式大模型 VS 自研大模型
苹果这边,走的是开放式 AI 的路线,选择植入别家的通用大模型。正如预期的那样,苹果宣布与 OpenAI 合作,将 ChatGPT 大模型中的 GPT-4o 引入 Siri 等产品,之后还将与其他第三方 LLM 集成,谷歌的 Gemini 似乎很可能位居榜首。
反观国内的手机厂商,基本都选择了自研路线。
去年 8 月,华为发布盘古大模型新版语音助手小艺,还发布内置 AI 大模型的新机华为 Mate60 系列。同年 10 月,小米发布澎湃 OS 以及小爱输入助手等大模型加持的各类应用。同年 11 月,vivo 发布自研蓝心大模型 BlueLM,以及两款智能辅助应用蓝心小 V 和以 APP 形式推出的自然语言对话机器人蓝心千询;OPPO 发布自主训练的安第斯大模型 AndesGPT 与基于大模型能力打造的新小布助手。
而在模型落地上,采用通用大模型和自研大模型最大的区别之一可能是数据隐私威胁的问题。
苹果表示,隐私是实施 Apple Intelligence 的关键优先事项。Apple Intelligence 的许多人工智能功能都是在设备本身上私下处理的,只有在必要且被允许时,它才能使用安全的云端人工智能处理来完成用户请求。
对于某些 AI 功能,设备端处理意味着个人数据不会在数据中心传输或处理。对于无法在被本地小型 LLM 上运行的复杂请求,苹果开发了“私有云计算”,Apple Intelligence 将使用 Apple Silicon 特殊服务器上的云端模型,以“加密”安全的方式发送相关数据而不保留它。并且,苹果声称这个过程是透明的,专家可以验证服务器代码以确保隐私。
小米则更重视自研模型的轻量化和本地部署。去年 8 月,小米创始人兼首席执行官雷军表示,小米自研的 13 亿参数大模型已经在手机本地跑通,且在部分场景可以媲美 60 亿参数模型在云端运行的结果;此外,小米开发的大规模预训练语言模型 MiLM-6B/1.3B 登陆 GitHub,参数规模最高达 64 亿。
OPPO 这边,是以端云协同部署为主,AndesGPT 分成 1800 亿参数、700 亿参数、70 亿参数三种体量,可根据不同场景的用户需求实现智能调度。今年 1 月,OPPO 在 Find X7 系列上首次实现端侧应用 70 亿参数的大模型。
vivo 同样在积极部署端侧和端云结合的手机大模型,蓝心 BlueLM 共覆盖十亿、百亿、千亿三个参数量级的五款大模型产品,包括主要面向端侧场景的 10 亿量级模型、面向手机打造的端云两用 70 亿模型以及面向云端服务的 700 亿主力模型,1300 亿、1750 亿模型则更多面向企业级产品。
华为没有端侧大模型,而是通过云端大模型来处理手机用户需求,背后有提供 100 亿参数、380 亿参数、710 亿参数和 1000 亿参数的系列化盘古大模型。
AI 功能的不同直观应用
语音助手
此次苹果在手机中融入大模型后,对 Siri 进行了全面的革新。在 Apple Intelligence 的加持下,Siri 现在更加自然、相关性更强、更个性化,并且有了新的外观,包括改版的图标。
新版 Siri 能处理语音中的口误并更好地理解个人上下文,包括消息、日历事件、文件和照片,还可以执行 100 多项操作,如让 Siri 在照片应用中显示特定照片或回忆或者在邮件应用中的电子邮件中查找预期的送货详细信息。第三方开发者还可以利用这些新功能,通过新的“应用意向框架(app intents framework)”来利用 Apple Intelligence,使某些操作与 Siri 兼容。
另一个重大变化是 Siri 将不再仅是语音激活的助手,用户也可以通过文字与 Siri 交流 (屏幕上快速敲击屏幕 2 下)。苹果正在添加“Type to Siri”功能,使其更接近其他生成式人工智能聊天机器人的体验。
Siri 还将能够在应用程序内及跨应用程序执行操作,比如可以让 Siri “让这张照片更突出”、“将这张照片添加到另一个应用程序中”。这得益于新的 App Intents API,它允许开发者让 Siri 在他们的应用程序中执行操作。
而目前国产手机的语音助手在接入自家的大模型后,多是增强了语义理解对话能力。
在去年的华为开发者大会上,华为首发搭载大模型的全新小艺,实现了从语音助手到多模态对话小艺的全面升级,其能力包括听、说、看、执行任务、搜索信息和提供建议等。
据了解,小米大模型加持的小爱同学现在支持智能问答功能,不仅能回答问题,还能主动发起话题,进行更深层次的交流。此外,对于小米系列产品,升级后的小爱同学还能够起到产品使用助手的作用,帮助用户熟悉使用。
OPPO 的 AndesGPT 大模型通过强大的知识、记忆和工具能力,为小布助手带来广阔的知识面,以及个性专属的智慧服务能力。通过独创的 SwappedAttention 技术,AndesGPT 还解决了长期记忆带来首字推理延迟的问题。
文字创作
Apple Intelligence 将在第三方和原生应用程序中引入系统范围的校对和风格改进,借助 iOS 18 内置的全新全系统写作工具,用户几乎可以在任何写作的地方重写、校对和总结文本,包括邮件、备忘录、Pages 和第三方应用。在 Notes 和电话应用中,用户现在可以录制、转录和总结音频;通话期间开始录音时,参与者会自动收到通知,通话结束后,Apple Intelligence 会生成摘要以帮助回忆关键点。
文字创作方面,小米将 AI 大模型植入澎湃 OS 后,引入的小爱输入助手也支持 AI 创作文本功能,用户可以通过语音指令或文字输入,让系统自动生成文章、故事、邮件等内容,同时还能提供润色、翻译等辅助功能。
在盘古大模型的加持下,华为小艺同样可以进行文案创作,目前小艺学习了几十种商业文档形式,还可以对于资讯内容快速生成摘要。据悉,对于一篇 3000 多字的文章,小艺可以在几秒之内完成摘要总结。
在文本内容摘要的场景下,OPPO 小布助手在 AndesGPT 大模型 70 亿参数大语言支持下,200 字的首字生成仅需 0.2s,2000 字首字生成仅需 2.9s,摘要字数上限可达 14000 字,可以轻松输入一篇常见期刊论文。
艺术创作
苹果推出了一款名为 genmoji 的全新自定义表情符号工具,可让用户根据文本提示创建自定义表情符号,以及一个名为 Image Playground 的新 AI 图像生成器,用户可以输入关键词来生成画作,有三种风格:素描、插画和动画。苹果也正在将人工智能引入照片应用程序,使用户能够使用自然语言搜索照片,还可以清理图片背景中的对象,类似于谷歌的 Magic Eraser。
在图像创作和搜图方面,小米的小爱输入助手支持 AI 妙画、AI 搜图等一系列 AI 功能,用户可以通过手绘涂鸦或简单线条草图创造精致的画作或设计图,还可以通过自然语言搜图,无需精确表达就能快速找到所需的图片。
艺术创作能力上,OPPO 的 AndesGPT 不仅具备“文生图、图生图、中国风、高清壁纸”等能力,并且已经全流程支持音乐生成。此前小布刚发布的单曲《专属于你: 小布永相伴》,其歌词、旋律、音色等元素均由 AndesGPT 生成。
结 语
从常用的 AI 功能情况来看,苹果基于大模型推出的这一系列升级,似乎并没有体现出 iPhone 一直以来自诩的独特性与前沿。
对此,网友的评价也十分直接:“以前都是安卓追着 iPhone 跑,现在 iOS 的安卓味越来越浓了。”还有网友深表痛心:“天堂中的史蒂夫·乔布斯看着他们发布 Apple Intelligence 。”马斯克也在一边叫衰着新升级的 iPhone :“并不想要。要么停止这种令人毛骨悚然的间谍软件,要么禁止所有苹果设备进入我公司的办公场所。”
另外,需要注意的是,苹果全新 AI 技术目前将仅支持 iPhone 15 Pro 以及 iPhone 15 Pro Max 两款手机。这是因为 Apple Intelligence 需要强大的端侧处理能力,必须要 A17 Pro 或 M 系列芯片才可以运行。
这也意味着,大家想要用上苹果基于大模型推出的这一系列功能升级,必须更换 iPhone 15 Pro 系列或者之后更新的 iPhone 16 系列。