MM1:我们所知道的关于 iOS 18 中苹果 AI 模型的一切

要闻 编辑:
导读 在预计将包含人工智能功能的iOS 18发布之前,苹果研究人员发表了一篇论文,重点介绍了他们如何训练新的大型语言模型 (LLM)。该法学硕士称...

在预计将包含人工智能功能的iOS 18发布之前,苹果研究人员发表了一篇论文,重点介绍了他们如何训练新的大型语言模型 (LLM)。

该法学硕士称为MM1,可以将文本和视觉信息整合为一。该论文于上周提交,对各种架构组件和数据选择的重要性进行了有趣的探讨。研究人员表示,他们能够“证明,对于大规模多模态预训练,使用图像标题、交错图像文本和纯文本数据的仔细组合对于实现最先进的效果至关重要(SOTA )与其他已发布的预训练结果相比,在多个基准测试中得到了很少的结果。”

此外,他们还表明,“图像编码器以及图像分辨率和图像标记计数具有重大影响,而视觉语言连接器设计的重要性相对可以忽略不计。”

Apple 的 MM1 AI 模型使用了一系列具有多达 30B 个参数的多模态模型,其中包括密集模型和专家混合 (MoE) 变体,这些模型在预训练指标中达到了 SOTA,并在监督微调后实现了有竞争力的性能。一系列既定的多式联运基准。

苹果已经宣传其人工智能应用程序近一年了。在过去的两次财报电话会议中,该公司首席执行官表示,他们有许多功能需要宣布。更有趣的是,虽然苹果一直在发表论文并预告即将推出的人工智能功能,但彭博社的 Mark Gurman 表示,苹果还在讨论在 iOS 18 中使用 Google Gemini。

标签:
免责声明:本文由用户上传,如有侵权请联系删除!