苹果大模型MM1入场:参数达到300亿 超半数作者是华人
要点:
苹果发布了多模态大型语言模型MM1,苹果参数达到300亿,大模到亿采用MoE架构,入人超半数作者为华人。场参超半
MM1在模型架构、数达数作预训练数据选择和训练方法上进行了详细探讨,苹果并在多项基准测试中表现出竞争力。大模到亿
MM1的入人预训练和监督微调结果显示,采用不同的场参超半数据和训练策略可以获得更好的性能,MoE模型进一步扩展了潜力。数达数作
CSS站长资源(ChinaZ.com)3月15日 消息:苹果公司最新发布了一款名为MM1的苹果大型多模态基础模型,拥有300亿参数,大模到亿采用了MoE架构,入人并且超过一半的场参超半作者是华人。该模型在多模态领域具有重要意义,数达数作可能预示着苹果未来推出与此相关的产品。
今年以来,苹果明显加大了对生成式人工智能(GenAI)领域的投入,这一举措体现了苹果在GenAI领域取得重大进展的决心。据悉,苹果一部分转向GenAI的团队原本是从事造车项目的,而如今他们也开始投身于GenAI领域的研发工作。
论文地址:https://arxiv.org/pdf/2403.09611.pdf
MM1的发布引起了广泛关注。据论文介绍,该模型采用了MoE变体,并且在预训练指标和多项多模态基准测试上表现出了领先水平。研究者通过多项消融试验,探讨了模型架构、预训练数据选择以及训练程序等方面的重要性。他们发现,图像分辨率、视觉编码器损失和预训练数据在建模设计中都起着关键作用。
在预训练数据选择方面,研究者发现了几个重要经验:交错数据对提高少样本和纯文本性能有帮助,而字幕数据则对提高零样本性能具有重要作用。
此外,纯文本数据对于提高少样本和纯文本性能同样至关重要。通过合理混合图像和文本数据,可以获得最佳的多模态性能,并保留较强的文本性能。研究者还发现,人工合成数据有助于少样本学习。
最终,研究者确定了MM1的最终配方,包括图像编码器、视觉语言连接器和预训练数据的选择。他们还将LLM的大小扩大到3B、7B和30B个参数,并通过专家混合(MoE)进一步扩展了模型。在监督微调实验中,MM1在多项基准测试上表现出了竞争力,并且MoE模型在几乎所有基准测试中均表现优于密集模型。
MM1的发布标志着苹果在多模态领域的重要进展,也为未来苹果可能推出的相关产品奠定了技术基础。该研究的成果对于推动生成式人工智能领域的发展具有重要意义,值得业界密切关注。
(责任编辑:电商)
- ·我妈就是董明珠引热议!董明珠怼职场拍马屁:很烦吹捧我的员工
- ·男孩长太高 班主任站凳子上训 网友:负责任的表现
- ·小米宣布造车后现金储备增加300亿!卢伟冰:今天的小米更加强大
- ·MOTIA官网体验入口 AI视频内容外延处理工具免费使用地址
- ·决战拜年之巅免费在线体验入口 ChatMindAI聊天机器人过年游戏使用地址
- ·Image-Manga Translator官网体验入口 AI漫画图像翻译工具免费在线使用地址
- ·每天睡多久才算睡够了?调查称我国居民平均在0点后入睡,超3亿人存在睡眠障碍
- ·伪装成AI,我们成功攻略了直男AI“陈青山”
- ·营收占比 7%,库克谈欧洲App Store新规:竭尽所能保护用户隐私
- ·ChainForge官网体验入口 可视化编程和提示工程调试软件在线使用地址
- ·问界夺新势力销冠!余承东:“余大嘴”变成“余小嘴”了
- ·惊人数据:户均资产达744万元 2023年度遗嘱登记创新纪录!
- ·SSD等涨价25%只是开始!三星工厂突然大火:存储价格又要涨了
- ·小米Civi 4 Pro搭载小米澎湃T1信号增强芯片:Wi-Fi性能提升16%
- ·申通快递对12省份快件提价 以应对恶劣天气
- ·旗舰同款!小米Civi 4 Pro升级影像大脑3.0:搭载Xiaomi AISP
- ·十大致癌卫生巾品牌吓坏网友 官方辟谣:系AI生成
- ·谷歌向开发人员提供Gemini 1.5 Pro的API支持
- ·女子兑200元中奖彩票被店员撕毁 长春体彩通报:停机整顿
- ·Xiaomi Civi 4 Pro 发布:真 Pro 体验全面越级,开启潮流旗舰新赛道