苹果开发出新款AI:可“看懂”屏幕内容并语音回复
快科技4月2日消息,看懂据媒体报道,苹果屏幕苹果公司近日宣布,开发款成功研发出一款前沿的出新人工智能系统ReALM(Reference Resolution As Language Modeling,即基于语言建模的内容参考解析)。
据悉,并语该系统具备卓越能力,看懂能够精准解析屏幕上模糊的苹果屏幕内容,同时深入理解相关对话及背景环境,开发款从而为用户提供更为自然流畅的出新语音助手交互体验。
ReALM系统通过运用大语言模型技术,内容巧妙地将识别屏幕视觉元素这一复杂任务转化为纯语言处理问题。并语这一创新转换使得ReALM在性能上相较于传统技术实现了质的看懂飞跃。
值得一提的苹果屏幕是,ReALM的开发款独特之处在于其能够重新构建屏幕内容。通过深入分析屏幕上的信息及其位置分布,系统能够生成精准的文本表示,这对于捕捉视觉布局中的关键信息至关重要。
研究人员进一步展示了将ReALM与专门针对内容指向优化的语言模型相结合的方法,结果显示在执行相关任务时,ReALM的性能已超越业界翘楚GPT-4。
研究人员兴奋地表示:我们对现有系统进行了深度优化和显著改进,使其在处理各种类型的内容指向任务时均表现出卓越性能。即便是我们的最小模型,也实现了超过5%的性能提升;而大型模型的表现更是显著超越GPT-4,令人瞩目。”
长期以来,苹果在创新领域更多扮演跟随者的角色,然而随着人工智能技术的迅猛发展,市场格局正发生深刻变革。如今,苹果正积极迎接挑战,努力在人工智能领域占据一席之地。
此外,备受瞩目的全球开发者大会即将在6月盛大召开。届时,苹果预计将推出一系列创新成果,包括全新大语言模型框架、Apple GPT”聊天机器人及其生态系统中的其他AI功能。
(责任编辑:热点)
- ·BiTA:创新AI方法加速大型语言模型生成
- ·女子感慨回乡发现大家消费升级 自己是最穷最土:网友吵翻层级跟在哪无关
- ·《黑神话:悟空》发布贺岁短片:网友深挖暗喻 压低玩家预期
- ·苹果新一代CarPlay不再霸道:放弃部分控制权 车厂适配更灵活
- ·超越微软、亚马逊:苹果连续17年蝉联“全球最受赞赏公司”榜首
- ·真国民神剧!《甄嬛传》12年后依然很火 春节档顶流:乐视每年赚1个亿轻松
- ·苹果发布 visionOS 1.0.3 软件功能更新,Vision Pro 头显新增密码恢复选项
- ·海外版S18 Pro!vivo V30 Pro外观泄露:引入蔡司三摄
- ·Windows系统时间改为10000年1月1日:全方位无死角崩溃
- ·LLM是世界模型的新证据?ChatGPT能理解WiFi等物理信号,并猜出你的位置