阿里推自主多模态AI代理MobileAgent 可模拟人类操作手机
CSS站长资源(ChinaZ.com)2月1日 消息:MobileAgent是阿里由阿里巴巴开发的一个自主多模态AI代理,可以模拟人类操作手机,推自是主多一个纯视觉解决方案,不需要任何系统代码,模态模拟完全通过分析图像来理解和操作手机。代理
项目地址:https://top.aibase.com/tool/mobile-agent
特点:
依赖于纯视觉解决方案: MobileAgent通过分析图像来理解和操作手机,人类而无需任何系统代码。操作这增加了通用性和灵活性,手机使其能够在没有访问底层代码或数据权限的阿里情况下操作应用。
独立于XML和系统元数据: 不依赖XML文件和系统元数据,推自提高了通用性和灵活性。主多
多种视觉感知工具: 使用多种技术进行操作定位,模态模拟包括文本、代理图标、人类按钮等。操作
即插即用: 无需训练,可直接在不同设备和应用上使用。
MobileAgent能够自动完成各种任务,比如在Alibaba上帮助用户找到帽子,并根据条件添加到购物车,在Amazon Music中搜索歌手Jay Chou或播放关于“代理”的音乐,在Chrome中搜索今日湖人队比赛结果或关于Taylor Swift的信息,在Gmail中发送空邮件或具有特定内容的邮件,在TikTok上为宠物猫视频点赞或评论等,还可以结合使用多个应用完成复杂任务。
MobileAgent的特点包括依赖于纯视觉解决方案,独立于XML和系统元数据,具备多种视觉感知工具进行操作定位,无需探索和训练,即插即用。
其工作原理包括视觉感知工具,自主任务规划和执行,自反思和提示格式。 MobileAgent使用了视觉感知模块、文本和图标定位,自主规划和自反思方法来实现对手机应用的操作。观察、思考和行动是MobileAgent采用的提示格式,要求代理输出三个组成部分。
(责任编辑:深度)
- ·史上开源大模型重磅登场!破纪录公开代码/权重/数据集/训练全过程,AMD都能训
- ·《原神》成最快赚钱手游 40个月破50亿美元
- ·广州鼓励网约车去机场火车站接单 确保旅客出行顺畅
- ·回怼欧盟app store侧载!苹果库克:背道而驰
- ·新郎在大雪中开启浪漫迎亲 网友:风雪中的浪漫
- ·1元=1700000tokens!清华系发布国产Mistral仅2B,老手机都带得动,GitHub一天斩获300+星
- ·河北一女子充话费 1000元误充给对方要不回:中国电信、律师回应
- ·微信新安装包突破700MB 微信体积再变大
- ·突然!雷军暂别小米手机 聚焦汽车业务:卢伟冰兼任 首讲小米14 Ultra
- ·决战拜年之巅免费在线体验入口 ChatMindAI聊天机器人过年游戏使用地址
- ·淄博一男子醉驾不被立案 交警释疑:符合不予立案新规
- ·《完蛋!我被美女包围了!》DLC倒计时海报:美女室友让人心跳
- ·iPhone销量不佳!苹果公布2024财年季度营收报告
- ·华为占新贡献代码88.75%:开源鸿蒙代码行数已超1亿行!
- ·女子躲暴雪提前回家被封服务区8小时:遭遇大雾 开了20多个小时
- ·14岁女儿将爸爸出轨录音拷贝给妈妈 起诉情人返还25万余元
- ·FaceChain-FACT怎么使用 零成本AI人像生成工具使用方法教程指南
- ·BiTA:创新AI方法加速大型语言模型生成
- ·大熊猫性感抖臀致直播间被封十分钟 人工智能「直播」AI应用有哪些?
- ·14岁女儿将爸爸出轨录音拷贝给妈妈 起诉情人返还25万余元