会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 阿里推自主多模态AI代理MobileAgent 可模拟人类操作手机!

阿里推自主多模态AI代理MobileAgent 可模拟人类操作手机

时间:2024-07-02 03:24:16 来源:带水拖泥网 作者:资讯 阅读:779次

阿里推自主多模态AI代理MobileAgent 可模拟人类操作手机

CSS站长资源(ChinaZ.com)2月1日 消息:MobileAgent是阿里由阿里巴巴开发的一个自主多模态AI代理,可以模拟人类操作手机,推自是主多一个纯视觉解决方案,不需要任何系统代码,模态模拟完全通过分析图像来理解和操作手机。代理

项目地址:https://top.aibase.com/tool/mobile-agent

特点:

  • 依赖于纯视觉解决方案: MobileAgent通过分析图像来理解和操作手机,人类而无需任何系统代码。操作这增加了通用性和灵活性,手机使其能够在没有访问底层代码或数据权限的阿里情况下操作应用。

  • 独立于XML和系统元数据: 不依赖XML文件和系统元数据,推自提高了通用性和灵活性。主多

  • 多种视觉感知工具: 使用多种技术进行操作定位,模态模拟包括文本、代理图标、人类按钮等。操作

  • 即插即用: 无需训练,可直接在不同设备和应用上使用。

MobileAgent能够自动完成各种任务,比如在Alibaba上帮助用户找到帽子,并根据条件添加到购物车,在Amazon Music中搜索歌手Jay Chou或播放关于“代理”的音乐,在Chrome中搜索今日湖人队比赛结果或关于Taylor Swift的信息,在Gmail中发送空邮件或具有特定内容的邮件,在TikTok上为宠物猫视频点赞或评论等,还可以结合使用多个应用完成复杂任务。

MobileAgent的特点包括依赖于纯视觉解决方案,独立于XML和系统元数据,具备多种视觉感知工具进行操作定位,无需探索和训练,即插即用。

其工作原理包括视觉感知工具,自主任务规划和执行,自反思和提示格式。 MobileAgent使用了视觉感知模块、文本和图标定位,自主规划和自反思方法来实现对手机应用的操作。观察、思考和行动是MobileAgent采用的提示格式,要求代理输出三个组成部分。

(责任编辑:深度)

相关内容
  • 女子发愁春节红包:我1个娃对方3个 专家:发红包应与收入匹配
  • AI2发布开放语言模型OLMo 号称多项性能媲美Llama2
  • Coze扣子怎么使用 字节AI应用开发平台官网地址入口
  • 14岁女儿将爸爸出轨录音拷贝给妈妈 起诉情人返还25万余元
  • 腾讯:2023年查处触犯“腾讯高压线”案件70余起 解聘120余人
  • 2024央视网络春晚节目单官宣:2月2日播出
  • 微信新安装包突破700MB 微信体积再变大
  • Mastercard推出新AI模型“Decision Intelligence Pro”以提升网络内欺诈检测
推荐内容
  • 车厘子打败砂糖橘成年货顶流:价格持续下降 春节期间销量大增
  • 研究称数字水印与人工智能相结合将加速版权侵权案件
  • BiTA:创新AI方法加速大型语言模型生成
  • AI大模型哪家强?七大维度横评四款主流大模型!
  • 网友吐槽服务区充电桩比加油贵 官方:从未改价 已上报
  • 广州鼓励网约车去机场火车站接单 确保旅客出行顺畅