会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 T-Rex2:文字来描述、框选就能识别图片中的目标物体!

T-Rex2:文字来描述、框选就能识别图片中的目标物体

时间:2024-07-04 04:57:26 来源:带水拖泥网 作者:业界 阅读:822次

T-Rex2:文字来描述、框选就能识别图片中的目标物体

>

划重点:

⭐ T-Rex2是文字一种通用目标检测技术,通过视觉和文本提示协同作用,描述实现对各种对象的框选识别。没有开源,别图标物有API可以使用。片中

⭐ T-Rex2整合了图像编码器、文字视觉提示编码器、描述文本提示编码器和框解码器,框选实现了最先进的别图标物性能。

⭐ T-Rex2除了通过文字来描述要检测的片中物体,还支持直接在图里框出一个样例,文字系统自动识别出剩余的描述目标。

CSS站长资源(ChinaZ.com) 3月26日 消息:DeepDataSpace 推出了 T-Rex2,框选一种革新性的别图标物目标检测技术,旨在解决传统目标检测模型的片中封闭集问题。传统模型局限于事先确定的类别集,需要针对特定任务进行调整和大量训练数据。相比之下,T-Rex2不仅能够识别日常物体,还能识别更为奇特的物体,无需特定任务的调整或大量训练数据。该模型通过结合文本和视觉提示的优势,实现了对各种场景中的物体的理解和检测。

T-Rex2整合了图像编码器、视觉提示编码器、文本提示编码器和框解码器四个组件,遵循 DETR 的设计原则,实现了端到端的目标检测模型。

在四个学术基准测试中,包括 COCO、LVIS、ODinW 和 Roboflow100,T-Rex2在零样本设置下实现了最先进的性能。除了学术领域,T-Rex2还适用于各种实际应用场景,包括农业、工业、生物学、医学、零售、物流等领域。其灵活性和适应性使其成为研究人员、开发者和组织的宝贵工具,推动物体检测技术的发展。

作为一种通用目标检测技术,T-Rex2还可用于开放集视频目标检测和视频目标跟踪,,为视频处理领域带来了新的可能性。结合 ByteTrack 算法,T-Rex2可以准确跟踪视频中的任何对象。

未来,DeepDataSpace 将开放 T-Rex2的免费 API 访问,为教育工作者、学生和研究人员提供支持。通过 Demo 和 API,用户可以体验 T-Rex2的能力,并探索其在各领域的潜在应用。

产品入口:https://top.aibase.com/tool/t-rex2

试玩地址:https://deepdataspace.com/playground/ivp

(责任编辑:知识)

相关内容
  • 不怕投诉了!高铁有遛娃车厢了:餐车车厢部分区域临时改造
  • 谷歌 Pixel 手机迎来安卓15新更新!
  • 苹果iOS 18将于6月10日登场:Apple Music支持智能歌曲过渡功能
  • 击穿底价,通义千问GPT-4级大模型直降97%!1块钱能买200万tokens
  • 花掉2.5万元的快乐!全球位苹果Vision Pro用户现身:如英雄般享受欢呼
  • 多地提醒慎入网约车行业:运力饱和 远超实际需求
  • 5月21日某公司禁止员工喝咖啡:为庆祝“国际茶日”
  • 微信整治自媒体无底线博流量:处置违规内容21246条、账号459个
推荐内容
  • 员工吐槽领导节目走红 公司回应:为员工释放压力
  • 索尼绝版4K屏旗舰!Xperia 1 V部分版本缺货:电商用户评价1000多条
  • 余承东自曝华为、江淮合作百万级新车:远超越迈巴赫、劳斯莱斯
  • 抖音快手微信公布微短剧备案细则 获得备案号后方可播出
  • 坐实国产!苹果Vision Pro产地公布:原汁原味的中国制造
  • 电池电量反向造假!小米SU7充满73.6度电池费了87.86度电 网友点赞