T-Rex2:文字来描述、框选就能识别图片中的目标物体
>
划重点:
⭐ T-Rex2是文字一种通用目标检测技术,通过视觉和文本提示协同作用,描述实现对各种对象的框选识别。没有开源,别图标物有API可以使用。片中
⭐ T-Rex2整合了图像编码器、文字视觉提示编码器、描述文本提示编码器和框解码器,框选实现了最先进的别图标物性能。
⭐ T-Rex2除了通过文字来描述要检测的片中物体,还支持直接在图里框出一个样例,文字系统自动识别出剩余的描述目标。
CSS站长资源(ChinaZ.com) 3月26日 消息:DeepDataSpace 推出了 T-Rex2,框选一种革新性的别图标物目标检测技术,旨在解决传统目标检测模型的片中封闭集问题。传统模型局限于事先确定的类别集,需要针对特定任务进行调整和大量训练数据。相比之下,T-Rex2不仅能够识别日常物体,还能识别更为奇特的物体,无需特定任务的调整或大量训练数据。该模型通过结合文本和视觉提示的优势,实现了对各种场景中的物体的理解和检测。
T-Rex2整合了图像编码器、视觉提示编码器、文本提示编码器和框解码器四个组件,遵循 DETR 的设计原则,实现了端到端的目标检测模型。
在四个学术基准测试中,包括 COCO、LVIS、ODinW 和 Roboflow100,T-Rex2在零样本设置下实现了最先进的性能。除了学术领域,T-Rex2还适用于各种实际应用场景,包括农业、工业、生物学、医学、零售、物流等领域。其灵活性和适应性使其成为研究人员、开发者和组织的宝贵工具,推动物体检测技术的发展。
作为一种通用目标检测技术,T-Rex2还可用于开放集视频目标检测和视频目标跟踪,,为视频处理领域带来了新的可能性。结合 ByteTrack 算法,T-Rex2可以准确跟踪视频中的任何对象。
未来,DeepDataSpace 将开放 T-Rex2的免费 API 访问,为教育工作者、学生和研究人员提供支持。通过 Demo 和 API,用户可以体验 T-Rex2的能力,并探索其在各领域的潜在应用。
产品入口:https://top.aibase.com/tool/t-rex2
试玩地址:https://deepdataspace.com/playground/ivp
(责任编辑:知识)
- ·文心一言APP数字分身体验入口 百度AI情感交互数字化身应用免费在线使用地址
- ·Meta发布类GPT-4o多模态模型Chameleon
- ·上市一周锁单量超10000台!智己L6将于5月25日开启批量交付
- ·专家称十年后房子不可能卖白菜价:农村人口正不断向城市转移
- ·贾扬清的500行代码,掀翻了Perplexity5.2亿的桌子?
- ·微信输入法测试“单机模式”:词库存到本地 不联网更安全
- ·新加坡航空一波音777客机紧急迫降曼谷机场:致1死30伤
- ·线上独供!vivo X Fold3 Pro 12GB 256GB版官宣
- ·研究称数字水印与人工智能相结合将加速版权侵权案件
- ·20:00~20:15 人人可领1元起:天猫 618 无门槛红包限时加码