会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 智源开源检索排序模型 BGE Re-Ranker v2.0!

智源开源检索排序模型 BGE Re-Ranker v2.0

时间:2024-07-02 03:22:41 来源:带水拖泥网 作者:电商 阅读:154次

智源开源检索排序模型 BGE Re-Ranker v2.0

CSS站长资源(ChinaZ.com) 3月21日 消息:智源研究院推出了新一代检索排序模型 BGE Re-Ranker v2.0,智源支持100+ 种语言,开源文本长度更长,检索并在多项评测中达到了 SOTA(state-of-the-art)的排序结果。该模型是模型智源团队在 BGE(BAAI General Embedding)系列基础上的新尝试,扩展了向量模型的智源 “文本 + 图片” 混合检索能力。

BGE Re-Ranker v2.0采用分层自蒸馏策略优化推理效率,开源通过不同尺寸的检索模型基座(如 MiniCPM-2B、Gemma-2B、排序BGE-M3-0.5B)支持多语言检索能力。模型此外,智源该模型还新增了对 “文本 + 图片” 混合检索功能的开源支持,通过引入 CLIP 模型生成的检索 visual token 实现。

在性能评测方面,排序BGE Re-Ranker v2.0在英文、模型中文、多语言主流基准上取得了优秀的检索效果。例如,在 MTEB、C-MTEB、MIRACL、LLaMA-Index 等评测基准中,BGE Re-Ranker v2.0在重排 BGE-v1.5-large 的 top-100候选集时表现优异,提升了检索精度。同时,模型在 RAG 场景下也能够显著提升各种 embedding 模型的召回结果,配合 BGE-M3可以获得最佳的端到端检索质量。

BGE 系列模型的优秀性能和通用性也受到了社区的广泛关注,Vespa、Milvus 等主流向量数据库框架已经集成了 BGE-M3模型,为用户搭建 “三位一体” 的检索流水线提供了便利。

综上所述,智源研究院推出的 BGE Re-Ranker v2.0检索排序模型具有强大的多语言支持、更长文本长度、优秀的检索效果和灵活的 “文本 + 图片” 混合检索功能,为信息检索领域带来了新的利器。

项目地址:

https://github.com/FlagOpen/FlagEmbedding

https://huggingface.co/BAAI

(责任编辑:知识)

相关内容
  • 肺癌成为全球新增病例数最多癌症 世卫发布全球癌症概况
  • 博主实测理想5C超充站:可能是体验的第三方充电桩
  • 夫妻离婚要求分割2孩子26万压岁钱 法院:驳回 归孩子
  • 春节期间电话、短信数据出炉:全部下降 除夕短信却爆发
  • 美团比京东更需要董宇辉
  • 节后返工忙 顺丰同城助力职场焕新开局
  • 小米机皇!小米14 Ultra明天发:要涨价
  • 被判违章未系安全带 美术生画图申诉:成功撤销违章处罚
推荐内容
  • 「.ai」域名每月能为安圭拉带来约300万美元的收入
  • 消息称苹果OLED屏iPad Pro较当前版本更大 但也会更薄
  • 高通推出全球汽车Wi-Fi 7解决方案
  • 马斯克X平台与Midjourney正商谈合作 致力于生成式AI项目
  • 58岁大叔骑摩托载妻返乡:更舒适 更自由
  • 成都“牵手门”女主,“复活”在直播间