Snowflake 开源 Arctic embed,号称全球最实用的检索文本嵌入 AI 模型

2024-04-17 发布 · 浏览102次 · 点赞0次 · 收藏0次

4 月 17 日消息,Snowflake 公司近日发布新闻稿,宣布在 Apache 2.0 许可下,推出开源 Arctic embed 系列模型。

根据 MTEB(衡量文本嵌入模型的评估指标合集)的检索(Retrieval)排行榜,Arctic embed 系列最大模型参数只有 3.34 亿个,是唯一一个平均检索性能超过 55.9 的模型。

感兴趣的用户目前可以访问 Hugging Face 使用 Arctic embed 系列模型,后续也可以访问 Snowflake 的 Cortex 嵌入功能(目前处于私人预览阶段)中使用。

Arctic embed 系列模型的主要亮点

  • 同类最佳检索:由五个 Arctic 嵌入模型组成的套件可在各种规模的数据中提供最先进的检索结果,在 MTEB 检索基准上的表现优于其他开源模型。

  • 性能和效率:Snowflake 的大型 (l) 型号比封闭源型号的参数高出 4 倍,以更小的占地面积提供更卓越的性能。

  • 长文档支持:中型(m)模式包括一个长文本版本,可无缝处理扩展文档(最多 8192 个标记)。

  • 为企业优化:与同类产品相比,Arctic 嵌入式机型具有更低的延迟和更低的总拥有成本(TCO)。

附上参考地址

Snowflake 开源 Arctic embed,号称全球最实用的检索文本嵌入 AI 模型 - AI 资讯 - 资讯 - AI 中文社区

声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论

游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。