Google发布Gemini Embedding 2:五模态统一向量嵌入模型

DoNews03-13 15:53

3月10日,Google发布Gemini Embedding 2嵌入模型,原生支持文本、图片、视频、音频和PDF五种模态输入,并将其映射至同一向量空间。该模型基于Gemini基础架构,所有模态共享Transformer网络,在中间层即实现跨模态语义交互,区别于CLIP等依赖后期对齐的方案。模型默认输出3,072维向量,采用Matryoshka Representation Learning(MRL...

网页链接
免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法