商汤发布NEO-unify技术博客,探索原生多模态统一架构

36氪03-06

36氪获悉,商汤科技联合南洋理工大学发布NEO-unify预览版——一种摒弃传统视觉编码器与变分自编码器、直接从像素与文本中学习的端到端原生架构。其在图像重建任务中接近Flux VAE性能,图像编辑基准达3.32分。研究显示,该架构理解与生成协同提升,数据训练效率优于现有方案。

网页链接
免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法