2025年12月18日,苹果研究团队推出多模态AI模型UniGen 1.5,集成图像理解、生成与编辑功能。该模型采用统一架构,首创“编辑指令对齐”后训练技术,通过预测目标图像文本描述来提升编辑准确性,并设计了适用于生成与编辑任务的统一奖励系统,增强模型稳定性。在GenEval、DPG-Bench和ImgEdit等基准测试中表现优异,部分指标媲美闭源模型。目前模型在图像文字生成和主体特征保持方面仍有...
网页链接2025年12月18日,苹果研究团队推出多模态AI模型UniGen 1.5,集成图像理解、生成与编辑功能。该模型采用统一架构,首创“编辑指令对齐”后训练技术,通过预测目标图像文本描述来提升编辑准确性,并设计了适用于生成与编辑任务的统一奖励系统,增强模型稳定性。在GenEval、DPG-Bench和ImgEdit等基准测试中表现优异,部分指标媲美闭源模型。目前模型在图像文字生成和主体特征保持方面仍有...
网页链接
精彩评论