一周AIGC要闻 | 清华大学文生视频专利公布;字节发布文生图开放模型

Chaos新观察
02-26

【字节发布文生图开放模型SDXL-Lightning】

字节发布文生图开放模型SDXL-Lightning。从AI开源社区Hugging Face的最新榜单上,SDXL-Lightning跻身模型趋势榜,同时也成为Hugging Face Spaces上的热门模型。据知情人士透露,字节跳动的SDXL-Lightning通过渐进式对抗蒸馏的技术,实现前所未有的生成速度。该模型能够在2步或4步内生成极高质量和分辨率的图像,将生成速度加快十倍,是1024分辨率下速度最快的文生图模型,计算成本则降低为十分之一。 (界面新闻)

【OPPO刘作虎:未来将在云端算力上持续投入,实现大模型的端云联合部署】

OPPO首席产品官刘作虎在AI战略发布会上表示,未来将在云端算力上持续投入,通过自建的OPPO AI滨海湾数据中心,部署Titan超大模型、Turbo大模型、Tiny轻量模型三个级别的模型对应不同应用场景,实现端云联合部署。会上,OPPO正式发布了1+N智能体生态战略,这一生态由AI超级智能体和AI Pro开发平台组成。其中, AI Pro智能体开发平台将在今年上线,用户可在该平台调用组合工具和插件,开发自己需要的智能体,并无需写代码。(科创板日报)

【AIGC自动生成商业视频,虹软科技宣布ArcMuse引擎升级】

虹软科技官方微信号宣布,其核心大模型技术引擎——虹软ArcMuse再次升级。此次升级将支持面向商拍的商业视频自动生成。据介绍,与OpenAI Sora类似,虹软ArcMuse大模型视频生成基于diffusion-transformer技术架构,具备丰富多样的创意力和想象力。通过图像,ArcMuse大模型能够捕捉到商品的细节特征、质感、色彩等方面的精确信息,生成更能展示商品真实面貌的动态商拍视频。

【追赶Sora难在哪?周鸿祎回应:算力问题】

Sora火爆的当下,国内大模型企业如何追赶Sora,难点在哪儿?360集团创始人周鸿祎对此认为,Sora的技术路线如果被开源,国内将能很快赶上,但在追赶Sora时,算力有可能成为门槛,对此,集中国内所有AI企业的算力或许是方法之一。Sora视频分析对算力的消耗应该是远远超过千亿模型的。所以,当现在国内显卡都被卡脖子之后,算力就可能会是一个问题。“目前,Meta已经有50万块GPU,明年可能会买百万块,微软应该也会按照百万级别去下订单。而国内的所有人工智能公司加在一起可能有50万块GPU,但都分散在各个公司里。” (新京报)

【清华大学文生视频专利公布】

国家知识产权局网站显示,近日,清华大学申请的“一种定制化多主体文生视频方法、装置、设备及介质”专利公布,发明人为王鑫;朱文武;陈虹。摘要显示,该申请涉及神经网络技术领域,通过多种损失对文生视频模型的参数进行优化,使优化的模型基于文本描述生成视频中的图像时,文本描述与定制化主体保持一致,且在每个主体在生成过程中的特征不会发生混淆的同时消除合成痕迹。 (中新网)

【谷歌发布开源AI大模型Gemma,称其性能在同等规模中最为先进】

当地时间周三(2月21日),科技巨头谷歌发布了新一代开源模型“Gemma”,公司称其是轻量级中“最先进的”开放模型系列,超越了原本最强的Mistral 7B。目前,Gemma系列有两种权重规模的模型,分别为“Gemma 2B”和“Gemma 7B”,即20亿参数和70亿参数,以满足开发人员的不同需求。谷歌在新闻稿中写道,Gemma 2B和7B与其他开放模型相比,展现出在同等参数规模中最先进的性能,甚至超过了一些更大的模型,这得益于与公司最强的AI模型Gemini共享技术和基础架构。

【中小学人工智能教育基地名单公布,共184个】

近日,教育部公布了中小学人工智能教育基地名单。各省级教育行政部门根据推荐要求,认真组织在人工智能课程教学、师资配备、实验环境建设等方面具有较好基础的中小学校积极申报,经各省级教育行政部门严格审核推荐、教育部集中公示,最终确定了184个中小学人工智能教育基地。

Sora爆火!哪些投资机会值得关注?
OpenAl 公司在2月16日展示了文生视频应用Sora,引发了极大轰动。多模态AI题材持续发酵,So­ra、Ch­a­t­G­PT、AI­GC能够利好哪些板块?
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法