千问Qwen-Image-2.0实测:中文渲染惊艳,堪称媒体人的Banana?

好家伙,千问春节前扔出图片大模型王炸,不仅能吃下 1k token 指令,还能渲染中文书法。也就是说,从今天开始,文生图大模型不再是玩具,而是生产力工具!

那么问题来了,Qwen-Image-2.0 到底强在哪呢?

今天小雷就带大家伙见识一下 Qwen-Image-2.0 的威力。

生活个人形象照太土,发给客户看,客户觉得不够高大上?

别慌也别急!立马给你手搓一张新的。

下面我们所看到的都是由千问生成的“高大上”形象照。它可以根据我们要求的不同风格、不同着装,生成一组又一组的照片。

不光能手搓形象照,我们还可以这样玩儿。

输入提示词:让图中的女孩穿上风衣坐在露营椅上,OOTD 拼图轻松拿捏。

生成的图片分辨率高达2k,非常有质感,我觉得可以直接拿来用了。

在生成后,我还可以持续编辑我的指令,直到得到理想的图片为止。

体验了一波后,我愿称之为中文版 Nano Banana!

不信咱继续看看实测!

小雷让千问生成一张苏东坡《念奴娇·赤壁怀古》的意境图,展示词作的雄浑苍凉,大气磅礴,图中还要有这首词的关键文字。

提示词:画一张中国风的国画。宏大的广角镜头,诗人苏轼(苏东坡)身着宋代文士袍服,独自伫立于赤壁悬崖之上,凝望脚下滚滚东流的长江。远处云雾中,隐约浮现三国豪杰(如周瑜)的幻影。 画面中需要楷书展示《念奴娇·赤壁怀古》100 个字的全词内容如下: “大江东去,浪淘尽,千古风流人物。故垒西边,人道是,三国周郎赤壁。乱石穿空,惊涛拍岸,卷起千堆雪。江山如画,一时多少豪杰。 遥想公瑾当年,小乔初嫁了,雄姿英发。羽扇纶巾,谈笑间,樯橹灰飞烟灭。故国神游,多情应笑我,早生华发。人生如梦,一尊还酹江月。”

不只是文字没错,而且字体苍劲有力、人物形象传神,细节要求都有落实。

但你知道吗?在过去大模型生成图片都很难渲染汉字。

我试了下即梦的 seedream,字体看上去挺好看,但文字却是错的,存在“画汉字”的老毛病。

看到这,可能有人会问,之前的图片生成王者 Nano Banana Pro 呢?

别急,小雷当然也试过啦,来看看效果。

整体还可以,但存在错字、多字的情况。

但千问这波却能准确渲染上百个汉字,且处理长文本指令是 Qwen-Image-2.0 最大的突破,它能一口气吃下 1000token,业界最长,没有之一。

除了处理长文本指令精准以外,“美”也是 Qwen-Image-2.0 文字渲染的一大特色,不信你看。

不过普通用户可能不会输入这么长的指令,但我们可以给它一大段的指令,提出非常具体、详细的要求,让它生成图片、PPT、海报。

比如针对 xAI 近期的人物动荡新闻,我让它生成一张新闻海报,还真能用。

再比如针对数码圈常见的“果粉梗”,我让它画了一组漫画。

图源:千问

如果你不想输入长指令,哪怕你只输入一句话,千问提示词增强功能都会调用大模型,合理扩展提示词(多达1000字),进而给到更好的生成效果。

这不是马上临近春节了吗,有朋友要来广州和我一起玩儿,我让千问生成一个介绍广州的创意3D图片。要求是建筑大小比例正确,金桔、福字、醒狮、元宝、灯笼等细节逼真。

没想到,千问背后的Qwen-Image-2.0对复杂指令的理解太强了,而且还通过联网搜索自己去推理出广州相关的画面元素,广州塔、东西塔,该有的地标它全都有。

我们再来看看微观视角下,千问的表现如何。

输入提示词:微观视角,一只好奇的小蚂蚁探险家,正站在一片巨大的红树呼吸根(如秋茄树的支柱根)森林前。根系如参天古木般巍峨耸立,表面布满沧桑的纹理与湿润的苔藓。阳光从上方巨大的红树林树冠缝隙中穿透,形成几道神圣的丁达尔光柱,照亮空气中漂浮的微尘。蚂蚁前方,一滴露珠如同巨大的水晶球挂在草叶上,映出颠倒的微型世界。远处是朦胧的深圳湾海面与城市天际线。风格为迪士尼或皮克斯动画电影的高帧率场景,细节极度丰富,光影迷人,色彩清新明亮,充满童话般的探险氛围,2K分辨率。 

微观生成的效果更惊艳,这张图除了小蚂蚁的细节,露珠、树根、光影、苔藓等细节都很逼真,远处的深圳地标建筑也呈现得很到位。

有了“准”、“多”、“美”的表现,那 Qwen-Image-2.0 不得来个“真”体验。

输入提示词:《西游记》电视剧官方复古海报。画面中央是师徒四人沿着一条蜿蜒的取经路前行:孙悟空手持金箍棒探路,唐僧骑马,猪八戒扛着钉耙,沙僧挑着行李。背景融合了花果山、大雷音寺和火焰山等标志性场景。天空有祥云和佛光。顶部是“西游记”大字。整体氛围奇幻、经典、充满回忆。

瞧瞧,除了生物以外,人物形象的生成也不再话下,这是千问为我生成的《西游记》的海报。

还能改为迪士尼、梵高印象派、二次元、乐高、连环画这样的风格,展现出强大的编辑能力。

图源:千问

要小雷说,千问这一波更新绝对称得上是超级王炸。去年一骑绝尘的 Google Gemini Banana 成为现象级产品,如今中国终于有了一个能打的文生图大模型了。

而且值得一提的是,在权威第三方评测 AI Arena 中,Qwen-Image-2.0 文生图得分 1029,排名第三!图像编辑得分 1034 分,全球第二,仅次于 Nano Banana Pro。强烈建议大家去体验其强大的多场景创作能力,一定会发现超多惊喜~

话说,2026 年大模型的神仙斗法才刚刚开始。不知道在座各位平时有没有用过千问呢?感觉如何?欢迎评论区一起唠唠~

$阿里巴巴(BABA)$

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论

  • 推荐
  • 最新
empty
暂无评论