千问Qwen-Image-2.0实测：中文渲染惊艳，堪称媒体人的Banana？_老虎社区_美港股上老虎

千问Qwen-Image-2.0实测：中文渲染惊艳，堪称媒体人的Banana？

好家伙，千问春节前扔出图片大模型王炸，不仅能吃下 1k token 指令，还能渲染中文书法。也就是说，从今天开始，文生图大模型不再是玩具，而是生产力工具！

那么问题来了，Qwen-Image-2.0 到底强在哪呢？

今天小雷就带大家伙见识一下 Qwen-Image-2.0 的威力。

生活个人形象照太土，发给客户看，客户觉得不够高大上？

别慌也别急！立马给你手搓一张新的。

下面我们所看到的都是由千问生成的“高大上”形象照。它可以根据我们要求的不同风格、不同着装，生成一组又一组的照片。

不光能手搓形象照，我们还可以这样玩儿。

输入提示词：让图中的女孩穿上风衣坐在露营椅上，OOTD 拼图轻松拿捏。

生成的图片分辨率高达2k，非常有质感，我觉得可以直接拿来用了。

在生成后，我还可以持续编辑我的指令，直到得到理想的图片为止。

体验了一波后，我愿称之为中文版 Nano Banana！

不信咱继续看看实测！

小雷让千问生成一张苏东坡《念奴娇·赤壁怀古》的意境图，展示词作的雄浑苍凉，大气磅礴，图中还要有这首词的关键文字。

提示词：画一张中国风的国画。宏大的广角镜头，诗人苏轼（苏东坡）身着宋代文士袍服，独自伫立于赤壁悬崖之上，凝望脚下滚滚东流的长江。远处云雾中，隐约浮现三国豪杰（如周瑜）的幻影。画面中需要楷书展示《念奴娇·赤壁怀古》100 个字的全词内容如下： “大江东去，浪淘尽，千古风流人物。故垒西边，人道是，三国周郎赤壁。乱石穿空，惊涛拍岸，卷起千堆雪。江山如画，一时多少豪杰。遥想公瑾当年，小乔初嫁了，雄姿英发。羽扇纶巾，谈笑间，樯橹灰飞烟灭。故国神游，多情应笑我，早生华发。人生如梦，一尊还酹江月。”

不只是文字没错，而且字体苍劲有力、人物形象传神，细节要求都有落实。

但你知道吗？在过去大模型生成图片都很难渲染汉字。

我试了下即梦的 seedream，字体看上去挺好看，但文字却是错的，存在“画汉字”的老毛病。

看到这，可能有人会问，之前的图片生成王者 Nano Banana Pro 呢？

别急，小雷当然也试过啦，来看看效果。

整体还可以，但存在错字、多字的情况。

但千问这波却能准确渲染上百个汉字，且处理长文本指令是 Qwen-Image-2.0 最大的突破，它能一口气吃下 1000token，业界最长，没有之一。

除了处理长文本指令精准以外，“美”也是 Qwen-Image-2.0 文字渲染的一大特色，不信你看。

不过普通用户可能不会输入这么长的指令，但我们可以给它一大段的指令，提出非常具体、详细的要求，让它生成图片、PPT、海报。

比如针对 xAI 近期的人物动荡新闻，我让它生成一张新闻海报，还真能用。

再比如针对数码圈常见的“果粉梗”，我让它画了一组漫画。

图源：千问

如果你不想输入长指令，哪怕你只输入一句话，千问提示词增强功能都会调用大模型，合理扩展提示词（多达1000字），进而给到更好的生成效果。

这不是马上临近春节了吗，有朋友要来广州和我一起玩儿，我让千问生成一个介绍广州的创意3D图片。要求是建筑大小比例正确，金桔、福字、醒狮、元宝、灯笼等细节逼真。

没想到，千问背后的Qwen-Image-2.0对复杂指令的理解太强了，而且还通过联网搜索自己去推理出广州相关的画面元素，广州塔、东西塔，该有的地标它全都有。

我们再来看看微观视角下，千问的表现如何。

输入提示词：微观视角，一只好奇的小蚂蚁探险家，正站在一片巨大的红树呼吸根（如秋茄树的支柱根）森林前。根系如参天古木般巍峨耸立，表面布满沧桑的纹理与湿润的苔藓。阳光从上方巨大的红树林树冠缝隙中穿透，形成几道神圣的丁达尔光柱，照亮空气中漂浮的微尘。蚂蚁前方，一滴露珠如同巨大的水晶球挂在草叶上，映出颠倒的微型世界。远处是朦胧的深圳湾海面与城市天际线。风格为迪士尼或皮克斯动画电影的高帧率场景，细节极度丰富，光影迷人，色彩清新明亮，充满童话般的探险氛围，2K分辨率。

微观生成的效果更惊艳，这张图除了小蚂蚁的细节，露珠、树根、光影、苔藓等细节都很逼真，远处的深圳地标建筑也呈现得很到位。