好家伙,千问春节前扔出图片大模型王炸,不仅能吃下 1k token 指令,还能渲染中文书法。也就是说,从今天开始,文生图大模型不再是玩具,而是生产力工具!
那么问题来了,Qwen-Image-2.0 到底强在哪呢?
今天小雷就带大家伙见识一下 Qwen-Image-2.0 的威力。
生活个人形象照太土,发给客户看,客户觉得不够高大上?
别慌也别急!立马给你手搓一张新的。
下面我们所看到的都是由千问生成的“高大上”形象照。它可以根据我们要求的不同风格、不同着装,生成一组又一组的照片。

不光能手搓形象照,我们还可以这样玩儿。
输入提示词:让图中的女孩穿上风衣坐在露营椅上,OOTD 拼图轻松拿捏。
生成的图片分辨率高达2k,非常有质感,我觉得可以直接拿来用了。
在生成后,我还可以持续编辑我的指令,直到得到理想的图片为止。

体验了一波后,我愿称之为中文版 Nano Banana!
不信咱继续看看实测!
小雷让千问生成一张苏东坡《念奴娇·赤壁怀古》的意境图,展示词作的雄浑苍凉,大气磅礴,图中还要有这首词的关键文字。
提示词:画一张中国风的国画。宏大的广角镜头,诗人苏轼(苏东坡)身着宋代文士袍服,独自伫立于赤壁悬崖之上,凝望脚下滚滚东流的长江。远处云雾中,隐约浮现三国豪杰(如周瑜)的幻影。 画面中需要楷书展示《念奴娇·赤壁怀古》100 个字的全词内容如下: “大江东去,浪淘尽,千古风流人物。故垒西边,人道是,三国周郎赤壁。乱石穿空,惊涛拍岸,卷起千堆雪。江山如画,一时多少豪杰。 遥想公瑾当年,小乔初嫁了,雄姿英发。羽扇纶巾,谈笑间,樯橹灰飞烟灭。故国神游,多情应笑我,早生华发。人生如梦,一尊还酹江月。”
不只是文字没错,而且字体苍劲有力、人物形象传神,细节要求都有落实。

但你知道吗?在过去大模型生成图片都很难渲染汉字。
我试了下即梦的 seedream,字体看上去挺好看,但文字却是错的,存在“画汉字”的老毛病。

看到这,可能有人会问,之前的图片生成王者 Nano Banana Pro 呢?
别急,小雷当然也试过啦,来看看效果。
整体还可以,但存在错字、多字的情况。

但千问这波却能准确渲染上百个汉字,且处理长文本指令是 Qwen-Image-2.0 最大的突破,它能一口气吃下 1000token,业界最长,没有之一。
除了处理长文本指令精准以外,“美”也是 Qwen-Image-2.0 文字渲染的一大特色,不信你看。

不过普通用户可能不会输入这么长的指令,但我们可以给它一大段的指令,提出非常具体、详细的要求,让它生成图片、PPT、海报。
比如针对 xAI 近期的人物动荡新闻,我让它生成一张新闻海报,还真能用。


再比如针对数码圈常见的“果粉梗”,我让它画了一组漫画。

图源:千问
如果你不想输入长指令,哪怕你只输入一句话,千问提示词增强功能都会调用大模型,合理扩展提示词(多达1000字),进而给到更好的生成效果。

这不是马上临近春节了吗,有朋友要来广州和我一起玩儿,我让千问生成一个介绍广州的创意3D图片。要求是建筑大小比例正确,金桔、福字、醒狮、元宝、灯笼等细节逼真。
没想到,千问背后的Qwen-Image-2.0对复杂指令的理解太强了,而且还通过联网搜索自己去推理出广州相关的画面元素,广州塔、东西塔,该有的地标它全都有。

我们再来看看微观视角下,千问的表现如何。
输入提示词:微观视角,一只好奇的小蚂蚁探险家,正站在一片巨大的红树呼吸根(如秋茄树的支柱根)森林前。根系如参天古木般巍峨耸立,表面布满沧桑的纹理与湿润的苔藓。阳光从上方巨大的红树林树冠缝隙中穿透,形成几道神圣的丁达尔光柱,照亮空气中漂浮的微尘。蚂蚁前方,一滴露珠如同巨大的水晶球挂在草叶上,映出颠倒的微型世界。远处是朦胧的深圳湾海面与城市天际线。风格为迪士尼或皮克斯动画电影的高帧率场景,细节极度丰富,光影迷人,色彩清新明亮,充满童话般的探险氛围,2K分辨率。
微观生成的效果更惊艳,这张图除了小蚂蚁的细节,露珠、树根、光影、苔藓等细节都很逼真,远处的深圳地标建筑也呈现得很到位。

有了“准”、“多”、“美”的表现,那 Qwen-Image-2.0 不得来个“真”体验。
输入提示词:《西游记》电视剧官方复古海报。画面中央是师徒四人沿着一条蜿蜒的取经路前行:孙悟空手持金箍棒探路,唐僧骑马,猪八戒扛着钉耙,沙僧挑着行李。背景融合了花果山、大雷音寺和火焰山等标志性场景。天空有祥云和佛光。顶部是“西游记”大字。整体氛围奇幻、经典、充满回忆。
瞧瞧,除了生物以外,人物形象的生成也不再话下,这是千问为我生成的《西游记》的海报。
还能改为迪士尼、梵高印象派、二次元、乐高、连环画这样的风格,展现出强大的编辑能力。

图源:千问
要小雷说,千问这一波更新绝对称得上是超级王炸。去年一骑绝尘的 Google Gemini Banana 成为现象级产品,如今中国终于有了一个能打的文生图大模型了。
而且值得一提的是,在权威第三方评测 AI Arena 中,Qwen-Image-2.0 文生图得分 1029,排名第三!图像编辑得分 1034 分,全球第二,仅次于 Nano Banana Pro。强烈建议大家去体验其强大的多场景创作能力,一定会发现超多惊喜~
话说,2026 年大模型的神仙斗法才刚刚开始。不知道在座各位平时有没有用过千问呢?感觉如何?欢迎评论区一起唠唠~

雷科技





































