Qwen-Image,这是一个 20B MMDiT 图像基础模型,在复杂文本渲染和精准图像编辑方面取得了显著进展。实验表明,该模型在图像生成和编辑方面均具有强大的通用能力,并且在文本渲染方面表现出色,尤其对中文文本渲染尤为出色。
其突出功能之一是跨多种图像的高保真文本渲染。无论是英语等字母语言,还是中文等表意文字,Qwen-Image 都能以惊人的精准度保留排版细节、布局连贯性和语境和谐性。文本不仅仅是叠加,更是无缝融入视觉结构。
除了文本之外,Qwen-Image 还擅长通用图像生成,支持多种艺术风格。从照片级写实场景到印象派绘画,从动漫美学到极简主义设计,该模型能够流畅地适应各种创意需求,使其成为艺术家、设计师和故事讲述者的多功能工具。
在图像编辑方面,Qwen-Image 远不止简单的调整。它支持各种高级操作,例如风格转换、对象插入或移除、细节增强、图像内文本编辑,甚至人体姿势操控——所有这些都具有直观的输入和连贯的输出。这种控制水平使日常用户也能轻松享受专业级的编辑体验。
但 Qwen-Image 不仅仅是创造或编辑,它还能理解。它支持一系列图像理解任务,包括目标检测、语义分割、深度和边缘(Canny)估计、新颖的视图合成以及超分辨率。这些功能虽然在技术上有所不同,但都可以看作是由深度视觉理解驱动的智能图像编辑的特殊形式。
总之,这些功能使 Qwen-Image 不仅仅是一个生成漂亮图片的工具,而且是一个智能视觉创作和处理的综合基础模型——语言、布局和图像在此融合。
部署方法:
1、安装最新版 ComfyUI 客户端 【点击下载】
2、Qwen-Image 现已在 ComfyUI 中获得原生支持 【点击获取】ComfyUI 中的可用模型:
- Qwen-Image_bf16(40.9 GB)
- Qwen-Image_fp8(20.4 GB)
3、获取工作流 【点击下载】
当然如果你的GPU不达标,无法运行Qwen-Image 开源图像生成模型,那么可以实用免部署方法,通过在线平台进行使用,但是在线人多的时候,速度会较慢,没有自己部署那么自由和无拘无束!
免部署方法:
1、Hugging Face 在线体验 【点击前往】
2、Qwen Chat 【点击前往】,打开后点击图像生成。