【一键部署 Qwen-Image:首个图像生成基础模型,文字渲染与图像编辑能力获得SOTA】 阿里通义千问团队再开源!今天凌晨,通义千问团队开源了首个图像生成基础模型 Qwen-Image,一个 20B 的 MMDiT 模型。 从中英文双语渲染到长段落生成,从海报设计到 PPT 页面排版,Qwen-Image 均能生成高质量视觉效果。凭借精准的文本渲染能力与稳定的图像编辑性能,Qwen-Image 在多个主流 Benchmark 中达到 SOTA 水平。值得一提的是,Qwen-Image 在中文渲染上的强大性能为开源视觉模型的中文能力建设提供了有益补充,中文从被「翻译」的附加项,正在逐渐转向 AI 视觉认知的「母语」之一。 目前,「Qwen-Image:具有高级文本渲染能力的图像模型」已上线至 HyperAI 官网的「教程」板块,一键克隆即可快速体验 demo。快来体验多元视觉风格! 在线教程:
【一键部署Qwen-Image:首个图像生成基础模型,文字渲染与图像编辑能力获
科技有点神经
2025-08-05 18:42:13
0
阅读:1