今日,阿里千问宣布推出新一代图像生成基础模型Qwen-Image-2.0,该模型在文字渲染和图像生成方面取得显著进步。Qwen-Image-2.0具备更专业的文字渲染能力,支持1ktoken指令,能够直接输出专业信息图,包括PPT、海报和漫画等。同时,模型支持2k分辨率,能够细腻刻画写实场景,涵盖人物、自然和建筑等元素。此外,Qwen-Image-2.0在语义理解和图像编辑方面也展现出更强的能力,实现了生图编辑二合一的功能,并且模型架构更为轻量,提高了处理速度。
阿里千问的Qwen-Image-2.0在AIArena进行的模型盲测中展现了优越性能,同一模型在文生图和图生图基准测试中均获得良好表现。模型的发展历程通过一页PPT展示,从生图支线和编辑支线的探索,到Qwen-Image-2.0的成功合并两条支线,并在两个任务上取得理想结果。Qwen-Image-2.0的渲染能力不仅准确,而且支持复杂的指令,能够处理包括专业PPT在内的多种图像生成任务。阿里云百炼已开通API邀测,同时开发者可以通过QwenChat免费体验新模型。


