ERNIE-Image开源SOTA !消费级显卡搞定顶级渲染、高密度文本绘图

百度文心

发布于:2026-04-15

摘要:NanoBanana平替开源,消费级显卡可运行!


*所有作品仅用于模型效果展示


更多示例详见:

https://ernieimageprompt.com


这组包含了海内外社区、知名设计师等在真实场景下的使用的展示图,全部由我们最新模型 ERNIE-Image 强力驱动产出。


ERNIE-Image 是由百度文心大模型团队开发的一款开源文生图模型。它基于单流 Diffusion Transformer(DiT)架构,并配有一个轻量级 Prompt Enhancer,用于将简短输入扩展为更丰富、更结构化的描述。在仅有 8B DiT 参数规模的前提下,达到了开源文生图模型中的领先水平。


整体来看,它在复杂指令跟随、文字渲染和结构化图像生成方面表现突出,适合海报、漫画、多面板布局等需要较强控制能力的内容生产场景。同时,模型也覆盖了从写实摄影、设计感图像到风格化表达在内的多种视觉风格。


经过电影网、凤凰网、蜻蜓FM、瑛麒动漫、蜂鸟AI等30多个知名企业、社区和创作平台,20位艺术创作设计师为期两周的内测与反馈,今天,我们正式开源ERNIE-Image模型,参数量仅8B,24GB显存的消费级显卡即可生成媲美顶级商业模型的超真实、复杂图像。


01.

重新定义消费级开源文生图边界



指令遵循、文字渲染能力ERNIE-Image从容驾驭复杂细节约束、多主体关系和知识密集型描述;更在中英日韩多语言生成中实现了字形清晰与笔画精准,无论是海报排版、学术图表的严谨逻辑,还是漫画分镜的叙事张力,皆能保持完美的布局组织与画面秩序,这两项能力在开源模型中均排名第一。


以小搏大,消费级可跑的架构设计仅8B 参数在多项 benchmark 上全面超越同类开源模型,媲美商用模型诸如 NanoBanana 系列。极致的参数效率优化,将高精度生成的门槛降至24GB VRAM的消费级GPU即可流畅运行,显著降低研究与部署门槛,打造每一位创作者触手可及的开源工具。


风格表现上,ERNIE-Image风格覆盖广,创意边界宽支持写实摄影与风格化视觉表达,包括动漫、二次元、电影感胶片、分镜截图、老照片等多元风格,尤其在角色一致性和情绪表达上表现突出。


当前,ERNIE-Image的模型权重、推理代码已在Hugging Face全部开源,遵循Apache2.0协议,已经支持并上线ComfyUI Workflow,同时联合Unsloth推出GGUF量化方案欢迎大家使用体验,尽情创作!


  • 技术Blog:
    https://ernie.baidu.com/blog/zh/posts/ernie-image/
  • 星河社区AI Studio:
    https://aistudio.baidu.com/ernieimage
    • Hugging Face:
      https://huggingface.co/baidu/ERNIE-Image
      https://huggingface.co/baidu/ERNIE-Image-Turbo
      • 工具链/版本支持:

        Comfy:

        https://huggingface.co/Comfy-Org/ERNIE-Image

        GGUF:

        https://huggingface.co/unsloth/ERNIE-Image-GGUF

        https://huggingface.co/unsloth/ERNIE-Image-Turbo-GGUF 



      02.

      国际基准通杀,开源全面SOTA



      我们在多个公开的国际基准上对 ERNIE-Image 进行了全面评估,包括用于通用图像生成的 GenEvalOneIG(中英文),以及用于复杂指令与文字渲染的 LongText-Bench


      评估结果表明,在所有开源模型中,ERNIE-Image 的综合表现处于领先位置,展现出其在通用图像生成、双语理解、复杂指令执行等各类任务中的强大能力。尤为突出的是,文字渲染能力上,ERNIE-Image 取得了开源模型的 SOTA 效果,与NanoBanana等商业闭源模型同处第一梯队


      左右滑动查看更多


      03.

      用文字创造画面Showtime




      04.

      ERNIE-Image的朋友圈



      在ERNIE-Image内测期间,我们邀请了来自设计、动漫、非遗等不同领域的知名专家,结合实际应用场景对ERNIE-Image展开了测评,获得了众多好评。



      05.

      文心创作周



      未来几周,ERNIE-Image将联合星河社区、吐司AI、Mulan AI、Popi.art创作平台持续推出「文心创作周」系列活动,更多创意玩法、更多脑洞大开的生图挑战等你来解锁!欢迎大家持续关注和参与。


      第一期主题为动漫回忆杀,输入你心中的动漫名场面或定制你的动漫角色形象,ERNIE-Image帮你画出来。不限画工,只拼创意!


      参与指南:

      👉创作方式:使用ERNIE-Image,让AI重绘那些年我们追过的热血番。

      • 新手用户(无需代码):使用以下平台,直接生成你喜欢的动漫角色图,或定制你自己的动漫角色形象。

        星河社区 AI Studio:

        https://aistudio.baidu.com/ernieimage

        Popi.art创作平台:

        https://popi.yuanzoo.cn/explore/index

      • 开发者(调用 API / 本地部署):

        通过 GitHub、Hugging Face、星河社区 AI Studio 调用 ERNIE-Image API或本地部署模型,生成动漫角色图或定制动漫角色形象。


      📖发布要求:提示词、生成的动漫图、图片背后的故事发布到小红书,带话题#ERNIE_Image、#文心大模型、#文心创作周,@百度文心,成为“文心超级创作者”。


      时间:第一期 4月15日-4月19日


      🎁奖励:

      (一)首批“文心超级创作者”(20位),奖励如下:

      • 礼品奖励:获得爱奇艺季卡、陶瓷咖啡杯等礼品。

      • 流量扶持:优秀作品将获得官方展示与推荐。


      (二)特等奖加码(1位):在20位“文心超级创作者”之中,特别增设 1个特等奖,奖励如下:

      • 现金奖励:1,000元创作基金(或等值京东卡)。

      • 专属曝光:百度文心官方全渠道推荐(公众号、小红书、社群)。

      • 联名文创:优秀作品获得文创联名机会,成为可以被收藏、使用的真实物品。

      • 后续权益:直通后续新模型版本内测资格与API 调用免费额度。


      *所有作品仅用于模型效果展示


      文心大模型生态伙伴也积极启动了模型测试与部署,截止目前,已有50余家模型托管与服务平台、创作平台与知名企业、社区工具链正式接入了ERNIE-Image。


      在此,衷心感谢所有参与内测以及一直以来支持文心大模型的生态伙伴与广大用户,你们的信任与鼓励,是我们持续前行的动力。



      欢迎进行体验、测试!


      • 技术Blog:

      https://ernie.baidu.com/blog/zh/posts/ernie-image/

      • 星河社区AI Studio:

      https://aistudio.baidu.com/ernieimage

      • Hugging Face Demo:

      https://huggingface.co/spaces/baidu/ERNIE-Image

      • Hugging Face:

      https://huggingface.co/baidu/ERNIE-Image

      https://huggingface.co/baidu/ERNIE-Image-Turbo

      • Github地址:

      https://github.com/baidu/ernie-image

      • 魔搭社区:

      https://modelscope.cn/models/PaddlePaddle/ERNIE-Image

      https://modelscope.cn/models/PaddlePaddle/ERNIE-Image-Turbo


      本文内容来源于公众号: 百度文心 ,请扫码查看原文。

      点此可查看原文