在线图像编辑一直面临身份一致性难题,不同风格、多任务的编辑容易导致人物特征混乱,影响视觉体验。
Nano-consistent-150k 是基于 Nano-Banana 构建的首个超15万高质量合成数据集,专门设计来保持复杂编辑场景下的人物身份一致性。
核心亮点:
- 单个人像配备35+种不同编辑输出,覆盖多任务和多指令;
- 通过一致的人物身份锚点,实现多任务、多模态编辑的无缝衔接;
- 支持多样化复杂场景下的高保真图像生成和编辑;
- 附带全套训练代码和评测基准,方便研究者复现和拓展。
适合视觉生成、图像编辑、合成数据研究和多任务模型训练,推动高质量图像合成和跨任务一致性研究迈上新台阶。
GitHub 地址:
github.com/yejy53/Nano-banana-150k