PhotoDoodle

5天前发布 535 0 0

PhotoDoodle 是由字节跳动与来自中国和新加坡大学的研究团队基于 Flux.1 模型联合开发的一款智能图像编辑系统,专注于通过少量样本学习特定艺术风格,并将其应用于用户照片,帮助用户轻松创建具有艺术感的作品。

收录时间:
2025-07-06
PhotoDoodlePhotoDoodle

PhotoDoodle是什么?

PhotoDoodle是一款由新加坡国立大学、字节跳动等团队联合推出的开源艺术图像编辑工具,可以将一张普通的照片变成具有艺术风格的图片。它支持通过自然语言指令对图片进行局部修改以及添加一些装饰性元素(手绘笔触线、3D 立体效果、卡通样式等),同时保持原图背景和细节不变。

PhotoDoodle 采用两阶段训练策略:先通过大规模数据预训练通用图像编辑器(OmniEditor),再结合少量艺术家样本进行微调(EditLoRA),快速学习并复刻个性化艺术风格。用户只需要提供30–50 张图像样本就能训练拥有自己的独特风格模型,主要用于数字艺术品创作、文案制作、品牌制作等领域。。

主要功能特点

1. 文字驱动的图像编辑:输入文字指令即可实现局部修改和风格化,如“给猫咪加个光环加翅膀”;

2. 艺术风格学习与复刻:30-50 对图像样本可以轻松学习并复刻一个艺术家的风格;

3. 装饰性元素生成:自动在图片上添加卡通角色、3D 水平色块、流色彩块和手绘画线等装饰,并且与原图完美融合。

4. 背景一致性保持:使用位置编码克隆和无噪声条件范式使编辑后的图片仍然保留原有的布局和细节,在编辑后保持背景内容不变。

5. 两阶段训练架构

  • OmniEditor:通用图像编辑器,基于大规模数据预训练
  • EditLoRA:少样本微调模块,快速适配个性化风格

6. 开源与可扩展性:提供了完整的训练和推理代码,可以在 Hugging Face 和 ComfyUI 上使用,也方便开发者二次部署。

适用场景

  • 艺术创作:快速为照片添加个性化艺术风格
  • 社交分享:生成有趣装饰图像,提升内容吸引力
  • 品牌设计:定制符合品牌调性的视觉素材
  • 教学辅助:复刻艺术风格,辅助艺术教育
  • 互动娱乐:通过文字指令实时生成创意图像 

技术支持与资源

  • 开源支持:团队ithub 和 HuggingFace 开源了代码和数据集,使用者可以免费使用预训练模型或者自训艺术风格模型。
  • 预训练模型:内置多种风格,包括手绘轮廓、3D 效果和流动色块等。

PhotoDoodle GitHub:https://github.com/showlab/PhotoDoodle

PhotoDoodle HuggingFace: https://huggingface.co/datasets/nicolaus-huang/PhotoDoodle

数据统计

相关导航

暂无评论

none
暂无评论...