
新Spark-TTS
Spark-TTS是SparkAudio团队开源的基于大型语言模型(LLM)的高效文本转语音(TTS)工具,无需额外的生成模型,直接从LLM预测的编码中重建音频,实现零样本文本到语音的转换。Spark-TTS支持中英双语,具备跨语言合成能力,可通过参数调整(如性别、音调、语速)生成虚拟说话者的声音,满足多样化需求。
Visual Try-On 是一款基于快手 Kolors 图像模型开发的一键AI虚拟试衣Chrome 浏览器插件。通过先进的 AI 技术,用户只需上传一张照片,插件会自动将选定的衣服“穿”在用户身上,展示逼真的试穿效果。支持在各种电商平台上使用,无需离开购物网站即可完成试穿。通过虚拟试穿,用户可以更直观地了解衣服的穿着效果,减少退货率,提升购物满意度。
项目地址入口:
Visual Try-On:一键AI试衣的Chrome浏览器插件