BrushNet BrushNet是腾讯PCG和香港中文大学联合共同提出一个基于扩散模型的文本引导图像修复模型。它采用了独特的双分支结构来处理被遮挡的图像特征和噪声潜变量,极大地减轻了模型的学习负担。此外,BrushNet能够在任何预训练的扩散模型上即插即用,提供了密集的像素级控制,使其非常适合图像修复任务。
AutoStudio AutoStudio 是由中山大学深圳校区和联想研究院开发的先进的多轮交互图像生成AI工具。通过结合大型语言模型和稳定扩散技术,AutoStudio 能够在用户多次交互中生成一致且高质量的图像序列。无论是漫画创作、角色设计还是广告营销,AutoStudio 都能保持图像风格和主题的一致性,极大地提升了创作效率和效果。
papago Papago 是由 Naver 开发的一款智能翻译应用,支持 13 种语言的文本、语音和图片翻译,包括英语、韩语、日语和中文。无论是旅行、学习还是工作,Papago 都能帮助你轻松跨越语言障碍。主要功能包括文本翻译、语音翻译、图片翻译、会话翻译和网页翻译。Papago 还提供离线翻译功能,让你在没有网络的情况下也能使用。
moonland.ai Moonland.ai是一个人工智能驱动的综合性创作平台,该平台通过先进的AI技术,它允许用户通过输入文字描述来创建艺术作品。这个平台集成了多种 AI 绘画引擎,使用户能够生成具有不同风格和创意的图片。
PicTech PicTech是一个AI图像处理工具,为跨境电商提供无缝的图片翻译和智能抠图服务。PicTranslator轻松将图片文本翻译成多种语言,清晰度高,效率快。BgRemover一键移除背景,简化设计流程。技术创新,助力全球市场拓展。
FlashVideo FlashVideo是一个由字节跳动和香港大学联合开发的高效高分辨率视频生成框架,特别适用于文本到视频的生成。通过创新的两阶段框架设计和流匹配技术,FlashVideo 能在短时间内生成 1080p 高清视频,优化视频流畅性,并减少计算成本。
songR SongR是一个免费的AI音乐生成器,尽管它还在测试阶段,但已经具备了一键生成音乐、人声、歌词和视频的功能。它覆盖了各种音乐类型,包括流行、嘻哈、轻松的咖啡厅风格和激情四溢的摇滚。用户可以选择输入自己的歌词,或者让AI根据用户的提示生成歌词。