新V-Express V-Express是由南京大学和腾讯AI实验室共同开发的一项技术,旨在通过参考图像、音频和一系列V-Kps图像来生成说话的头像视频。这项技术可以根据不同的信号,如声音、姿势、图像参考等来控制视频内容,确保即使是弱信号也能有效地影响最终生成的视频,使视频生成更加逼真和多样化。
新DUIX DUIX是硅基智能打造的AI数字人智能交互平台。通过将数字人交互能力开源,开发者可自行接入多方大模型、语音识别(ASR)、语音合成(TTS)能力,实现数字人实时交互,并在Android和iOS多终端一键部署,让每个开发者可轻松创建智能化、个性化的数字人Agent,并应用到各行各业。
新FlowVoice FlowVoice 是一款专为 Apple Silicon Macs 设计的智能语音转录工具。通过语音输入,用户可以比键盘输入快 3 倍,将口语快速转换为结构化、简洁的文本。FlowVoice 提供智能听写和命令模式,帮助用户高效处理大量文本,适合作家、学生和商务人士。
新LlamaIndex LlamaIndex 是一个非凡的工具,创建为一个全面的“数据框架”,以促进 LLM(大型语言模型)应用程序的开发。该框架与 ChatGPT 集成,充当大型语言模型和用户私人数据之间的桥梁。
新Comic Translate Comic Translate 是一款开源基于 Python 开发的高效漫画翻译工具,结合了 OpenCV 和 PIL 图像处理库,能够精准识别并提取漫画中的文字。通过集成 Google Translate API 或自定义翻译服务,Comic Translate 实现了自动化翻译流程。主要功能包括 OCR(光学字符识别)、自动翻译、图像...
新反谱AI 反谱是一款领先的AI音乐转谱工具,它将音乐轻松转换成乐谱,为音乐爱好者、作曲家和音乐教师提供了极大的便利。通过高效快捷的人工智能技术,反谱AI能够将各种格式的音乐(如mp3、flac、ogg等)转换成可识别的音乐符号(如MIDI格式或五线谱或简谱文件),支持在线MIDI编辑创作和下载导出。