
新PikFlow
PikFlow是一个AI图像生成和编辑平台。利用先进的人工智能技术,PikFlow提供了文本到图像生成、老照片修复、背景移除和高分辨率放大,甚至将2D图像转换为3D模型等功能。不管你是电子商务产品摄影、数字艺术创作还是家庭照片修复,PikFlow都能帮助用户轻松实现创意目标。
Mini-Gemini是一个简单而有效的框架,用于增强多模态视觉语言模型(VLMs),由中国香港中文大学和 SmartMore 的研究人员共同推出。Mini-Gemini支持一系列密集和MoE大型语言模型(LLMs),从2B到34B。为了增强视觉token,该框架建议在不增加视觉token数量的情况下,利用额外的视觉编码器进行高分辨率细化...
虽然 Mini-Gemini 在处理复杂的视觉和文本任务时表现出高效性和精度,但研究人员也指出,它在视觉理解和推理能力方面仍有改进空间,未来的工作将探索更高级的方法。