开源多模态模型Lumina-DiMOO:颠覆式扩散模型
2025-09-12
Lumina-DiMOO是一个开源的基础模型,实现了无缝的多模态生成和理解。它采用完全离散的扩散模型处理各种模态的输入和输出,与之前的统一模型相比,采样效率更高,支持文本到图像生成、图像到图像生成(例如图像编辑、主题驱动生成和图像修复)以及图像理解等多种任务。在多个基准测试中,Lumina-DiMOO取得了最先进的性能,超越了现有的开源统一多模态模型。为了促进多模态和离散扩散模型研究的进一步发展,该项目已开源代码和检查点。
AI