Lumina-DiMOO:画期的なオープンソースマルチモーダル拡散モデル
2025-09-12
Lumina-DiMOOは、シームレスなマルチモーダル生成と理解のためのオープンソースの基礎モデルです。以前の統合モデルとは異なり、あらゆる入力と出力モダリティに完全に離散的な拡散モデリングアプローチを使用しており、自己回帰モデルやハイブリッドモデルと比較して、大幅に高いサンプリング効率を実現しています。テキストから画像への生成、画像から画像への生成(編集、主題駆動型生成、インペインティングなど)、画像理解などのタスクを巧みに処理し、複数のベンチマークで最先端の性能を達成しています。マルチモーダルと離散拡散モデリングの研究を進めるために、コードとチェックポイントが公開されています。
AI