DiT (Diffusion Transformer) のアーキテクチャと潜在拡散推論パイプライン実装解析
DiTの基本概念と潜在拡散の枠組み
DiT(Diffusion Transformer)は、従来の拡散モデルにおいてU-Netバックボーンを純粋なTransformer構造へ置換したモデルアーキテクチャである。テキスト生成や動画生成で採用されている大規模トランスフォーマーと画像生成パイプラインの構造を統一することで、スケーラビリティと最適化効率を向上させることを目的としている。潜在拡散モ ...
5月15日 02:02 投稿