DiT (Diffusion Transformer) のアーキテクチャと潜在拡散推論パイプライン実装解析

DiTの基本概念と潜在拡散の枠組み DiT(Diffusion Transformer)は、従来の拡散モデルにおいてU-Netバックボーンを純粋なTransformer構造へ置換したモデルアーキテクチャである。テキスト生成や動画生成で採用されている大規模トランスフォーマーと画像生成パイプラインの構造を統一することで、スケーラビリティと最適化効率を向上させることを目的としている。潜在拡散モ ...

5月15日 02:02 投稿